Планеты и жизнь (Мухин Л.М.)

И данные Колли натолкнули академика Н. Кольцова на идею о матричном синтезе белков. Однако Кольцов представлял себе поток информации в виде схемы белок - белок. Он думал, что "каждая белковая молекула возникает из белковой молекулы путем кристаллизации вокруг нее находящихся в растворе аминокислот и других белковых обломков".

Весь процесс построения белка, как мы сейчас знаем, происходит не так и гораздо сложнее, но идея матричного синтеза, впервые высказанная Кольцовым в двадцатых годах нашего века, оказала неоценимое влияние на все последующее развитие молекулярной биологии.

Если отвлечься на время от химических аспектов взаимодействия аминокислот с РНК, то проблему генетического кода можно рассматривать просто как проблему перевода текста с одного алфавита на другой.

Молекулу белка можно представить себе как фразу с определенным смыслом. Ну, например, "Яумеюпомогатьорганизмувперевариваниипищи". Не очень длинная фраза, не очень сложный белок - всего 40 аминокислотных остатков. Каждая буква в этой фразе - аминокислота. Но только в отличие от русского алфавита в аминокислотном языке всего двадцать букв. Стоит переставить местами несколько букв во фразе, и она потеряет смысл.

Стоит переставить аминокислоты, и молекула белка тоже "потеряет смысл" - не сможет выполнять свою функцию: помогать в переваривании пищи.

Молекула ДНК тоже текст. Но текст, в алфавите которого используется лишь четыре буквы. В мире живого белковый текст кодируется нуклеиновым. А что такое кодирование?

Если заданная последовательность нуклеотидов в нуклеиновой кислоте полностью определяет последовательность аминокислот в белке, то мы говорим, что нуклеиновый текст кодирует текст белка.

Как же составляются слова из четырех букв нуклеинового текста? Совершенно ясно, что кодировать одну букву - аминокислоту должны какие-то комбинации из четырех букв - нуклеотидов. Это очевидно, так как четыре нуклеиновых основания, взятые каждое в отдельности, могут определить положение только четырех аминокислот в белковой молекуле. Ну а если брать пары оснований? Нетрудно видеть, что тогда можно кодировать 42, или 16 аминокислот. А если брать тройки, или, как говорят еще, триплеты? Тогда 43, или 64, поскольку число комбинаций из четырех букв по три равно 43.

Каждая аминокислота кодируется триплетом оснований, поскольку дуплет способен закодировать только 42 = 16 аминокислот, а триплет создает некоторую избыточность (43 = 64).

Триплет оснований, кодирующий одну аминокислоту, называется кодовым словом, или кодоном. Поскольку триплетов 64, а организм использует для построения белков всего двадцать аминокислот, то среди триплетов есть и бессмысленные кодоны, то есть кодоны, которые не кодируют никакой аминокислоты.

— 72 —