Вторая команда исследователей из Национального института геномных исследований США во главе с Френсисом Коллинзом, подсчитав число генов у человека независимым способом и на основе своих данных, получила сходный результат – около 32000 генов содержится в геноме каждой клетки человека.
Разнобой в окончательные оценки пока вносят два других коллектива ученых. Доктор Вильям Хезелтайн (руководитель фирмы «Хьюмэн Геном Сайенс») продолжает настаивать, что в их банке содержится приватизированная информация на 120 тыс. генов. Этой информацией он не собирается пока делиться с мировой общественностью. Фирма вложила деньги в патенты и собирается заработать на полученной информации, поскольку она относится к генам широко распространенных болезней человека. Фирма «Инсайт» сообщила о том, что имеет в настоящее время каталог, состоящий из 140 тысяч идентифицированных ей генов человека, и также настаивает на этом количестве общего числа генов у человека.
Очевидно, что наспех приватизированная генетическая информация будет еще тщательно анализироваться и проверяться в ближайшие годы, пока точное число генов станет окончательно «канонизировано». Дело в том, что устройство генов весьма многообразно и до конца еще не поняты все возможные варианты. Вот мы прочитали последовательность нуклеотидов ДНК. Определено, что она способна кодировать белок. Но один ли? Выше уже говорилось о том, как транскрипция и последующие модификации РНК, а затем трансляция и модификации полипептидов, способны обеспечить огромное многообразие белков, кодируемых одним участком ДНК. И понять это исходя только из нуклеотидной последовательности ДНК очень часто просто невозможно. Тем не менее структура генома представляет собой единственную базу для осмысления данных, получаемых такими новыми направлениями, рожденными геномикой, как транскриптомика (исследует совокупность РНК–транскриптов организма), протеомика (исследует совокупность белков организма), метаболомика (исследует обмен веществ – метаболизм – в организме). Эти направления призваны дополнить лежащий в основе структурной геномики метод геномного секвенирования, дать возможность выйти за пределы его разрешающей способности.
Выше уже также говорилось об альтернативном сплайсинге. Сейчас хорошо известно, что за счет этого процесса с одних и тех же генов могут считываться разные белки, которые затем взаимодействуют друг с другом, образуя неповторимую смесь, как из основных цветов в живописи – желтого, красного и голубого можно получить мириады оттенков. Такой сплайсинг характерен не менее чем для половины генов человека. Считается, что в среднем с одного гена человека за счет альтернативного сплайсинга может образовываться три разных пептида. Но некоторые гены имеют до 10 альтернативно сплайсируемых экзонов, что позволяет теоретически получать более 1000 различных вариантов белков всего лишь на одном гене. В реальности число разных белков, кодируемых одним геном, достигает 10. Кроме того, существуют еще и альтернативные промоторы, альтернативные кодоны инициации трансляции, редактирование РНК (превращение Ц в У или А в аналог Г – инозин). Все вышесказанное пока еще невозможно учесть при оценке общего числа генов у человека.
Но и это не все. Кроме генов, кодирующих белки, имеются еще гены, конечным продуктом которых являются РНК. Вспомним об упоминавшихся выше генах–риборегуляторах – они не кодируют белки, но производят функционирующую в клетках РНК. Так что скорее всего окончательная оценка числа генов у человека будет сделана еще нескоро.
На сегодняшний день ученым известны функции всего лишь около восьми–десяти тысяч из них. А детальные сведения о механизмах их регуляции еще более скудны. Тем не менее, приведенные выше данные о строении и функционировании генов человека свидетельствуют о том, что у человека, царствующего в природе, в отличие от других существующих на нашей планете организмов, очень высока сложность протеома – полного набора функциональных белков в клетке, которая обеспечивается не просто за счет крупного размера генома или большого числа генов, а благодаря всевозможным инновациям, связанным с функционированием генов и формированием белков: большее число доменов–модулей, более высокая комбинаторика (перемешивание) этих модулей в белках, активное использование альтернативного сплайсинга и многое другое, о чем мы поговорим дальше.
ОСНОВНАЯ ЧАСТЬ ГЕНОМА – ТЕРРА ИНКОГНИТА
Теперь стало возможным оценить, что РНК синтезируется лишь максимум на 25—28% нуклеотидных последовательностей генома человека. А на кодирование белков используется вообще всего лишь чуть более 1% генома. Остальные транскрибируемые участки ДНК – это интроны белок–кодирующих генов и гены для РНК, не кодирующих белки. Таким образом, большая часть генома (свыше 70%) не имеет, по–видимому, прямого отношения ни к каким генам и инертна в плане транскрипции. Как это ни странно на первый взгляд, но факт остается фактом. Большая часть генома не кодирует ни белки, ни какую–нибудь РНК вообще, т. е. не относится к генам или каким–то другим, функционирующим на уровне транскрипции (РНК), нук–леотидным последовательностям.
В ДНК, на которой не образуется никакая РНК и которая, таким образом, для кодирования информации совершенно нейтральна, записаны длинные тексты, которые сегодня представляются для ученых полной абракадаброй, смысл и происхождение которой совершенно не ясен. Зачем нужны клетке эти «бессмысленные» и никак, на первый взгляд, не работающие участки ДНК, пока никто не знает, хотя априори ясно, что ничего лишнего в природе не должно быть. При полном секвенировании генома человека, естественно, была определена последовательность не только генов, но и этих пока ничего не обозначающих для ученых участков. Но из чего–то они все–таки состоят. Когда провели их детальный анализ, то выяснилось, что здесь присутствует скопище всех мыслимых и немыслимых вариантов расположения букв, бессмысленных слов и предложений, различных повторов одного и того же «текста», палиндромов и так далее и так далее. Рассмотрим подробнее хотя бы основные из них.
ДНКовый текст человека перенасыщен повторами
Перевертыши (обращенные повторы)
Простые тандемные повторы (сателлиты)
Разнобой в окончательные оценки пока вносят два других коллектива ученых. Доктор Вильям Хезелтайн (руководитель фирмы «Хьюмэн Геном Сайенс») продолжает настаивать, что в их банке содержится приватизированная информация на 120 тыс. генов. Этой информацией он не собирается пока делиться с мировой общественностью. Фирма вложила деньги в патенты и собирается заработать на полученной информации, поскольку она относится к генам широко распространенных болезней человека. Фирма «Инсайт» сообщила о том, что имеет в настоящее время каталог, состоящий из 140 тысяч идентифицированных ей генов человека, и также настаивает на этом количестве общего числа генов у человека.
Очевидно, что наспех приватизированная генетическая информация будет еще тщательно анализироваться и проверяться в ближайшие годы, пока точное число генов станет окончательно «канонизировано». Дело в том, что устройство генов весьма многообразно и до конца еще не поняты все возможные варианты. Вот мы прочитали последовательность нуклеотидов ДНК. Определено, что она способна кодировать белок. Но один ли? Выше уже говорилось о том, как транскрипция и последующие модификации РНК, а затем трансляция и модификации полипептидов, способны обеспечить огромное многообразие белков, кодируемых одним участком ДНК. И понять это исходя только из нуклеотидной последовательности ДНК очень часто просто невозможно. Тем не менее структура генома представляет собой единственную базу для осмысления данных, получаемых такими новыми направлениями, рожденными геномикой, как транскриптомика (исследует совокупность РНК–транскриптов организма), протеомика (исследует совокупность белков организма), метаболомика (исследует обмен веществ – метаболизм – в организме). Эти направления призваны дополнить лежащий в основе структурной геномики метод геномного секвенирования, дать возможность выйти за пределы его разрешающей способности.
Выше уже также говорилось об альтернативном сплайсинге. Сейчас хорошо известно, что за счет этого процесса с одних и тех же генов могут считываться разные белки, которые затем взаимодействуют друг с другом, образуя неповторимую смесь, как из основных цветов в живописи – желтого, красного и голубого можно получить мириады оттенков. Такой сплайсинг характерен не менее чем для половины генов человека. Считается, что в среднем с одного гена человека за счет альтернативного сплайсинга может образовываться три разных пептида. Но некоторые гены имеют до 10 альтернативно сплайсируемых экзонов, что позволяет теоретически получать более 1000 различных вариантов белков всего лишь на одном гене. В реальности число разных белков, кодируемых одним геном, достигает 10. Кроме того, существуют еще и альтернативные промоторы, альтернативные кодоны инициации трансляции, редактирование РНК (превращение Ц в У или А в аналог Г – инозин). Все вышесказанное пока еще невозможно учесть при оценке общего числа генов у человека.
Но и это не все. Кроме генов, кодирующих белки, имеются еще гены, конечным продуктом которых являются РНК. Вспомним об упоминавшихся выше генах–риборегуляторах – они не кодируют белки, но производят функционирующую в клетках РНК. Так что скорее всего окончательная оценка числа генов у человека будет сделана еще нескоро.
На сегодняшний день ученым известны функции всего лишь около восьми–десяти тысяч из них. А детальные сведения о механизмах их регуляции еще более скудны. Тем не менее, приведенные выше данные о строении и функционировании генов человека свидетельствуют о том, что у человека, царствующего в природе, в отличие от других существующих на нашей планете организмов, очень высока сложность протеома – полного набора функциональных белков в клетке, которая обеспечивается не просто за счет крупного размера генома или большого числа генов, а благодаря всевозможным инновациям, связанным с функционированием генов и формированием белков: большее число доменов–модулей, более высокая комбинаторика (перемешивание) этих модулей в белках, активное использование альтернативного сплайсинга и многое другое, о чем мы поговорим дальше.
ОСНОВНАЯ ЧАСТЬ ГЕНОМА – ТЕРРА ИНКОГНИТА
Прогресс в биологии – это переход
от ложного знания к истинному незнанию.
В. Я. Александров
В природе нет ничего бесполезного.
М. Монтень
Теперь стало возможным оценить, что РНК синтезируется лишь максимум на 25—28% нуклеотидных последовательностей генома человека. А на кодирование белков используется вообще всего лишь чуть более 1% генома. Остальные транскрибируемые участки ДНК – это интроны белок–кодирующих генов и гены для РНК, не кодирующих белки. Таким образом, большая часть генома (свыше 70%) не имеет, по–видимому, прямого отношения ни к каким генам и инертна в плане транскрипции. Как это ни странно на первый взгляд, но факт остается фактом. Большая часть генома не кодирует ни белки, ни какую–нибудь РНК вообще, т. е. не относится к генам или каким–то другим, функционирующим на уровне транскрипции (РНК), нук–леотидным последовательностям.
В ДНК, на которой не образуется никакая РНК и которая, таким образом, для кодирования информации совершенно нейтральна, записаны длинные тексты, которые сегодня представляются для ученых полной абракадаброй, смысл и происхождение которой совершенно не ясен. Зачем нужны клетке эти «бессмысленные» и никак, на первый взгляд, не работающие участки ДНК, пока никто не знает, хотя априори ясно, что ничего лишнего в природе не должно быть. При полном секвенировании генома человека, естественно, была определена последовательность не только генов, но и этих пока ничего не обозначающих для ученых участков. Но из чего–то они все–таки состоят. Когда провели их детальный анализ, то выяснилось, что здесь присутствует скопище всех мыслимых и немыслимых вариантов расположения букв, бессмысленных слов и предложений, различных повторов одного и того же «текста», палиндромов и так далее и так далее. Рассмотрим подробнее хотя бы основные из них.
ДНКовый текст человека перенасыщен повторами
Как уже было показано в ранних экспериментах, описанных выше, в ДНК человека содержатся многочисленные элементы, которые не кодируют никакие белки, но при этом многократно встречаются в ДНКовом тексте. В «догеномную» эру считалось, что такие повторы составляют около 25% генома человека. Секвенирование ДНК показало, что их существенно больше: повторяющиеся последовательности в сумме занимают около 50% ДНКового текста. А общее число таких повторов в геноме человека равно приблизительно 5 миллионам. Для сравнения: у дрозофилы доля повторов в геноме составляет менее 5%, у червя – 6—7%, а у других млекопитающих – чуть меньше, чем у человека. Повторы напоминают бессмысленные фразы, которые с упорным постоянством в разных вариациях повторяются в тексте, но от этого смысл в них все равно не возникает.
На рис. 25 приведены некоторые основные варианты расположения повторов в геноме человека, а далее мы подробнее остановимся на описании отдельных из них.
На рис. 25 приведены некоторые основные варианты расположения повторов в геноме человека, а далее мы подробнее остановимся на описании отдельных из них.
Перевертыши (обращенные повторы)
В ДНКовых текстах человека, как, впрочем, и в ДНК других организмов, присутствуют уже упоминавшиеся обращенные повторы, перевертыши или, как их еще часто называют, палиндромы. Уже говорилось о том, что перевертыши–палиндромы хорошо известны из литературы – это предложения, которые читаются одинаково слева направо и справа налево без учета знаков препинания и интервалов между словами. Считается, что палиндромы известны еще со времен Древней Греции, т. е. свыше двух тысяч лет. На Руси палиндромы когда–то назывались «рачьими стихами». В качестве примера приведем две державинские строки:
Рис. 25. Основные варианты расположения повторяющихся последовательностей в геноме человека. Повторы обозначены стрелками, неповторяющиеся участки – серыми линиями
Особое свойство таких участков ДНК заключается в том, что при определенных состояниях ДНК они способны образовывать структуры, называемые крестами. На рис. 26 дан пример одного из таких возможных крестов.
В реальной ситуации в клетке такие структуры действительно могут формироваться. Но зачем это нужно? Окончательного ответа на этот вопрос нет. Одно из предположений сводится к тому, что кресты могут быть местами связывания с какими–то специфическими белками, обеспечивающими регуляцию или процессов транскрипции, или репликации ДНК. С другой стороны, при транскрипции таких структур в РНК должны формироваться «шпильки», а такие структуры в РНК часто являются значимыми (то есть выполняют определенные функции – или способствуют транскрипции, или, наоборот, препятствуют ей).
Рис. 26. Крест, способный образовываться последовательностью ДНК, состоящей из обращенных повторов
Я разуму уму заря,
Я иду с мечем судия.
Рис. 25. Основные варианты расположения повторяющихся последовательностей в геноме человека. Повторы обозначены стрелками, неповторяющиеся участки – серыми линиями
Особое свойство таких участков ДНК заключается в том, что при определенных состояниях ДНК они способны образовывать структуры, называемые крестами. На рис. 26 дан пример одного из таких возможных крестов.
В реальной ситуации в клетке такие структуры действительно могут формироваться. Но зачем это нужно? Окончательного ответа на этот вопрос нет. Одно из предположений сводится к тому, что кресты могут быть местами связывания с какими–то специфическими белками, обеспечивающими регуляцию или процессов транскрипции, или репликации ДНК. С другой стороны, при транскрипции таких структур в РНК должны формироваться «шпильки», а такие структуры в РНК часто являются значимыми (то есть выполняют определенные функции – или способствуют транскрипции, или, наоборот, препятствуют ей).
Рис. 26. Крест, способный образовываться последовательностью ДНК, состоящей из обращенных повторов
Простые тандемные повторы (сателлиты)
Как и у других организмов, в геноме человека присутствуют короткие повторяющиеся нуклеотидные последовательности, которые расположены вплотную друг за другом (тандемно). Их часто называют сателлитными ДНК. Мы уже говорили о сателлитных ДНК ранее. Это те участки ДНК, которые при центрифугировании в градиенте солей цезия осаждаются отдельно вне области основной массы ДНК. В разных типах сателлитной ДНК различные копии представлены неодинаково – их численность варьируется от сотен до миллионов. Если записать их структуру текстом, то это выглядит, как, например, предложение из одного и того же слова: столстолстолстол–столстолстолстолстол. Ясно, что такие предложения не могут кодировать никакую серьезную информацию. Тем не менее выяснилось, что с сателлитными нуклеотидными последовательностями в некоторых случаях могут специфически взаимодействовать отдельные белки. А это уже некоторое довольно серьезное указание на возможное участие таких повторов в каких–то клеточных процессах.
К настоящему времени в геноме человека обнаружено по крайней мере шесть видов сателлитных повторов. Это в первую очередь три типа так называемых классических сателлитов. Сателлит 1 состоит из элементарной повторяющейся последовательности нукле–отидов длиной 42 п. н. (располагается на семи разных хромосомах); сателлиты 2 и 3 состоят из элементарных повторяющихся единиц длиной 5 п. н. (первый из них обнаружен на четырех, а второй – на двенадцати разных хромосомах).
Кроме того, во всех хромосомах человека присутствуют альфа–сателлитные повторы. Они имеют элементарную повторяющуюся нуклеотидную последовательность длиной 171 п. н. Существуют еще бета–сателлитные повторы с элементарной повторяющейся единицей длиной 68 п. н., которые встречаются лишь на девяти хромосомах. Еще реже представлены в геноме человека гамма–сателлитные повторы, имеющие элементарную повторяющуюся единицу длиной 220 п. н. Такие повторы присутствуют только на двух хромосомах человека(8 и X).
К настоящему времени в геноме человека обнаружено по крайней мере шесть видов сателлитных повторов. Это в первую очередь три типа так называемых классических сателлитов. Сателлит 1 состоит из элементарной повторяющейся последовательности нукле–отидов длиной 42 п. н. (располагается на семи разных хромосомах); сателлиты 2 и 3 состоят из элементарных повторяющихся единиц длиной 5 п. н. (первый из них обнаружен на четырех, а второй – на двенадцати разных хромосомах).
Кроме того, во всех хромосомах человека присутствуют альфа–сателлитные повторы. Они имеют элементарную повторяющуюся нуклеотидную последовательность длиной 171 п. н. Существуют еще бета–сателлитные повторы с элементарной повторяющейся единицей длиной 68 п. н., которые встречаются лишь на девяти хромосомах. Еще реже представлены в геноме человека гамма–сателлитные повторы, имеющие элементарную повторяющуюся единицу длиной 220 п. н. Такие повторы присутствуют только на двух хромосомах человека(8 и X).
Конец бесплатного ознакомительного фрагмента