Game is over: Завершена расшифровка человеческого генома
Когда в 2000 году расшифровка генома человека впервые была признана "завершенной", эта новость была встречена с большим международным энтузиазмом.
Но на самом деле расшифровка генома человека не была закончена. Как признали специалисты, эта версия была скорее черновиком, изобилующим длинными участками, где последовательность ДНК была нечеткой или отсутствовала. Тогда одни из участников проекта генома человека завершили свою работу по этой теме, хотя ученые из консорциума, поддержанного государством, продолжали работать. В 2003 году, с меньшим блеском, но с большим количеством заголовков, геном человека снова был объявлен завершенным.
И все равно пока это было не так. Даже в пересмотренном проекте не хватало около 8 процентов генома. Это были самые трудные для секвенирования регионы, полные повторяющихся букв, которые было просто невозможно прочитать с помощью тогдашней технологии.
Наконец, в мае этого года группа ученых, названная Telomere-to-Telomere (T2T), без лишнего шума опубликовала в Интернете препринт с описанием того, что можно считать первым действительно полным геномом человека - чтением всех 3055 млрд букв 23 хромосом человека. На этот раз не было пышного объявления в Белом доме, а сама работа все еще находится на рассмотрении для официальной публикации в журнале.
Чтобы завершить расшифровку генома человека, эти ученые должны были выяснить, как составить карту его самых загадочных и игнорируемых повторяющихся областей, которые, возможно, теперь наконец-то получат свое научное признание.
Один из тех загадочных, трудно поддающихся секвенированию регионов, на которых остановились предыдущие проекты по геному человека - это центромеры, которые представляют собой слегка прижатую середину каждой хромосомы. Хромосомы, которых у человека 23 пары, состоят из длинного непрерывного участка ДНК, который может быть сжат в форме стержня и ДНК на центромере особенно плотная.
На пяти хромосомах человека центромеры находится не посередине, а очень близко к одному из концов, разделяя хромосому на один длинный и один очень короткий рукав. Эти короткие отделы также полны повторов, которые до сих пор не были полностью секвенированы. Центромеры, короткие плечи и другие типы повторяющихся регионов составили большую часть из 238 миллионов букв, которые консорциум в итоге добавил или исправил в геноме человека.
Богатые повторами сегменты человеческого генома обычно не содержат генов, что является одной из причин, по которой ими долгое время пренебрегали. Генетики в основном сосредоточились на генах, потому что их функция очевидна и проста - ген кодирует белок. Правда, были намеки на то, что эти богатые повторами регионы также играют важную роль в том, как гены экспрессируются и передаются, а аномалии в них связаны с раком и старением. Консорциум также обнаружил 79 новых генов, скрытых среди повторов. Имея в руках карту этих повторяющихся областей, ученые смогут более тщательно исследовать их функции.
Роль центромерных последовательностей, как и многих других повторяющихся областей, еще не до конца понятна, но наиболее классически они известны как ключ к делению клетки. Богатые повторами короткие ветви хромосом также загадочны. Они определенно играют какую-то роль в клеточном механизме, преобразующем гены в белки, и знание их последовательности может пролить свет на эту функцию.
Каким бы впечатляющим ни был технический подвиг секвенирования полного генома человека, ученые говорят, что один геном - это только один снимок. Гораздо интереснее будет посмотреть, как эти повторяющиеся регионы меняются со временем от человека к человеку, от вида к виду.
Опять же, некоторые ученые говорят, что новая расшифровка генома все равно не является "полной", поскольку он состоит только из одного набора из 23 хромосом, тогда как нормальные человеческие клетки имеют 23 пары. Чтобы упростить задачу, группа использовала клетки из определенного типа опухоли, которая развивается из аномальной оплодотворенной яйцеклетки и в итоге имеет только 23 хромосомы. Группе придется использовать другие клетки с 23 парами хромосом, чтобы завершить так называемый "диплоидный" геном.