Сколько генов имеет человек. Расшифровка генома человека

Сколько генов у человека?

  1. 30 000.
    Как раз проект "Геном человека" и позволили выяснить, сколько генов.
  2. Сколько признаков, чтолько и генов.
    Ген - элементарная единица наследственности, представленная биополимером - отрезком молекулы ДНК. Один ген отвечает за один признак.
  3. СКОЛЬКО ГЕНОВ

    В ЧЕЛОВЕЧЕСКОМ ОРГАНИЗМЕ

    В ядре каждой соматической клетки человека содержится 23 пары хромосом. На каждую из них приходится по одной молекуле ДНК. Длина всех 46 молекул в одной клетке тела человека равна почти 2 м, а если учесть, что тело взрослого человека составлено примерно из 5 " 1013 клеток, то общая длина молекул ДНК в организме достигнет 1 " 1014 м, или 1 " 1011 км, что в тысячи раз превышает расстояние от Земли до Солнца.

    Но вернемся к одной клетке. Во всех молекулах ДНК одиночной клетки человека содержится 3,2 млрд пар нуклеотидов. Каждый нуклеотид состоит из пятиуглеродного сахара, фосфатной группы и азотистого основания. Сахара и фосфаты одинаковы во всех нуклеотидах, а смысл нуклеотидам придают основания, которых в ДНК четыре типа. Таким образом, язык генетических записей четырехбуквенный, и если одно основание представляет собой одну букву наследственной записи, то отдельными словами можно назвать генетическую информацию о порядке аминокислот в кодируемых генами белках. Кроме кодировки состава белков в геноме записаны, конечно, другие разнообразные сведения. Можно сказать, что Природа (либо в результате эволюции, либо в согласии с Божьим промыслом) закодировала в ДНК инструкции о том, как клеткам выживать, как реагировать на внешние воздействия, как должно происходить развитие тела, как стареет организм, предотвращает поломки различных частей клеток и множество других сведений. Любая поломка генных инструкций ведет к мутациям, и если они случаются в генеративных клетках - сперматозоидах или яйцеклетках, то мутации передаются следующим поколениям. Это может поставить в рискованное положение само существование данного вида.

    За словами о 3 млрд пар оснований зримо не видно, что же это такое. Гигантский объем информации, содержащейся в геноме человека, лучше всего иллюстрирует следующий пример: если напечатать мельчайшим шрифтом телефонные книги, то чтобы внести в них все знаки из ДНК одной-единственной клетки, понадобится отпечатать тысячу тысячестраничных телефонных книг!

    Сколько же всего генов, то есть последовательностей, кодирующих белки, имеется в составе человеческой ДНК? Года три назад называли цифру 100 тыс. , затем 80 тыс. В конце 1998 года специалисты по биоинформатике начали склоняться к мысли, что на самом деле нужны более осторожные оценки и что в геноме человека может оказаться 50-60 тыс. генов. Важно подчеркнуть, что на их долю приходится только 3% общей длины ДНК человека. Функциональная роль остальных 97% остается пока непонятной.

    ЧТО ТАКОЕ ПРОЕКТ "ГЕНОМ ЧЕЛОВЕКА"

    Цель проекта заключается в выяснении последовательности оснований во всех молекулах ДНК в клетках человека. Одновременно должна быть установлена локализация всех генов, что помогло бы выяснить причины наследственных заболеваний и этим открыть пути к их лечению. В выполнении проекта задействовано несколько тысяч ученых, специализирующихся в биологии, химии, математике, физике и технике. Это один из самых дорогостоящих научных проектов в истории цивилизации. В 1990 году на изучение геномов было потрачено 60 млн долларов, в 1991 году - 135 млн, в 1992-1995 годах ежегодно выделялось от 165 до 187 млн долларов, а в 1996-1998 годах только США расходовали 200, 225 и 253 млн долларов ежегодно.

    Об интересе к полученным в ходе реализации проекта результатам говорит такой факт: на сегодняшний день самыми цитируемыми авторами во всех областях науки стали Марк Адамс и Крэйг Вентер. Первый - ведущий сотрудник Института геномных исследований в штате Мэриленд (США) , частной исследовательской компании, занимающейся исключительно работами в области картирования генома человека, а второй - директор этого института.

    ОСНОВНЫЕ ЦЕЛИ ПРОЕКТА

    "ГЕНОМ ЧЕЛОВЕКА"

    Чтобы последовательно приближаться к решению проблемы картирования генов человека, было сформулировано пять основных целей: 1) завершить составление детальной генетической карты, на которой были бы помечены гены,

  4. 22 23 44 генов в человека
  5. Число генов человека порядка 30 000 но числа варьируют в разные стороны. Точно являются генами порядка 20 000 остальные - предсказаны биоинформатически и нуждаются в проверке. Опять же в эти 30 000 скорее всего не вошли гены, содержащиеся в повторах.

Особенности

Хромосомы

В геноме присутствует 23 пары хромосом : 22 пары аутосомных хромосом, а также пара половых хромосомы X и Y. У человека мужской пол является гетерогаметным и определяется наличием Y хромосомы. Нормальные диплоидные соматические клетки имеют 46 хромосом.

Гены

Другой подход получения регуляторных последовательностей основан на сравнении генов человека и рыбы фугу . Последовательности генов и регуляторные последовательности у человека и рыбы фугу существенно схожи, однако геном рыбы фугу содержит в 8-раз меньший объём «мусорной ДНК». Такая «компактность» рыбьего генома позволяет значительно легче искать регуляторные последовательности для генов .

Прочие объекты в геноме

Кодирующие белок последовательности (множество последовательностей составляющих экзоны) составляют менее чем 1,5 % генома . Не учитывая известные регуляторные последовательности, в человеческом геноме содержится масса объектов, которые выглядят как нечто важное, но функция которых, если она вообще существует, на текущий момент не выяснена. Фактически эти объекты занимают до 97 % всего объёма человеческого генома. К таким объектам относятся:

  • повторы
    • тандемные повторы
      • сателлитная ДНК
    • диспергированные повторы
      • SINE-ы (short interspersed nuclear element)
      • LINE-ы (long interspersed nuclear element)
  • транспозоны
    • Ретротранспозоны
      • LTR-ы (long terminal repeat)
        • Ty1-copia
        • Ty3-gypsy
      • Не LTR-ы
    • ДНК транспозоны

Представленная классификация не является исчерпывающей. Большая часть объектов вообще не классифицирована мировой научной общественностью на текущий момент.

Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция выключена, и на эти участки генома многие ссылаются как на «мусорную ДНК». Однако существует масса свидетельств, которая говорит о том, что эти объекты обладают некоторой функцией, которая не вполне понятна на текущий момент.

Псевдогены

Вирусы

Около 1 % в геноме человека занимают встроенные гены ретровирусов (эндогенные ретровирусы). Эти гены обычно не приносят пользы хозяину, но существуют и исключения. Так, около 43 млн. лет назад в геном предков обезьян и человека попали ретровирусные гены, служившие для построения оболочки вируса. У человека и обезьян эти гены участвуют в работе плаценты.

Большинство ретровирусов встроились в геном предков человека свыше 25 млн. лет назад. Среди более молодых человеческих эндогенных ретровирусов полезных на настоящий момент не обнаружено , .

См. также

Примечания

Список литературы

  • Тарантул В. З. Геном человека. Энциклопедия, написанная четырьмя буквами. - Языки славянской культуры, 2003. - 396 с. - ISBN 5-94457-108-X .
  • Ридли Мэтт. Геном: автобиография вида в 23 главах. - М.: Эксмо, 2008. - 432 с. - ISBN 5-699-30682-4

Ссылки

  • Всеобщая декларация о геноме человека и правах человека ЮНЕСКО, 1997
  • Lindblad-Toh K, et al. (2005). «Genome sequence, comparative analysis and haplotype structure of the domestic dog.». Nature 438 (7069): 803-19. PMID 16341006 .

Wikimedia Foundation . 2010 .

Смотреть что такое "Геном человека" в других словарях:

    Геном человека это геном биологического вида Homo sapiens . В нормальной ситуации у человека может присутствовать 24 различных хромосомы (22+X+Y): 22 из них не зависят от пола (аутосомные хромосомы), 2 X хромосома и Y хромосома зависят от пола.… … Википедия

    Логотип проекта Проект по расшифровке генома человека (англ. The Human Genome Project, HGP) международный научно исследовательский проект, главной целью которого было опр … Википедия

    Логотип проекта Проект по расшифровке генома человека (англ. The Human Genome Project, HGP) международный научно исследовательский проект, главной целью которого было определить последовательность нуклеотидов, которые составляют ДНК и… … Википедия

    Проект «Геном человека» - * праект «Геном чалавека» * Human Genome Project or HGP многолетний научно исследовательский проект, задачей которого было получение полной генетической информации, записанной в геноме человека, «прочтение» нуклеотидных последовательностей во… … Генетика. Энциклопедический словарь

В то время, когда вы читаете эти слова или пьёте свой утренний кофе, смотрите телевизор или крепко спите, укрывшись пледом, мощные компьютеры методично собирают и систематизируют научные материалы, в которых на первом месте среди исследований находится геном человека.

Компьютеры под руководством учёных-генетиков тщательно каталогизируют десятки тысяч генов, содержащихся в человеческой ДНК. По предсказаниям ученых, когда будет собрана и внесена в компьютер вся необходимая информация, она долго будет служить основой для изучения биологии человека и для медицинских целей.

Ученые также надеются, что после того, как геном человека будет полностью расшифрован, перед человечеством откроется путь для терапии, люди научатся корректировать или заменять дефектные гены.

Врачи также надеются, что после того, как геном человека будет полностью исследован, когда наука научится без труда «читать» его, должно появиться новое поколение медицинских препаратов, которые будут безопасны, но очень эффективны в борьбе с болезнями и предотвращении их.

Возможно, эта технология также позволит врачу пересмотреть ваши генетические данные, определить заранее, какие лекарства будут для вас лучшими.

Кроме перспектив, открывающихся перед медициной, кое-кто предполагает, что человека способна решить многие В годы периода, начиная со Второй мировой войны и заканчивая началом 1990-х, ученые доказывали, что можно уменьшить социальные проблемы, реформировав экономику и различные институты и усовершенствовав условия жизни людей. Однако в последние годы общественные проблемы только увеличились. Поэтому многие психологи, социологи и журналисты выдвинули гипотезу, что решение этих проблем следует искать в генах. Сегодня кое-кто думает, что гены больше, чем окружение, влияют на поведение отдельного человека и целой группы.

Также, по словам исследователей, даже эту проблему можно разрешить, проведя определенные манипуляции с ДНК. Ученым уже удалось вдвое увеличить длительность существования плодовых мушек и червей, и они свято верят в то, что эту же методику можно будет когда-нибудь применить к людям. Руководитель проекта «Геном человека» сказал: «Мы впервые можем подумать о реальности человеческого бессмертия».

«Ха - ха! - поднимут на смех последнее утверждение циники. - Сравнили тоже: какие-то плодовые мушки и черви - и такая высокоразвитая система, как человек!» Что ж, пусть циники смеются, сколько им влезет. Однако, как бы это ни казалось кому-либо странным, ища ответ на вопрос о том, сколько генов у человека, учёные пришли к выводу, что их число совсем не намного превосходит количество генов у столь простого организма, как крупный червь. Если говорить конкретнее об этом, то примерно у человека имеется 28 000 генов (это вместо предполагаемых 100 000, как рассчитывали учёные, приступая к проекту).

Хотя уже сегодня медицина довольно широко использует науку генетику в своих целях. Например, существует самый распространенный метод генетической проверки который уже применяется с 1960-х годов.

Для анализа врач вводит иглу шприца в матку беременной женщины через пупок и берет пробу околоплодных вод. Затем эту жидкость исследуют с тем, чтобы выявить, не имеет ли плод какого-либо серьёзного генетического расстройства.

Эта абсолютно безвредная как для будущей мамочки, так и для её потомства процедура, способна предупредить о таких нарушениях в развитии плода, как развитие или расщепление позвоночника.

Однако не все обнаруженные отклонения в развитии зародыша современная медицина умеет устранять. В большинстве случаев она способна просто вынести трагический вердикт: «Здесь необходим аборт!»

Так вот именно для того, чтобы научиться не просто убивать неродившегося больного человечка, а корректировать его развитие на ранней стадии, устранять нежелательные изменения плода путём генной инженерии, и пытаются учёные раскрыть тайну человеческого генома.

Это наиболее интересный вопрос, ради которого собственно и затевалось полное секвенирование генома человека. После получения основной информации о структуре генома человека в первую очередь были произведены различные анализы по поиску генов и определению их числа. Однако задача оказалась не простой. Это может показаться странным для читателя, но однозначного ответа на поставленный вопрос до сих пор нет.

Сколько же всего генов в ДНК человека? Еще несколько лет назад полагали, что их около 100 тыс., затем решили, что не более 80 тыс. В конце 1998 г. пришли к выводу, что в геноме человека не более 50-60 тыс. генов и на их долю приходится около 3 % общей длины ДНК.

Последние подсчеты общего числа генов в геноме человека проводили несколько международных команд ученых. Уже упоминавшаяся компания «Celera» провела собственные исследования, результаты которого изложены в журнале «Science» в 2001 году. По ее оценкам общее число генов в геноме человека составляет от 26383 до 39114. Средний размер гена оценивается равным примерно 3000 п. н. Если принять, что число генов у человека порядка 30 тысяч и на каждый ген приходится примерно 3 тыс. п. н., то нетрудно подсчитать, что в кодировании белков принимает участие менее 1,5 % хромосомной ДНК. Таким образом, генетические инструкции по формированию человеческой личности занимают меньше 3 сантиметров на двухметровой молекуле ДНК. Удивляет и малое количество генов, несущих эти инструкции, — их всего в пять раз больше, чем, например, у такого на наш взгляд совершенно примитивного организма, как муха дрозофила.

Вторая команда исследователей из Национального института геномных исследований США во главе с Френсисом Коллинзом, подсчитав число генов у человека независимым способом и на основе своих данных, получила сходный результат — около 32000 генов содержится в геноме каждой клетки человека.

Разнобой в окончательные оценки пока вносят два других коллектива ученых. Доктор Вильям Хезелтайн (руководитель фирмы «Хьюмэн Геном Сайенс») продолжает настаивать, что в их банке содержится приватизированная информация на 120 тыс. генов. Этой информацией он не собирается пока делиться с мировой общественностью. Фирма вложила деньги в патенты и собирается заработать на полученной информации, поскольку она относится к генам широко распространенных болезней человека. Фирма «Инсайт» сообщила о том, что имеет в настоящее время каталог, состоящий из 140 тысяч идентифицированных ей генов человека, и также настаивает на этом количестве общего числа генов у человека.

Очевидно, что наспех приватизированная генетическая информация будет еще тщательно анализироваться и проверяться в ближайшие годы, пока точное число генов станет окончательно «канонизировано». Дело в том, что устройство генов весьма многообразно и до конца еще не поняты все возможные варианты. Вот мы прочитали последовательность нуклеотидов ДНК. Определено, что она способна кодировать белок. Но один ли? Выше уже говорилось о том, как транскрипция и последующие модификации РНК, а затем трансляция и модификации полипептидов, способны обеспечить огромное многообразие белков, кодируемых одним участком ДНК. И понять это исходя только из нуклеотидной последовательности ДНК очень часто просто невозможно. Тем не менее структура генома представляет собой единственную базу для осмысления данных, получаемых такими новыми направлениями, рожденными геномикой, как транскриптомика (исследует совокупность РНК-транскриптов организма), протеомика (исследует совокупность белков организма), метаболомика (исследует обмен веществ — метаболизм — в организме). Эти направления призваны дополнить лежащий в основе структурной геномики метод геномного секвенирования, дать возможность выйти за пределы его разрешающей способности.

Выше уже также говорилось об альтернативном сплайсинге. Сейчас хорошо известно, что за счет этого процесса с одних и тех же генов могут считываться разные белки, которые затем взаимодействуют друг с другом, образуя неповторимую смесь, как из основных цветов в живописи — желтого, красного и голубого можно получить мириады оттенков. Такой сплайсинг характерен не менее чем для половины генов человека. Считается, что в среднем с одного гена человека за счет альтернативного сплайсинга может образовываться три разных пептида. Но некоторые гены имеют до 10 альтернативно сплайсируемых экзонов, что позволяет теоретически получать более 1000 различных вариантов белков всего лишь на одном гене. В реальности число разных белков, кодируемых одним геном, достигает 10. Кроме того, существуют еще и альтернативные промоторы, альтернативные кодоны инициации трансляции, редактирование РНК (превращение Ц в У или А в аналог Г — инозин). Все вышесказанное пока еще невозможно учесть при оценке общего числа генов у человека.

Но и это не все. Кроме генов, кодирующих белки, имеются еще гены, конечным продуктом которых являются РНК. Вспомним об упоминавшихся выше генах-риборегуляторах — они не кодируют белки, но производят функционирующую в клетках РНК. Так что скорее всего окончательная оценка числа генов у человека будет сделана еще нескоро.

На сегодняшний день ученым известны функции всего лишь около восьми-десяти тысяч из них. А детальные сведения о механизмах их регуляции еще более скудны. Тем не менее, приведенные выше данные о строении и функционировании генов человека свидетельствуют о том, что у человека, царствующего в природе, в отличие от других существующих на нашей планете организмов, очень высока сложность протеома — полного набора функциональных белков в клетке, которая обеспечивается не просто за счет крупного размера генома или большого числа генов, а благодаря всевозможным инновациям, связанным с функционированием генов и формированием белков: большее число доменов-модулей, более высокая комбинаторика (перемешивание) этих модулей в белках, активное использование альтернативного сплайсинга и многое другое, о чем мы поговорим дальше.

Статья на конкурс «био/мол/текст»: Это интересный вопрос, ответ на который должен был дать проект «Геном человека», завершившийся в 2003 году. После того как ученые получили основную информацию о геноме человека, они попытались определить число генов, но эта задача оказалось не такой простой. Цель настоящей статьи - суммировать и проанализировать научные данные по составлению каталога генов у человека.

Генеральный спонсор конкурса - компания «Диаэм» : крупнейший поставщик оборудования, реагентов и расходных материалов для биологических исследований и производств.


Спонсором приза зрительских симпатий выступил медико-генетический центр .


«Книжный» спонсор конкурса - «Альпина нон-фикшн »

Как же мало известно о генах! Первый раз я остро ощутила это, находясь на практике в лаборатории медицинской генетики Харбинского медицинского университета. Исследовательская группа, где я проходила стажировку, занималась изучением онкогена Sei-1, который индуцирует образование двухминутных хромосом (DM), что способствует развитию онкогенеза. Однако механизм образования онкогена Sei-1 остается неизвестным до сих пор. А ведь различные мутации генов являются причиной возникновения и других опасных заболеваний человека, помимо рака. Итак, в данной статье мы изложим некоторые соображения о том, почему мы все еще многое не знаем о генах, а также сформулируем наше мнение о том, сколько генов у человека.

Проект «Геном человека» и полный список генов

Выявление полного списка генов необходимо для выяснения молекулярных механизмов возникновения и развития рака, шизофрении , деменции , а также многих других заболеваний человека. Секвенирование ДНК, выделенной из тканей больных, позволяет выявлять такие мутации, как нуклеотидные замены, делеции и вставки, ответственные за возникновение этих заболеваний.

Собственно, ради этого и затевался проект «Геном человека» (Human genome project, HGP ), который продолжался с 1990 по 2003 год. Его основной задачей было определение нуклеотидной последовательности ДНК человека и локализации 100 000 человеческих генов (как тогда полагали) . Параллельно с этим планировалось изучить ДНК набора модельных организмов, чтобы получить сравнительную информацию, необходимую для понимания функционирования генома человека. Предполагалось, что информация, полученная в результате HGP, станет настольной книгой для биомедицинской науки в XXI веке . Целями данных исследований являлось получение информации о причинах ряда болезней и, в конечном итоге, разработка способов лечения более чем 4000 генетических заболеваний, которые затрагивают человечество, включая многофакторные, в которых генетическая предрасположенность играет важную роль. Считалось, что результаты секвенирования генома позволят определить локализацию каждого гена и их общее количество. Однако последовавшие за этим события доказали обратное: сегодня существует несколько баз данных генов, которые существенно отличаются друг от друга. Причем число белок-кодирующих генов совпадает, а число генов других типов расходится.

Проект «Протеом человека»

В 2010 году по инициативе Организации по изучению протеома человека (Human proteome organization , HUPO ) был начат проект «Протеом человека » (HPP ), целью которого является создание полного списка белков вида Homo sapiens . Для этого, во-первых, предполагается идентифицировать и охарактеризовать, по крайней мере, по одному белковому продукту белок-кодирующих генов, их однонуклеотидные полиморфизмы и варианты сплайсинга, а также виды посттрансляционной модификации белков . Во-вторых, данные протеомики, полученные в результате реализации HPP, способствуют, в дополнение к геномным данным, решению различных биомедицинских задач и созданию новых аннотированных баз знаний, таких как neXtProt .

В настоящее время neXtProt содержит информацию о 17 487 белках, существование которых экспериментально подтверждено, 1728 белках, подтвержденных на уровне транскриптов, 515-и, определенных на основании гомологии, 76-и предсказанных и 571-м неизвестной природы. Особый интерес вызывают белки, существование которых экспериментально не доказано, хотя данные о том, что они кодируются геномом, существуют. Это так называемые «потерянные» белки, которые составляют примерно 18% всех кодируемых белков. Для выявления и характеристики таких белков создан ресурс MissingProteinPedia .

«Протеом человека» является продолжением проекта «Геном человека». Предполагается, что благодаря проекту по изучению протеома мы узнаем точное количество белок-кодирующих генов, что впоследствии позволит понять, сколько всего генов у человека.

Немного о РНК

Проект «Геном человека» показал, что молекулы РНК также важны для жизни, как и ДНК. Внутри клеток существует множество РНК (рис. 2). Изначально РНК подразделяются на некодирующие РНК (нкРНК ), которые не транслируются в белки, и кодирующие РНК (мРНК ), служащие матрицей для синтеза полипептидных цепей белка. Некодирующие РНК имеют более сложную классификацию. Они бывают инфраструктурными и регуляторными. Инфраструктурные РНК представлены рибосомными РНК (рРНК) и транспортными РНК (тРНК). Молекулы рРНК синтезируются в ядрышке и составляют основу рибосомы, а также кодируют белки субъединиц рибосомы. После того, как рРНК полностью собраны, они переходят в цитоплазму, где в качестве ключевых регуляторов трансляции, участвуют в чтении кода мРНК. Последовательность из трех азотистых оснований в мРНК указывает на включение определенной аминокислоты в последовательность белка. Молекулы тРНК, приносят указанные аминокислоты на рибосомы, где синтезируется белок.

Дополнительно о РНК читайте в статьях «Биомолекулы»: «Обо всех РНК на свете, больших и малых », «Кодирующие некодирующие РНК » и «Власть колец: всемогущие кольцевые РНК » .

Рисунок 2. Виды РНК

Регуляторные нкРНК очень широко представлены в организме, классифицируются в зависимости от размера и выполняют ряд важных функций (табл. 1).

Таблица 1. Некодирующие регуляторные РНК
Название Обозначение Длина Функции
Длинные некодирующие РНК днкРНК, lncRNA 200 нуклеотидов 1. Регулируют избирательное метилирование ДНК, направляя ДНК-метилтрансферазу
2. Руководят избирательной посадкой репрессорных комплексов polycomb
Малые РНК Малые ядерные РНК мяРНК, snRNA 150 нуклеотидов 1. Участвуют в сплайсинге
2. Регулируют активность факторов транскрипции
3. Поддерживают целостность теломер
Малые ядрышковые РНК мякРНК, snoRNA 60–300 нуклеотидов 1. Участвуют в химической модификации рРНК, тРНК и мяРНК
2. Возможно, участвуют в стабилизации структуры рРНК и защите от действия гидролаз
Малые интерферирующие РНК миРНК, siRNA 21–22 нуклеотидов 1. Осуществляют антивирусную иммунную защиту
2. Подавляют активность собственных генов
Микро-РНК мкРНК, miRNA 18–25 нуклеотидов Подавляют трансляцию путем РНК-интерференции
Антисмысловые РНК asRNA 1. Короткие: менее 200 нуклеотидов
2. Длинные: более 200 нуклеотидов
Блокируют трансляцию, образуя гибриды с мРНК
РНК, связанные с белками Piwi piRNA, piwiRNA 26–32 нуклеотидов Их также называют «стражами генома», они подавляют активность мобильных генетических элементов во время эмбриогенеза

Проблема терминологии

Прежде чем ответить на вопрос: «Сколько у нас генов?», нужно понять, что же такое ген?

Основное внимание HGP было направлено на белок-кодирующие гены . Однако, как было указано в первоначальном докладе HGP в 2001 году, «тысячи генов человека продуцируют некодирующие РНК (нкРНК), являющиеся их конечным продуктом », хотя на тот момент было известно около 706 генов нкРНК . В своей недавней статье, опубликованной в журнале BMC Biology Стивен Зальцберг (Steven L. Salzberg ) дает следующее определение гена :

Ген любой участок хромосомной ДНК, который транскрибируется в функциональную молекулу РНК или сначала транскрибируется в РНК, а затем транслируется в функциональный белок.

Это определение включает как гены некодирующих РНК, так и белок-кодирующие гены, и позволяет определять все варианты альтернативного сплайсинга в одном локусе как варианты одного и того же гена. Это позволяет исключить псевдогены – нефункциональные остатки структурных генов, утратившие способность кодировать белок.

Результаты двух первых исследований свидетельствовали о наличии у человека 31 000 и 26 588 белок-кодирующих генов , а в 2004 появилась полная последовательность генома человека , и авторы подсчитали, что полный каталог насчитывает 24 000 белок-кодирующих генов. Каталог человеческих генов Ensembl включает 22 287 белок-кодирующих генов и 34 214 транскриптов .

Секвенирование нового поколения (NGS)

Появление высокопроизводительных методов параллельного секвенирования (в ходе такого секвенирования миллионы фрагментов ДНК из одного образца секвенируются одновременно) или секвенирования нового (следующего) поколения (next-generation sequencing, NGS ) позволило значительно ускорить поиск функциональных участков генома . Биотехнологические компании разработали и коммерциализировали различные платформы для NG-секвенирования, позволяющие секвенировать от 1 млн до десятков млрд коротких последовательностей (ридов, reads ) длиной 50–600 нуклеотидов каждая. К наиболее популярным платформам относятся такие, как Illumina и IonTorrent , использующие амплификацию ДНК с помощью ПЦР , а также платформы одномолекулярного секвенирования, такие как Helicos Biosciences HeliScope , Pacific Biosciences SMRT (single molecule real-time sequencing ), и нанопорового секвенирования Oxford Nanopore , осуществляющие секвенирование в реальном времени и позволяющие прочитывать значительно более длинные риды - до 10–60 тыс. нуклеотидов. Кроме того, изобретение секвенирования РНК (RNA-seq ) в 2008 году, которое создавалось для количественного определения экспрессии генов, также способствовало обнаружению транскрибируемых последовательностей, как кодирующих, так и некодирующих РНК .

Благодаря NGS, базы данных днкРНК и других генов РНК (таких как микро-РНК) резко выросли за десятилетие, и текущие каталоги генов человека теперь содержат больше генов, кодирующих РНК, чем белки (табл. 2).

Таблица 2. Количество разных типов генов в следующих базах данных: Gencode , Ensembl , RefSeq , CHESS
Типы генов Gencode Ensembl RefSeq CHESS
Белок-кодирующие гены 19 901 20 376 20 345 21 306
Гены длинных некодирующих РНК 15 779 14 720 17 712 18 484
Антисмысловые РНК 5501 - 28 2694
Другие некодирующие РНК 2213 2222 13 899 4347
Псевдогены 14 723 1740 15 952 -
Общее число транскриптов 203 835 203 903 154 484 323 827

В ходе секвенирования РНК обнаружилось, что альтернативный сплайсинг, альтернативное инициирование транскрипции и альтернативное прерывание транскрипции проиcходят гораздо чаще, чем полагали, затрагивая до 95% человеческих генов. Следовательно, даже если известно местоположение всех генов, сначала нужно выявить все изоформы этих генов, а также определить, выполняют ли эти изоформы какие-либо функции или они просто представляют собой ошибки сплайсинга.

Базы данных генов человека

Задача по составлению каталога всех генов по-прежнему не решена. Проблема заключается в том, что за последние 15 лет только две исследовательские группы составили список доминантных генов: RefSeq , которая поддерживается Национальным центром биотехнологической информации (NCBI ) при Национальных институтах здоровья (NIH ), и Ensembl/Gencode , которая поддерживается Европейской молекулярно-биологической лабораторией (EMBL ). Однако, несмотря на большой прогресс, сейчас в каталогах различается количество белок-колирующих генов, генов длинных некодирующих РНК, псевдогенов, а также варьирует количество антисмысловых РНК и других некодирующих РНК (табл. 2). Каталоги еще дорабатываются: например, в прошлом году сотни генов, кодирующих белок, были добавлены или удалены из списка Gencode . Эти разногласия объясняют проблему создания полного каталога человеческих генов.

В 2017 году была создана новая база данных генов человека - CHESS . Примечательно, что она включает все белок-кодирующие гены как Gencode , так и RefSeq , так что пользователям CHESS не нужно решать, какую базу данных они предпочитают. Бóльшее количество генов может вызывать больше ошибок, но создатели считают, что бóльший набор окажется полезным при исследовании болезней человека, которые еще не отнесены к генетическим. Набор генов CHESS в настоящее время в версии 2.0 еще не окончательный, и, безусловно, создатели работают над его усовершенствованием.