Хотя нынешний эталонный геном человека является наиболее точным и полным геномом позвоночных, когда-либо созданным, в последовательности ДНК все еще есть пробелы, даже после двух десятилетий улучшений. Впервые ученые определили полную последовательность человеческой хромосомы от одного конца до другого, без пропусков и с беспрецедентным уровнем точности.
[penci_related_posts title=”Вам также может быть интересно” number=”4″ style=”list” align=”none” displayby=”cat” orderby=”random”]
Публикация сборки теломер-теломер полной человеческой Х-хромосомы 14 июля в “Nature” является знаменательным достижением для исследователей геномики. Ведущий автор Карен Мига (Karen Miga), исследователь из Института геномики Санта-Крус в Калифорнии, сказала, что проект стал возможен благодаря новым технологиям секвенирования, которые обеспечивают «сверхдлинное считывание», таким как технология секвенирования нанопор, впервые внедренная в Калифорнийском университете в Санта-Круз.
Повторяющиеся последовательности ДНК распространены по всему геному и всегда создавали проблему для секвенирования, потому что большинство технологий производят относительно короткие «чтения» последовательности, которые затем должны быть собраны воедино, как мозаика, чтобы собрать геном. Повторяющиеся последовательности приводят ко многим коротким прочтениям, которые выглядят почти одинаково, как большие просторы голубого неба в загадке, без подсказок о том, как части сочетаются друг с другом или сколько их повторений.
«Эти повторяющиеся последовательности когда-то считались неразрешимыми, но теперь мы сделали рывок в технологии секвенирования», – сказала Мига. «Благодаря нанопористому секвенированию мы получаем сверхдлинные считывания сотен тысяч пар оснований, которые могут охватывать всю повторяющуюся область, что позволяет обойти некоторые проблемы».
Заполнение оставшихся пробелов в последовательности генома человека открывает новые области генома, где исследователи могут искать связи между вариациями последовательности и заболеванием, а также другие ключи к важным вопросам биологии и эволюции человека.
«Мы начинаем обнаруживать, что некоторые из этих регионов, где были пробелы в эталонной последовательности, на самом деле являются одними из самых богатых для вариаций в человеческих популяциях, поэтому мы упустили много информации, которая может быть важна для понимания биологии человека и болезнь “, сказала Мига.
Мига и Адам Филлиппи из Национального института исследования генома человека (NHGRI), оба соответствующие авторы новой статьи, соучредили консорциум теломер-теломер (T2T) для проведения полной сборки генома после совместной работы над документом 2018 года, который продемонстрировали потенциал технологии нанопор для получения полной последовательности генома человека. В этих усилиях использовался секвенатор MinION Oxford Nanopore Technologies, который секвенирует ДНК, обнаруживая изменение тока, когда отдельные молекулы ДНК проходят через крошечное отверстие («нанопора») в мембране.
Новый проект, основанный на этих усилиях, объединяет секвенирование нанопор с другими технологиями секвенирования от PacBio и Illumina и оптические карты от BioNano Genomics. Используя эти технологии, команда создала сборку с целым геномом, которая превосходит все предыдущие сборки генома человека с точки зрения непрерывности, полноты и точности, даже превосходя текущий эталонный геном человека по некоторым показателям.
Тем не менее, по словам Миги, в этой последовательности все еще было несколько перерывов. Чтобы закончить Х-хромосому, команда должна была вручную устранить несколько пробелов в последовательности. Два сегментных дублирования были разрешены с помощью сверхдлинных считываний нанопор, которые полностью охватывали повторы и были однозначно закреплены с обеих сторон. Оставшийся разрыв был в центромере, печально известной области повторяющихся ДНК, обнаруженной в каждой хромосоме.
В Х-хромосоме центромера охватывает область высокоповторной ДНК, охватывающую 3,1 миллиона пар оснований (основания A, C, T и G образуют пары в двойной спирали ДНК и кодируют генетическую информацию в своей последовательности). Команда была в состоянии идентифицировать варианты в повторяющейся последовательности, чтобы служить маркерами, которые они использовали, чтобы выровнять длинные чтения и соединить их вместе, чтобы охватить весь центромер.
«Для меня идея о том, что мы можем собрать тандемный повтор размером в 3 мегабазы, просто невероятна. Теперь мы можем достичь этих повторяющихся областей, охватывающих миллионы баз, которые ранее считались неразрешимыми», – сказала Мига.
Следующим шагом была стратегия полировки с использованием данных из нескольких технологий секвенирования для обеспечения точности каждой базы в последовательности.
«Мы использовали итеративный процесс на трех разных платформах секвенирования для полировки последовательности и достижения высокого уровня точности», – пояснил Мига. «Уникальные маркеры обеспечивают систему привязки для сверхдлинных операций чтения, и как только вы закрепите операции чтения, вы можете использовать несколько наборов данных для вызова каждой базы».
Секвенирование нанопор, помимо обеспечения сверхдлинного считывания, может также обнаруживать основания, которые были модифицированы метилированием, «эпигенетическим» изменением, которое не изменяет последовательность, но оказывает важное влияние на структуру ДНК и экспрессию генов. Нанеся на карту закономерности метилирования в Х-хромосоме, команда смогла подтвердить предыдущие наблюдения и выявить некоторые интригующие тенденции в закономерностях метилирования в центромере.
Новая последовательность генома человека, полученная из линии клеток человека, называемой CHM13, закрывает много пробелов в текущем эталонном геноме, известном как Genome Reference Consortium build 38 (GRCh38).
Консорциум T2T продолжает работать над завершением всех хромосом CHM13. «Это открытый консорциум, поэтому во многих отношениях это проект, управляемый сообществом, и многие люди посвящают ему время и ресурсы», – сказала Мига.
Источник: Университет Калифорнии – Санта – Крус
Фото: CC0 Public Domain