12 методов в картинках: секвенирование нуклеиновых кислот
11 августа 2017
12 методов в картинках: секвенирование нуклеиновых кислот
- 100556
- 10
- 87
-
Авторы
-
Редакторы
-
Иллюстратор
Секвенирование ДНК и РНК — это рутинный процесс, позволяющий, тем не менее, вникнуть в суть всего живого. Первоначально расшифровка генома была «развлечением» для избранных, а сегодня заказать эту услугу может каждая вторая научно-исследовательская лаборатория. С каждым годом проникнуть в дебри геномной, транскриптомной и эпигеномной информации становится все проще. Этот обзор посвящен основным принципам секвенирования нуклеиновых кислот и может послужить превосходным путеводителем как для любителя, изучающего основы молекулярной биологии, так и для специалиста, который планирует эксперимент и грезит научными прорывами.
12 биологических методов в картинках
Генеральный партнер цикла — компания «Диаэм»: крупнейший поставщик оборудования, реагентов и расходных материалов для биологических исследований и производств.
Партнер этой статьи — «СкайДжин»
Пять причин выбрать SkyGen:
- Доступ к высококачественной продукции для молекулярной биологии
- Быстрая логистика и складская программа
- Удобное и взаимовыгодное сотрудничество
- Высококвалифицированная поддержка
- Адекватные цены
Одна из главных миссий «Биомолекулы» — докопаться до самых корней. Мы не просто рассказываем, какие новые факты обнаружили исследователи — мы говорим о том, как они их обнаружили, стараемся объяснить принципы биологических методик. Как вытащить ген из одного организма и вставить в другой? Как проследить в огромной клетке за судьбой нескольких крошечных молекул? Как возбудить одну крохотную группу нейронов в огромном мозге?
И вот мы решили рассказать о лабораторных методах более системно, собрать воедино в одной рубрике самые главные, самые современные биологические методики. Чтоб было интереснее и нагляднее, мы густо проиллюстрировали статьи и даже кое-где добавили анимации. Мы хотим, чтобы статьи новой рубрики были интересны и понятны даже случайному прохожему. И с другой стороны — чтобы они были так подробны, что даже профессионал мог бы обнаружить в них что-то новое. Мы собрали методики в 12 больших групп и собираемся сделать на их основе биометодический календарь. Ждите обновлений!
Появление и развитие технологий секвенирования
С момента открытия нуклеиновых кислот прошло уже почти полторы сотни лет. В далеком 1869 году Иоганн Фридрих Мишер выделил из находившихся в гное клеток неизвестное доселе вещество, содержащее азот и фосфор, которое назвал нуклеином, а затем (из-за его свойств) — нуклеиновой кислотой. Первоначально считалось, что молекулы нуклеиновых кислот — резерв фосфора в клетках, однако уже в первой половине XX века ученые доказали их наследственную природу. Тогда же появилось понятие гена —наименьшей структурной и функциональной единицы наследственности, — и сформировалась новая наука — генетика.
Вплоть до середины прошлого века структура носителей генетической информации и способы ее передачи оставались неясными. Модель двойной спирали ДНК, которая входит во все современные учебники генетики и молекулярной биологии, предложили в 1953 году Френсис Крик и Джеймс Уотсон (за это в 1962 ученые получили Нобелевскую премию). Последовавшие следом открытие генетического кода и разработка центральной догмы молекулярной биологии дали мощный толчок к развитию естественных наук, в первую очередь — генетики. Основные исторические вехи этого процесса показаны на рисунке 1.
Осознав основные принципы функционирования нуклеиновых кислот (НК), научное сообщество предприняло грандиозные усилия для того чтобы разработать быстрые и эффективные методы определения их первичной последовательности (рис. 2) — как это принято говорить сегодня, секвенирования. Спустя десятилетия после открытия Уотсона и Крика в биологической науке наступила новая эпоха — эра секвенирования нуклеиновых кислот и геномики...
Почти четверть века назад в Соединенных Штатах стартовал грандиозный по своему масштабу научный проект, посвященный определению последовательности генома человека [1]. Основной его целью стала расшифровка генетической информации, заключенной в хромосомах (компактизованная ДНК), которые мы наследуем от своих родителей. В течение тринадцати лет многочисленные исследовательские группы по всему миру работали над определением полной последовательности генома человека. Почти три миллиарда долларов, потраченные на этот проект, открыли перед исследователями замечательные перспективы. Используя полученные данные, появилась возможность искать и находить участки ДНК, связанные с генетически обусловленными заболеваниями. И если природа многих моногенных болезней (вызываемых отказом единственного гена нашего генома) стала понятна уже давно, то некоторые заболевания — сердечно-сосудистые, онкологические, болезни Альцгеймера [2] и Паркинсона — являются многофакторными: вызвать их может широкий спектр изменений генома, многие из которых до сих пор неизвестны. Информация о генетических вариантах, связанных с человеческими недугами, позволяет формировать научно-обоснованный подход при их диагностике и лечении.
Расшифровка и аннотация (маркировка генов и других объектов в последовательности ДНК) генома человека поставили вопрос об использовании генетической информации как для диагностики заболеваний и их долговременного прогнозирования у человека, так и для исследования популяционной структуры сообществ, этногенеза и эволюционных процессов. Применение современных технологий секвенирования и генотипирования предлагает перспективные способы решения задач современной медицинской геномики и эпигеномики.
Такие результаты могут быть использованы при создании систем для проведения дифференциальной диагностики и выявления генетической природы заболеваний, для проведения персональной терапии и подбора методик лечения на основе анализа индивидуальных генетических характеристик. Решение таких задач тесно связано с разработкой эффективных алгоритмов и математических моделей для биоинформатической обработки данных геномного секвенирования и их использованием на базе суперкомпьютерных кластеров.
Геномные исследования позволяют решать массу задач как прикладного, так и фундаментального плана. Благодаря им разрабатываются новые лекарства и продукты, они же позволяют проникнуть в глубокую историю человечества [3] или понять причину массового вымирания видов.
Сейчас разработано несколько способов секвенирования НК. Самый популярный и надежный из них — секвенирование по Сэнгеру — позволяет «считывать» последовательности до 1000 пар оснований (п.о.) и используется для небольших фрагментов генома/генов или для валидации результатов более современного секвенирования нового поколения (next-generation sequencing, NGS), где размер одного прочитанного фрагмента варьирует от 25 до 500 п.о. В отличие от секвенирования по Сэнгеру, методы NGS используют для глубокого (многократного) прочтения генетического материала, которое необходимо, например, для ресеквенирования и сборки новых геномов (de novo), транскриптомных и эпигеномных исследований [4]. Помимо этого, NGS-секвенирование значительно производительнее, позволяя одновременно считывать миллионы и даже миллиарды коротких фрагментов. Такой рост производительности привел к возможности определения последовательности сразу десятков геномов (в зависимости от их размера) за один запуск прибора (рис. 3).
Стремительно развивающиеся новые технологии секвенирования ДНК позволяют быстро и эффективно определять особенности организмов на уровне их геномов. Главным итогом развития геномных и постгеномных технологий стало существенное расширение возможностей изучения генетической природы целого спектра заболеваний человека. Масштабные ассоциативные исследования на больших клинических выборках позволяют получать данные о генетических характеристиках, присущих конкретным группам людей (семьям, популяциям), развивая методы персонализированной медицины. В связи с этим, изучение механизмов генетической предрасположенности к многофакторным заболеваниям и выявление специфических генетических маркеров сегодня имеет особенную актуальность. Подобные методы широко применяются за рубежом и в России, где технологии современного секвенирования также постепенно внедряют в медицинские исследования и медицинскую практику с целью персонификации стратегии лечения [1].
Технологической основой для подобных исследовательских и сугубо прикладных проектов служат геномные секвенаторы (приборы, на которых проводят секвенирование), поставляемые различными коммерческими компаниями, такими как Illumina, Thermo Fisher Scientific, Oxford Nanopore Technologies, Pacific Biosciences и другие.
В 2017 году на рынке представлены сразу несколько перспективных разработок в области секвенирования НК. Эти подходы применены в секвенаторах нового поколения:
- Ion Proton и Ion Personal Genome Machine (Thermo Fisher Scientific) — технология ионного полупроводникового секвенирования;
- MiSeq и NovaSeq (Illumina) — технология секвенирования на молекулярных кластерах с использованием флуоресцентно меченых нуклеотидов;
- MinION, GridION X5, PromethION и SmidgION (Oxford Nanopore Technologies) — нанопоровое секвенирование;
и некоторых других.
Современные технологии делают процесс секвенирования ДНК рутинной процедурой, особенно в том случае, когда речь идет об организмах с уже известной последовательностью генома — их последующая биоинформатическая обработка не представляет значительного труда, поскольку исследователь уже имеет референсный (ранее отсеквенированный) геном, который позволяет избежать ошибок при анализе полученных данных. При анализе нового, неопубликованного ранее, генома (de novo секвенирование и сборка) перед исследователем стоит ряд более сложных задач, в ходе решения которых он пытается сложить единичные фрагменты в цельную последовательность, задействуя многочисленные математические алгоритмы и суперкомпьютерные мощности [5], [6].
Однако наибольший интерес представляет не сама последовательность генома, а понимание того, как он функционирует: какие гены обеспечивают жизнедеятельность клетки, как происходит регуляция (включение или выключение генов) или какие генные пути начинают работать в ответ на стрессовые факторы.
Все современные секвенирующие платформы отличаются от метода секвенирования по Сэнгеру тем, что не требуют этапа клонирования фрагментов ДНК. Это экономит рабочее время и позволяет избежать ряда проблем с клонированием АТ-богатых участков. Общий принцип пробоподготовки для большинства современных (NGS) секвенаторов включает фрагментирование ДНК, привязку к субстрату, амплификацию фрагментов с помощью ПЦР (в одномолекулярном секвенировании от ПЦР удалось отказаться) и последующее считывании последовательности НК. В отличие от метода секвенирования по Сэнгеру, современные платформы обеспечивают параллельное проведение миллиардов реакций в малых объемах, что позволяет получить намного больший объем информации на выходе.
Рассмотрим основные технологии секвенирования нуклеиновых кислот подробнее.
Секвенирование по Сэнгеру
«Плюс-минус» метод секвенирования ДНК
Один из наиболее популярных методов секвенирования обязан своим появлением английскому биофизику Фредерику Сэнгеру (1918–2013) — единственному ученому в истории мировой науки, получившему сразу две Нобелевские премии по химии (в 1958 и 1980 годах). Первую премию присудили за установление структур белков, особенно инсулина, а вторую награду ему вручили в том числе и за разработку методов определения первичной последовательности нуклеиновых кислот.
Методику секвенирования ДНК с использованием радиоактивно меченых нуклеотидов и ДНК-полимеразы (или фрагмента Кленова ДНК-полимеразы I) предложили Сэнгер и его коллеги в 1977 году, причем с течением времени этот метод прошел несколько модификаций и к настоящему моменту считается золотым стандартом современного секвенирования.
Первоначально Ф. Сэнгер и Алан Коулсон разработали так называемый «плюс-минус» метод секвенирования ДНК [7], который можно подразделить на две основные стадии:
- Полимеразная цепная реакция [8], в которой используется ДНК (например, ДНК человека), фермент (ДНК-полимераза), олигонуклеотидные праймеры и смесь четырех дезоксинуклеотидов (dNTPs) (А, Т, G и C), причем один из дезоксинуклеотидов радиоактивно помечен по α-положению фосфата (32P).
- Очистка смеси амплифицированных фрагментов от дезоксинуклеозидтрифосфатов, не вступивших в реакцию (например, на колонках). Смесь делят на восемь равных частей (в разных пробирках). В «плюс»-системе проводят четыре ПЦР-реакции в присутствии каждого из четырех типов дезоксинуклеозидтрифосфатов; параллельно в «минус»-системе проводят четыре ПЦР-реакции в отсутствии каждого из них. Далее результаты визуализируют с помощью электрофореза, и определяют последовательность ДНК, исходя из того, что в «плюс»-системе терминация (прерывание) ПЦР происходит после конкретного dNTP, а в «минус»-системе — перед ним (рис. 4).
Секвенирование ДНК по Сэнгеру: метод «терминаторов»
Спустя пару лет Сэнгер с коллегами предложил еще один способ секвенирования, получивший название метода «терминаторов» или метода «обрыва цепи» [9]. Суть этого метода заключается в том, что в реакционную смесь добавляют аналоги привычных нуклеотидов (дидезоксинуклеозидтрифосфаты), включение которых в синтезируемую цепь приводит к невозможности ее дальнейшего синтеза (терминации), а по образовавшемуся «обломку» можно установить последнюю букву секвенируемого фрагмента ДНК (рис. 5).
Автоматизированные модификации метода «терминаторов» активно применяют до сих пор в специальных приборах — секвенаторах. Открытие многочисленных флуоресцентных молекул позволило отказаться от использования радиоактивной метки и сделало возможным проведение реакции в одной пробирке. Реакционную смесь разделяют капиллярным электрофорезом, a выстроившиеся в синтезируемую цепочку ДНК меченые нуклеотиды затем регистрируют детекторами флуоресценции, предоставляя возможность считывать последовательность всего секвенируемого ДНК-фрагмента.
Другие методы секвенирования «старого поколения»
Кроме методов, предложенных Сэнгером, в конце прошлого века развивались и другие подходы к определению последовательности НК, которые — в частности, метод химической деградации, разработанный Максамом и Гилбертом [10], — не получили дальнейшего распространения из-за быстрого развития энзимологии (раздел биохимии, изучающий ферменты), которая предоставила преимущество методу «терминаторов» Сэнгера.
Использование секвенирования по Сэнгеру
Секвенирование по Сэнгеру позволяет «считывать» последовательности до 1000 пар нуклеотидов и применяется для небольших фрагментов генома/генов. В частности, оно используется для:
- секвенирования отдельных участков генома с целью анализа мутаций и полиморфизмов;
- идентификации вирусов и организмов (бактерий, растений, грибов и животных);
- валидации данных, полученных на платформах секвенирования нового поколения (NGS);
- микросателлитного анализа;
- анализа делеций и инсерций (малых и протяженных).
Наиболее популярными секвенаторами, использующими технологию секвенирования по Сэнгеру, являются приборы, производимые компанией Thermo Fisher Scientific: 3730xL, 3730, 3500xL, 3500, 3130xL, 3130, 310.
Следует отметить, что все описанные выше типы исследований сейчас можно проводить с помощью секвенирования «нового поколения», речь о котором пойдет в следующей главе, однако главные плюсы секвенирования по Сэнгеру — высокая точность (достоверность) полученных данных и невысокая стоимость работ при анализе небольшого количества ДНК-фрагментов — сохраняют актуальность этого типа определения последовательности НК.
Секвенирование «нового поколения» — next-generation sequencing (NGS)
За последние полтора десятилетия были разработаны, коммерциализированы и продолжают успешно развиваться совершенно новые технологии определения последовательности НК, в основе которых лежит стремление к миниатюризации, автоматизации, увеличению объема получаемых данных, а также удешевлению процесса. Появление NGS впервые позволило значительно ускорить и удешевить определение полной последовательности миллионов геномов организмов, начиная от бактерий и заканчивая человеком. Более того, появилась реальная возможность единовременно оценивать экспрессию (работу) тысяч генов в организмах, тканях и единичных клетках (секвенирование транскриптомов), а также анализировать регуляцию их активности (анализ экспрессии микроРНК и метилирования генома). В настоящее время на рынке представлено сразу несколько разработок, позволяющих определять последовательность полных геномов организмов, проводить анализ экспрессии генов и метилирования генома. Эти подходы реализуются на секвенаторах нового поколения производства коммерческих компаний Illumina, Thermo Fisher Scientific, Pacific Biosciences и Oxford Nanopore Technologies. Часть разработанных платформ уже ушли с рынка (например, GS FLX, 454/Roche или HeliScope/Helicos Bioscience); другие, пройдя несколько реинкарнаций и модификаций, прочно закрепились на нем (Illumina и Thermo Fisher Scientific); третьи только нащупывают почву, намереваясь занять свою нишу и найти своего потребителя (например, Oxford Nanopore Technologies).
Появление высокопроизводительных технологий секвенирования сопровождается прогрессом программного обеспечения — создаются алгоритмы с открытым программным кодом, появляются открытые источники данных и платформы для вычислений. Новые математические и информационные технологии позволяют геномике развиваться быстрее и использовать более сложные алгоритмы. Эти алгоритмы могут включать в себя сразу несколько приложений и программ и позволяют работать с очень большим объемом данных.
Секвенирование «нового поколения» применяется как для анализа геномов организмов, для которых уже доступен референсный геном (ресеквенирование), так и для того, чтобы впервые расшифровать геном организма (секвенирование de novo).
Для ресеквенирования успешно используют платформы, генерирующие большое количество коротких чтений (секвенируемых фрагментов ДНК), поскольку даже относительно короткие фрагменты ДНК успешно картируются (картирование, или выравнивание, — процесс биоинформатического поиска расположения конкретного короткого фрагмента в полной геномной последовательности) на референсный геном (последовательность ДНК в цифровом виде, составленную учеными как общий репрезентативный пример последовательности генома конкретного вида) при биоинформатическом анализе данных. Такие выравненные чтения могут использоваться для поиска однонуклеотидных полиморфизмов (SNPs), малых делеций и инсерций или других структурных изменений в геноме.
Что касается секвенирования de novo и сборки новых, ранее не прочитанных, геномов, то использование коротких чтений сильно усложняет сборку, особенно в случае больших по размеру и сложно устроенных геномов эукариот (например, полиплоидных геномов). В этих случаях используют комбинированный подход — сочетание платформ, генерирующих как короткие, так и длинные чтения. При сборке генома de novo ученые уподобляются ребенку, пытаясь правильно сложить элементы геномного пазла (короткие фрагменты отсеквенированной ДНК) в единую картину, созданную эволюцией за сотни миллионов лет (рис. 6).
В то же время наибольший интерес представляет отнюдь не сама последовательность генома, а понимание того, как он функционирует. Новые методы секвенирования НК позволяют оценивать уровень метилирования ДНК, проводить анализ дифференциальной экспрессии генов, в том числе и генов-регуляторов (например, микроРНК). Возможность анализа экспрессии генов в биологических системах открывает перед исследователем огромные возможности. Например, этот метод можно применять при исследовании функционирования центральной нервной системы человека (для понимания основных молекулярных аспектов работы головного мозга [11], [12]), при оценке защитного ответа клеток на атаки вирусов [13] или ответной реакции на стресс [14]. Не менее интересные данные может дать изучение регуляции экспрессии генов посредством анализа их метилирования [15] или изучение экспрессии некодирующих РНК [16], [17].
Оценка уровня метилирования генома, например, позволяет определить, какие генные пути и сети включаются в ответ на меняющиеся факторы окружающей среды; такие работы зачастую проводят для изучения эволюционных механизмов в живых системах. Изучение экспрессии кодирующих белки и некодирующих РНК в разных тканях и клетках также позволяет понять и описать гены, вовлеченные в жизнедеятельность клеток, органов и организмов.
Пиросеквенирование
Одним из первых методов глубокого секвенирования, предложенным на суд научного сообщества, было пиросеквенирование, подразумевающее «секвенирование путем синтеза». Основной смысл этого типа секвенирования заключается в последовательном синтезе ДНК на ДНК-фрагментах изучаемого организма в специальных пиколитровых «реакторах». В ходе синтеза дочерней цепочки ДНК детектируют пирофосфаты, высвобождающиеся при включении нуклеотида в синтезируемую на матрице (участке молекулы ДНК, служащим матрицей для синтеза) комплементарную цепь .
Технологии пиросеквенирования на «биомолекуле» посвящена отдельная большая статья: «454-секвенирование (высокопроизводительное пиросеквенирование ДНК)» [18].
Технологию предложил в 1996 году Пол Нирен с коллегами из Королевского технологического института в Стокгольме [19]. Затем ее коммерциализировали (2005 год) и воплотили в приборе GS FLX, 454 производства Roche (2008 год). Этим методом можно определять нуклеотидную последовательность фрагментов геномной ДНК размером 300–500 пар оснований (п.о.). Особо следует отметить тот факт, что подавляющее большинство NGS-методов требуют предварительной фрагментации ДНК для упрощения ферментативных реакций. К обоим концам фрагментированной ДНК «пришивают» ДНК-адаптеры (данная конструкция называется ДНК-библиотекой), необходимые для эмульсионной ПЦР (эПЦР) на магнитных сферах и последующего секвенирования.
Готовые ДНК-библиотеки иммобилизуют на магнитных сферах. Затем магнитные сферы с нанесенной на них клональной библиотекой доставляют на проточную ячейку, где в присутствии праймера, дезоксинуклеотидтрифосфатов и ферментов — ДНК-полимеразы, люциферазы, АТФ-сульфурилазы — происходит циклический синтез новой цепи.
Во время цикла пиросеквенирования при образовании фосфодиэфирной связи между матричной цепочкой ДНК и нуклеотидом синтезируемой цепи выделяется пирофосфат, который запускает каскад химических реакций, приводящих к выделению АТФ, необходимой для реакции окисления люциферина с выделением кванта света, который фиксируют аналоговой интегральной микросхемой (ПЗС-матрицей), состоящей из светочувствительных фотодиодов. Нуклеотиды, не вовлеченные в синтез новой цепи, удаляют из проточной ячейки, и начинается следующий реакционный цикл, в ходе которого добавляют дезоксинуклеотидтрифосфат другого типа (рис. 7).
Технология секвенирования на молекулярных кластерах с использованием флуоресцентно меченых нуклеотидов
Технология секвенирования на молекулярных кластерах, так же как и пиросеквенирование, подразумевает синтез новой молекулы ДНК по матрице. Этот метод начали разрабатывать еще в середине 90-х годов прошлого века химики Шанкар Баласубраманиан и Дэвид Кленерман из Кембриджа, изучавшие работу ДНК-полимеразы на молекулярном уровне, используя флуоресцентно меченые нуклеотиды и ДНК-матрицу, иммобилизованную на поверхности [20]. Творческие семинары в лаборатории и дружеские посиделки в баре привели к коммерциализации этой технологии в 2006 году под брендом Solexa, который спустя год был приобретен компанией Illumina. Сейчас платформа продолжает развиваться, и потребителям предлагают новые линейки приборов.
Суть метода заключается в следующем. К обоим концам предварительно фрагментированной ДНК лигируют адаптеры, необходимые для ПЦР и последующего секвенирования на молекулярных кластерах. Полученные ДНК-библиотеки иммобилизуют на поверхности проточной ячейки, где и проводят циклический процесс секвенирования. Реакционная смесь для синтеза комплементарной ДНК подается на поверхность проточной ячейки и содержит ферменты, олигонуклеотиды, а также четыре типа флуоресцентно меченых дезоксинуклеозидтрифосфатов. После включения в синтезируемую цепь ДНК нуклеотида-терминатора идентифицируют с помощью ПЗС-матрицы как тип включенного нуклеотида, так и его положение. Затем терминирующая группа и флуоресцентная краска отщепляются от нуклеотида, и цикл синтеза повторяется. Эта серия шагов продолжается определенное количество раз, число которых задает пользователь (рис. 8).
Размер чтений, получаемых с секвенатора, может достигать 300 п.о. (прибор Illumina MiSeq). Кроме того, серия секвенаторов 2017 года NovaSeq позволяет определять последовательность до 48 геномов человека за один запуск прибора.
Технология циклического лигазного секвенирования
Технология циклического лигазного секвенирования была разработана группой Джорджа Макдональда Черча [21] и, в отличие от представленных выше, использует метод лигирования (формирование химических связей между нуклеотидами при помощи специального фермента — лигазы). Данный подход к секвенированию НК коммерциализировали в 2006 году, и приборы, известные под брендом SOLiD, уже длительное время представлены на рынке (первоначально развитием этой системы секвенирования занималась компания Applied Biosystems, а затем Life Technologies и Thermo Fisher Scientific).
Суть метода заключается в определении нуклеотидной последовательности фрагментов геномной ДНК размером 25–75 п.о. К обоим концам предварительно фрагментированной ДНК лигируют адаптеры, необходимые для эПЦР на магнитных сферах и последующего секвенирования на проточной ячейке.
Магнитные сферы с нанесенной на них клональной библиотекой помещают на проточную ячейку, где и происходит секвенирование с помощью лигирования восьминуклеотидных зондов, несущих четыре различных флуорофора на 5’-конце. Флуоресценция считывается с помощью специальной камеры после каждого цикла секвенирования и, затем переводится в последовательность нуклеотидов (рис. 9).
Технология лигазного секвенирования применялась в приборах, выпускаемых под брендом SOLiD. Спустя несколько поколений приборов пробоподготовку усовершенствовали, и на рынок вышла новая линейка приборов — 5500, 5500xl, а также 5500w, использующий изотермальную ПЦР (WildFire технология) для клонирования ДНК-библиотек [22].
Ионное полупроводниковое секвенирование
Ионное полупроводниковое секвенирование, основанное на технологии PostLightTM, разработано компанией Ion Torrent и в настоящее время применяется в приборах, реализуемых Thermo Fisher Scientific — Ion S5 / Ion S5 XL, Ion Proton, Ion Personal Genome Machine (PGM).
Технология, предлагаемая в этой приборной линейке, основана на использовании полупроводниковых микрочипов для секвенирования. Суть этого подхода весьма проста и заключается в регистрации локального изменения рН на микрочипе в момент удлинения синтезируемой цепи ДНК-полимеразой на ДНК-матрице (рис. 10).
Пробоподготовка (приготовление ДНК-библиотек) напоминает таковую при циклическом лигазном секвенировании. Первоначально ДНК фрагментируют, затем к концам полученных фрагментов лигируют специфические ДНК-адаптеры, необходимые для эмульсионной ПЦР на магнитных сферах и последующего секвенирования.
Одномолекулярное секвенирование
SMRT-секвенирование (single molecule real time sequencing), предложенное сотрудниками компании Pacific Biosciences, не только позволило отказаться от проведения полимеразной цепной реакции при пробоподготовке, но и дало возможность наблюдать за работой ДНК-полимеразы, наращивающей синтезируемую цепь, в реальном времени [23].
Создание платформы Pacific Biosciences не только решило проблему ПЦР-дупликатов, но и значительно увеличило длину чтений, что крайне важно при сборке геномов de novo. Суть метода заключается в определении нуклеотидной последовательности фрагментов геномной ДНК размером до 20 000 п.о. с лигированными к их концам специфическими ДНК-адаптерами, необходимыми для последующего секвенирования.
Сама реакция секвенирования молекул ДНК проходит в специальных ячейках (SMRT-ячейки) на прозрачной (кремниевой) подложке, с напыленным на нее слоем алюминия. В основе метода лежит использование технологии Zero-mode waveguide (ZMW) [24]. Сквозь дно в ячейку подается свет, однако благодаря особенностям ее строения, пучок фотонов не рассеивается, а освещает только конкретную часть (на подложке), где закреплена молекула phi29 ДНК-полимеразы. Эта полимераза была выбрана в качестве «считывающего» фермента благодаря своей высокой точности, скорости синтезирования дочерней цепи и эффективной работе с нуклеотидами, несущими флуоресцентную метку [25].
Смысл SMRT-секвенирования схож с описанными ранее методами NGS — ДНК-полимераза достраивает вторую цепь исследуемой молекулы ДНК, используя нуклеотиды, меченные различными флуоресцентными метками, которые регистрируют при помощи конфокальной микроскопии. В 2016 году анонсировали покупку платформы Pacific Biosciences биотехнологическим гигантом Roche Diagnostics, однако сделка так и не состоялась [26].
Разработка другого способа одномолекулярного секвенирования (коммерциализированного к настоящему времени) началась в конце прошлого века, когда группа американских ученых наглядно продемонстрировала возможность побуждать молекулы ДНК и РНК проходить сквозь ионный канал диаметром 2,6 нм в двуслойной липидной мембране под воздействием электрического поля. Более того, уже тогда исследователи сумели различать ДНК и РНК, а также оценивать длину входящих в нанопору олигонуклеотидов [27]. Спустя 13 лет впервые продемонстрировали возможность определения последовательности НК нанопоровым секвенированием [28], а затем данную технологию коммерциализировала и представила на рынок компания Oxford Nanopore Technologies (рис. 11).
Суть работы нанопоровых систем (MinION, GridION X5, PromethION и SmidgION), предложенных британской компанией, достаточно проста. Реакционная камера, в которой проходит процесс считывания последовательности НК, разделена двухслойной мембраной с единичной порой. К камере прикладывается напряжение, вызывающее движение ионов и молекул ДНК или РНК через пору. При прохождении молекулы НК сечение поры (доступное для миграции ионов) уменьшается, в результате чего сила тока падает. Таким образом, считывая изменение силы тока, можно определять тип нуклеотида, проходящего через пору в конкретный отрезок времени.
Кроме описанных выше двух технологий компания Helicos Biosсiences пыталась продвинуть на биотехнологический рынок свою технологию одномолекулярного секвенирования — true Single Molecule Sequencing (tSMS). Данный подход во многом схож с технологией секвенирования на молекулярных кластерах (Illumina), однако позволяет обходиться без ПЦР при пробоподготовке.
Суть метода заключается в определении нуклеотидной последовательности фрагментов геномной ДНК размером до 50 п.о. К обоим концам предварительно фрагментированной ДНК лигируют адаптеры. Полученные ДНК-библиотеки иммобилизуют на поверхности проточной ячейки, где и проводят циклический процесс секвенирования. Один цикл состоит из удлинения синтезируемой на матрице цепочки за счет одного из четырех флуоресцентно меченых нуклеотидов, присоединение которого детектируется прибором.
Небольшая длина чтения (до 50 п.о., медиана — 30 п.о.) и большое количество ошибок (3–5%) данной платформы привели к оттоку потенциальных покупателей. Технология не получила широкого распространения, несмотря на потенциальную применимость в работе со сложными образцами, например, в палеогеномике [29], где отказ от ПЦР мог бы привести к сокращению процентного соотношение экзогенной (мусорной) ДНК в анализируемых образцах древней ДНК [30]. В итоге, в конце 2012 года компания Helicos Biosciences была признана банкротом и прекратила свое существование [31].
Одномолекулярное секвенирование длинных фрагментов ДНК может найти свое применение в самых разнообразных областях, и, что самое интересное, при работе с единичными клетками позволяет описывать их молекулярный «портрет» [32]. Это особенно важно при анализе транскриптомов клеток, позволяя описывать все возможные изоформы активных генов — благодаря длине чтений, недоступных для технологии Solexa или PostLight [33].
Использование секвенирования нового поколения
Производительность и относительная доступность NGS-методов привели к настоящей революции в биологической и медицинской науке. Более того, благодаря новым подходам появилась реальная возможность проводить ранее технически недоступные исследования. Использование секвенирования нового поколения позволяет проводить такие проекты как:
- Полногеномный анализ (в том числе, ресеквенирование и секвенирование de novo). Ресеквенирование полных геномов человека в интересах персонализированной медицины или секвенирование ранее не изученных геномов вирусов, бактерий, архей, растений, грибов и животных как с чисто фундаментальными, так и прикладными целями.
- Секвенирование РНК (RNA-Seq), позволяющее оценивать экспрессию генов не только качественно, но и количественно. Существует возможность отдельно оценивать экспрессию кодирующих и регуляторных РНК. Данные методики направлены на изучение работы генома (активности его генов, в том числе генов-регуляторов) в разных клетках, тканях и органах.
- Метагеномное секвенирование — оценка разнообразия микроорганизмов в различных образцах. Позволяет оценивать бактериальное разнообразие в различных средах, например, в кишечнике человека, донных отложениях озера Байкал или в горячих источниках Камчатки.
- Анализ ДНК-белковых взаимодействий (ChIP-Seq) — изучение влияния транскрипционных факторов и других ДНК-связывающих белков на экспрессию генов, а через нее на фенотипические и физиологические особенности клеток, органов и тканей.
- Бисульфитное секвенирование и его модификации (например, RRBS) — оценка метилирования в геноме или его участках. Влияние метилирования регуляторных участков генома на уровень экспрессии генов через подавление их транскрипционной активности.
- Таргетное секвенирование (экзомное секвенирование, секвенирование митохондриальных генов, секвенирование ампликонов). Секвенирование отдельных (выбранных исследователем) участков генома, например, только генов митохондриальной ДНК, кодирующих белки генов или генов, для которых уже описано участие в процессах онкогенеза. Таргетное секвенирование позволяет значительно снизить стоимость эксперимента (из расчета на один образец) и многократно увеличить количество анализируемых образцов.
Заключение
В наши дни происходит бурное развитие технологий, связанных с исследованием генов, белков и других молекулярных структур живых организмов. Разрабатываются портативные, быстрые, точные и универсальные методы исследований биологических объектов. Появление высокопроизводительных технологий секвенирования НК сопровождается развитием в области программного обеспечения, создаются алгоритмы с открытым программным кодом. Новые математические и информационные технологии позволяют геномике развиваться быстрее и использовать более сложные алгоритмы (например, нейронные сети).
На сегодняшний день объемы получаемой секвенаторами информации значительно обогнали возможности математического анализа получаемых результатов. Но даже несмотря на это, биомедицинская наука вовлечена в круговорот геномной революции, когда новые данные появляются ежедневно, а биотехнологические компании предлагают все новые и новые решения, значительно облегчающие диагностику заболеваний, приближая мир к новому направлению — персонализированной медицине [34].
Календарь
На основе статей спецпроекта мы решили сделать календарь «12 методов биологии» на 2019 год. Эта статья представляет апрель.
Литература
- Геном человека: как это было и как это будет;
- На руинах памяти: настоящее и будущее болезни Альцгеймера;
- Генофонд австралийских аборигенов хранит ключ к тайне выхода человека из Африки;
- Erwin L. van Dijk, Hélène Auger, Yan Jaszczyszyn, Claude Thermes. (2014). Ten years of next-generation sequencing technology. Trends in Genetics. 30, 418-426;
- Код жизни: прочесть не значит понять;
- Наука витает в облаках;
- F. Sanger, A.R. Coulson. (1975). A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. Journal of Molecular Biology. 94, 441-448;
- Важнейшие методы молекулярной биологии и генной инженерии;
- Sanger F., Niclein S., Coulson A.R. (1977). DNA sequencing with chain-terminating inhibitors. Proc. Natl. Acad. Sci. USA. 74, 5463–5467;
- Maxam A.M. and Gilbert W. (1977). A new method of sequencing DNA. Proc. Natl. Acad. Sci. USA. 74, 560–564;
- Zhisong He, Dingding Han, Olga Efimova, Patricia Guijarro, Qianhui Yu, et. al.. (2017). Comprehensive transcriptome analysis of neocortical layers in humans, chimpanzees and macaques. Nat Neurosci. 20, 886-895;
- Dolina I.A., Efimova O.I., Kildyushov E.M., Sokolov A.S., Khaitovich P.E., Nedoluzhko A.V. et al. (2017). Exploring terra incognita of cognitive science: Lateralization of gene expression at the anterior pole of the human brain. Psychology in Russia: State of the Art. 10, in press;
- Hu B., Li X., Huo Y., Yu Y., Zhang Q., Chen G. et al. (2016). Cellular responses to HSV-1 infection are linked to specific types of alterations in the host transcriptome. Sci. Rep. 6, 28075;
- Wang M., Sun X., Yu D., Xu J., Chung K., Li H. (2016). Genomic and transcriptomic analyses of the tangerine pathotype of Alternaria alternata in response to oxidative stress. Sci. Rep. 6, 32437;
- Artemov A.V., Mugue N.S., Rastorguev S.M., Zhenilo S., Mazur A.M., Tsygankova S.V. et al. (2017). Genome-wide DNA methylation profiling reveals epigenetic adaptation of stickleback to marine and freshwater conditions. Molecular Biology and Evolution;
- S. M. Rastorguev, A. V. Nedoluzhko, F. S. Sharko, E. S. Boulygina, A. S. Sokolov, et. al.. (2016). Identification of novel microRNA genes in freshwater and marine ecotypes of the three-spined stickleback (Gasterosteus aculeatus). Mol Ecol Resour. 16, 1491-1498;
- O. A. Shulga, A. V. Nedoluzhko, A. V. Shchennikova, N. M. Gruzdeva, A. A. Shelenkov, et. al.. (2017). Profiling of microRNAs in wild type and early flowering transgenic Chrysanthemum morifolium by deep sequencing. Plant Cell Tiss Organ Cult. 128, 283-301;
- 454-секвенирование (высокопроизводительное пиросеквенирование ДНК);
- Mostafa Ronaghi, Samer Karamohamed, Bertil Pettersson, Mathias Uhlén, Pål Nyrén. (1996). Real-Time DNA Sequencing Using Detection of Pyrophosphate Release. Analytical Biochemistry. 242, 84-89;
- Mark A. Osborne, W. Scott Furey, David Klenerman, Shankar Balasubramanian. (2000). Single-Molecule Analysis of DNA Immobilized on Microspheres. Anal. Chem.. 72, 3678-3681;
- J. Shendure. (2005). Accurate Multiplex Polony Sequencing of an Evolved Bacterial Genome. Science. 309, 1728-1732;
- Z. Ma, R. W. Lee, B. Li, P. Kenney, Y. Wang, et. al.. (2013). Isothermal amplification method for next-generation sequencing. Proceedings of the National Academy of Sciences. 110, 14320-14323;
- J. Eid, A. Fehr, J. Gray, K. Luong, J. Lyle, et. al.. (2009). Real-Time DNA Sequencing from Single Polymerase Molecules. Science. 323, 133-138;
- Levene M.J., Korlach J., Turner S.W., Foquet M., Craighead H.G., Webb W.W. (2003). Zero-mode waveguides for single-molecule analysis at high concentrations. Science. 299, 682–686;
- Jonas Korlach, Arek Bibillo, Jeffrey Wegener, Paul Peluso, Thang T. Pham, et. al.. (2008). Long, Processive Enzymatic DNA Synthesis Using 100% Dye-Labeled Terminal Phosphate-Linked Nucleotides. Nucleosides, Nucleotides and Nucleic Acids. 27, 1072-1082;
- PacBio announces termination of agreement with Roche Diagnostics. (2016). Pacific Biosciences of California;
- Kasianowicz J.J., Brandin E., Branton D., Deamer D.W. (1996). Characterization of individual polynucleotide molecules using a membrane channel. Proc. Natl. Acad. Sci. USA. 93, 13770–13773;
- D. Stoddart, A. J. Heron, E. Mikhailova, G. Maglia, H. Bayley. (2009). Single-nucleotide discrimination in immobilized DNA oligonucleotides with a biological nanopore. Proceedings of the National Academy of Sciences. 106, 7702-7707;
- Древняя ДНК: привет из прошлого;
- L. Orlando, A. Ginolhac, M. Raghavan, J. Vilstrup, M. Rasmussen, et. al.. (2011). True single-molecule DNA sequencing of a pleistocene horse bone. Genome Research. 21, 1705-1719;
- Helicos BioSciences files for Chapter 11 bankruptcy protection. (2012). GenomeWeb;
- Секвенирование единичных клеток (версия — Metazoa);
- Donald Sharon, Hagen Tilgner, Fabian Grubert, Michael Snyder. (2013). A single-molecule long-read survey of the human transcriptome. Nat Biotechnol. 31, 1009-1014;
- От медицины для всех — к медицине для каждого!.