Разрабатывается программа для чтения любой последовательности генома и расшифровки ее генетического кода
Екатерина «Катя» Шульгина была студенткой первого курса Высшей школы искусств и наук и искала небольшой проект по вычислительной биологии, чтобы она могла проверить требования в своей программе по системной биологии. Она задавалась вопросом, как генетический код, который когда-то считался универсальным, может развиваться и меняться.
Это был 2016 год, и сегодня Шульгина вышла на другую сторону этого краткосрочного проекта, предложив способ разгадать эту генетическую загадку. Она описывает это в журнале электронная жизнь с гарвардским биологом Шоном Эдди.
В отчете подробно рассказывается о новой компьютерной программе, которая может считывать последовательность генома любого организма, а затем определять его генетический код. Программа под названием Codetta может помочь ученым расширить свое понимание того, как развивается генетический код, и правильно интерпретировать генетический код недавно секвенированных организмов.
«Это само по себе является очень фундаментальным вопросом биологии», — сказала Шульгина, которая проводит свои исследования в Eddy’s Lab.
Генетический код — это набор правил, которые говорят клеткам, как интерпретировать трехбуквенные комбинации нуклеотидов в белки, которые часто называют строительными блоками жизни. Практически каждый организм, начиная с Кишечная палочка для людей использует тот же генетический код. Вот почему когда-то считалось, что код высечен на камне. Но ученые обнаружили несколько выбросов — организмов, использующих альтернативные генетические коды, — которые существуют с другим набором инструкций.
Вот где может проявить себя Codetta. Программа может помочь идентифицировать больше организмов, которые используют эти альтернативные генетические коды, помогая пролить новый свет на то, как генетические коды могут вообще измениться.
«Понимание того, как это произошло, поможет нам понять, почему мы изначально думали, что это невозможно… и как на самом деле работают эти действительно фундаментальные процессы», — сказала Шульгина.
Codetta уже проанализировала последовательности генома более 250 000 бактерий и других одноклеточных организмов, называемых археями, на предмет альтернативных генетических кодов и определила пять, которые никогда не были обнаружены. Во всех пяти случаях код аминокислоты аргинин был переназначен другой аминокислоте. Считается, что это первый раз, когда ученые увидели этот обмен у бактерий, и может намекнуть на эволюционные силы, которые влияют на генетический код.
Исследователи говорят, что это исследование является крупнейшим скринингом альтернативных генетических кодов. Codetta, по сути, проанализировала каждый геном, доступный для бактерий и архей. Название программы представляет собой нечто среднее между кодонами, последовательностью из трех нуклеотидов, образующих фрагменты генетического кода, и Розеттским камнем, каменной плитой с надписью на трех языках.
Эта работа знаменует собой кульминационный момент для Шульгиной, которая последние пять лет посвятила разработке статистической теории, лежащей в основе Codetta, написанию программы, ее тестированию и последующему анализу геномов. Он работает путем считывания генома организма, а затем доступа к базе данных известных белков для создания вероятного генетического кода. Он отличается от других подобных методов масштабом, в котором он может анализировать геномы.
Шульгина пришла в лабораторию Эдди, которая специализируется на сравнении геномов, в 2016 году после того, как обратилась к нему за советом по алгоритму, который она разрабатывала для интерпретации генетических кодов.
До сих пор никто не проводил столь обширного исследования альтернативных генетических кодов.
«Было здорово увидеть новые коды, потому что, насколько мы знали, Кейт проделала бы всю эту работу, и новых кодов не нашлось бы», — сказал Эдди, который также является медицинским следователем Говарда Хьюза. Он также отметил потенциал системы, которую можно использовать для обеспечения точности многих баз данных, содержащих последовательности белков.
«Многие белковые последовательности в базах данных в наши дни представляют собой лишь концептуальные переводы последовательностей геномной ДНК», — сказал Эдди. «Люди ищут в этих белковых последовательностях всевозможные полезные вещи, такие как новые ферменты, новые инструменты для редактирования генов и тому подобное. Вы хотите, чтобы эти белковые последовательности были точными, но если организм использует нестандартный код, они будут ошибочно переведены ».
Исследователи говорят, что следующим шагом работы будет использование Codetta для поиска альтернативных кодов в вирусах, эукариотах и органеллярных геномах, таких как митохондрии и хлоропласты.
«Есть еще много разнообразия в жизни, где мы еще не проводили систематического обследования», — сказала Шульгина.
В нашем Telegram‑канале, и группе ВК вы найдёте новости о непознанном, НЛО, мистике, научных открытиях, неизвестных исторических фактах. Подписывайтесь, чтобы ничего не пропустить.
Похожие статьи
ДРУГИЕ НОВОСТИ