Искусственный интеллект сворачивает молекулы РНК
Трехмерная структура имеет решающее значение для функционирования многих биомолекул поэтому ученых более всего интересует пространственная структура биомолекул, а не только последовательность их отдельных строительных блоков. С помощью искусственного интеллекта (ИИ) биоинформатики могут достоверно оценить трехмерную структуру белка по всей аминокислотной последовательности. Однако применительно к молекулам РНК эта технология все еще находится на начальном уровне. Исследователи из Рурского университета в Бохуме (RUB) описывают способ использования Ии для достоверной оценки структуры определенных молекул РНК на основе нуклеотидных последовательностей в журнале PLOS Computational Biology от 7 июля 2022 года. Они сотрудничали с профессором Акселем Мосигом по специальности "Биоинформатика" Центра диагностики белков в Бохуме для работы группы во главе с Вивианом Бранденбургом и профессором Францем Нарберхаусом из Департамента микробиологии в Рубеже. Как отмечают специалисты, следует учитывать клеточную среду, где РНК часто рассматривается только как посредник между геномной ДНК и белками. Однако, многие молекулы РНК берут на себя функции клеток. Определяющим здесь является их пространственная структура. Подобные области в нуклеотидной последовательности могут быть сгруппированы вместе для формирования трехмерных структур. Идентификация этих конструкций в последовательности РНК представляет собой фактически математическую головоломку. Для этой головоломки существует биофизическая модель с соответствующими алгоритмами прогнозирования. Однако модель не может учитывать клеточную среду рнк, что также влияет на процесс ее сгибания. Если бы РНК располагалась в идеальной среде, модель могла бы предсказать структуру с высокой степенью точности - отмечают специалисты. Но живая клетка содержит много других компонентов. Здесь вступает в игру искусственный интеллект, который позволяет изучать тонкие закономерности клеточной среды на основе известных структур. Затем он может включить эти результаты в свои структурные прогнозы. Однако для процесса обучения ИИ необходимы достаточные данные об образовании, и на практике этого недостаточно. Получение данных обучения с помощью трюка Чтобы решить проблему неполных данных обучения, команда из Бохума применила трюк: исследователи работали с известными структурными мотивами рнк. Используя какую-то обратимую передачу, они могут генерировать практически любое количество нуклеотидных последовательностей, которые будут складываться из энергетических моделей этих структур в эти пространственные структуры. Благодаря этому так называемому обратному сгибанию исследователи создали большое количество нуклеотидных последовательностей и пар структур, с помощью которых они могли бы обучать ИИ. Новые структуры можно достоверно оценить. Затем исследователи поставили перед ИИ новый вызов: он должен был предсказать структуру определенных молекул бактериальной РНК. Эти молекулы, называемые терминаторами транскрипции, являются важными признаками конструкции.
Подробно