Белки необходимы для жизни клеток, они выполняют сложные задачи, катализируя химические реакции. Ученые и инженеры долгое время стремились использовать эту мощь, создавая искусственные белки, которые могут выполнять новые задачи, такие как лечение болезней, захват углерода или сбор энергии. Но многие процессы, предназначенные для создания таких белков, медленны и сложны.
[penci_related_posts title=”Вам также может быть интересно” number=”4″ style=”list” align=”none” displayby=”cat” orderby=”random”]
В рамках исследования, которое может иметь большое значение для секторов здравоохранения, сельского хозяйства и энергетики, команда, возглавляемая учеными из Школы молекулярной инженерии Притцкера в Чикагском университете, разработала процесс при участии искусственного интеллекта, который использует большие данные для разработки новых белков.
Разрабатывая модели машинного обучения, которые могут просматривать информацию о белках, собранную из баз данных генома, исследователи нашли относительно простые правила проектирования для создания искусственных белков. Когда команда сконструировала эти искусственные белки в лаборатории, они обнаружили, что они выполнены настолько хорошо, что даже соперничали с теми, которые встречаются в природе.
«Мы все задались вопросом, как простой процесс, такой как эволюция, может привести к такому высокопроизводительному материалу, как белок», – сказал Рама Ранганатан, профессор Джозефа Регенштейна на кафедре биохимии и молекулярной биологии, Pritzker Molecular Engineering и колледжа. «Мы обнаружили, что данные генома содержат огромное количество информации об основных правилах структуры и функционирования белка, и теперь мы смогли создать свои правила, чтобы самим создавать белки». Результаты были опубликованы 24 июля в журнале Science .
Использование искусственного интеллекта для изучения правил проектирования
Белки состоят из сотен или тысяч аминокислот и эти аминокислотные последовательности определяют структуру и функцию белка. Но понять, как создать эти последовательности для создания новых белков, было непросто. Прошлая работа привела к методам, которые могут определять структуру, но функция не была найдена.
За последние 15 лет Ранганатан и его сотрудники поняли, что базы данных генома, которые растут в геометрической прогрессии, содержат огромное количество информации об основных правилах структуры и функционирования белка. Его группа разработала математические модели на основе этих данных, а затем начала использовать методы машинного обучения, чтобы раскрыть новую информацию об основных правилах проектирования белков.
Для этого исследования они изучили семейство метаболических ферментов хоризмат мутазы, тип белка, который важен для жизни многих бактерий, грибов и растений. Используя модели машинного обучения, исследователи смогли выявить простые правила проектирования этих белков.
Модель показывает, что только сохранение в положениях аминокислот и корреляции в эволюции пар аминокислот достаточно для предсказания новых искусственных последовательностей, которые будут обладать свойствами семейства белков.
«Обычно мы предполагаем, что для того, чтобы что-то построить, нужно сначала разобраться как это работает», – сказал Ранганатан. «Но если у вас достаточно примеров данных, вы можете использовать методы глубокого обучения, чтобы выучить правила проектирования, даже если вы понимаете, как он работает или почему он построен таким образом».
Затем он и его сотрудники создали синтетические гены для кодирования белков, клонировали их в бактерии и наблюдали, как бактерии затем производили синтетические белки, используя свои обычные клеточные механизмы. Они обнаружили, что искусственные белки имеют ту же каталитическую функцию, что и природные белки хоризмат мутазы.
Платформа для понимания других сложных систем
Поскольку правила проектирования настолько просты, количество искусственных белков, которые потенциально могут создать исследователи, чрезвычайно велико.
«Ограничения намного меньше, чем мы могли себе представить», – сказал Ранганатан. «В правилах проектирования природы простота, и мы считаем, что подобные подходы могут помочь нам найти модели для проектирования в других сложных биологических системах, таких как экосистемы или мозг».
Хотя искусственный интеллект раскрыл правила проектирования, Ранганатан и его сотрудники все еще не до конца понимают, почему модели работают. Затем они будут работать, чтобы понять, как модели пришли к такому выводу. «Предстоит проделать гораздо больше работы», – сказал он.
В то же время они также надеются использовать эту платформу для разработки белков, которые могут решать насущные социальные проблемы, такие как изменение климата. Ранганатан и доц. Профессор Эндрю Фергюсон основал компанию Evozyne, которая будет коммерциализировать эту технологию, применяя ее в энергетике, окружающей среде, катализе и сельском хозяйстве. Ранганатан работал с Польским Центром Предпринимательства и Инноваций UChicago, чтобы подать патенты и лицензировать IP для компании.
«Эта система дает нам платформу для рациональной инженерии белковых молекул, о которой мы всегда мечтали», – сказал он. «Она не только может научить нас физике того, как белки работают и как они развиваются, но и может помочь нам найти решения для таких проблем, как улавливание углерода и сбор энергии. Даже в более общем плане, исследования белков могут помочь нам понять как глубоки нейронные сети, стоящие за современным машинным обучением».
Источник: Эмили Айшфорд, Чикагский университет
Фото: Unsplash / CC0 Public Domain