Исследователи компании EvolutionaryScale заявили о разработке новой модели искусственного интеллекта под названием ESM3, основной особенностью которой является создание с нуля несуществующих в природе белков. Технология функционирует на базе принципа предсказания последовательности, то есть примерно так же, как чат-бот ChatGPT генерирует текстовый контент. Результаты своего исследования учёные опубликовали в базе данных bioRxiv.

По словам разработчиков, модель искусственного интеллекта ESM3 является революционной нейросетью, предназначенной исключительно для различных биологических исследований. С её помощью можно приблизиться к тому, чтобы программировать биологию на базе первых принципов, то есть примерно так же, как проектировались машины и писались первые компьютерные программы.

Большая языковая модель ESM3 разработана на основе изучения миллиарда белков, которые были собраны из разных экосистем, присутствующих на нашей планете. Модель была также обучена с применением одного из наиболее мощных GPU-кластеров в мире. На данный момент она имеет 98 млрд параметров и применяет свыше 1x10^24 FLOPS. Благодаря постоянному увеличению своего масштаба модель развивает новые способности, недоступные для нейросетей меньших размеров.

Технологию разработчики обучили прогнозировать маскированные позиции белков, для чего необходимо глубокое понимание связи между их последовательностью, функциональными возможностями и структурой. Подобный подход, как заявляют создатели, позволяет большой языковой модели симулировать процессы эволюции, формируя белки, развитие которых естественным путём было бы возможно только в течение сотен миллионов лет.

Учёные из компании EvolutionaryScale также заявили, что их ИИ-технология смогла создать новый зелёный флуоресцентный белок (esmGFP), последовательность которого только на 58% похожа на ближайший известный биологам флуоресцентный белок. Создание этого вещества происходило с помощью моделирования, эквивалентного более чем 500 млн годам естественной эволюции. По словам специалистов, подобные открытия позволяют говорить о новых возможностях в сфере биотехнологии и медицины, в том числе в разработке новых способов лечения.


Ещё по теме: