В Шанхайском университете Цзяотун представили систему ASI-Evolve, способную непрерывно совершенствовать свои собственные модели через замкнутый цикл экспериментов и отбора лучших решений. При оптимизации механизма внимания платформа показала улучшение почти в 3 раза относительно результатов, полученных с участием людей. Разработчики позиционируют её как первую систему, объединяющую работу с данными, архитектурами и алгоритмами обучения в рамках единого непрерывного процесса.
Принцип работы платформы строится на постоянной самопроверке. ASI-Evolve генерирует различные варианты моделей, варьирует подходы к обучению и подбирает подходящие данные, после чего прогоняет полученные комбинации через серию собственных тестов. По итогам замеров система отбирает самые результативные решения и берёт их за основу следующего этапа. Цикл крутится без пауз и позволяет ИИ развиваться без прямого вмешательства человека на каждом витке.
Внутри платформы работают два узловых компонента. Первый представляет собой когнитивную базу, собирающую знания и опыт всех предыдущих итераций в единое хранилище. Второй выполняет роль анализатора, переводящего результаты экспериментов в конкретные выводы для последующего улучшения моделей.
Связка этих блоков превращает перебор вариантов в осмысленный процесс накопления опыта.
Продемонстрированный прирост считается солидным для индустрии, где даже скромные улучшения обходятся в колоссальные усилия команд исследователей. Речь идёт о конкретной задаче оптимизации механизма внимания, однако сам масштаб прогресса впечатляет специалистов по машинному обучению.
Потенциал разработки выходит далеко за рамки задач нейросетевой архитектуры. Платформу можно запускать в любых областях, где учёным приходится вручную перебирать огромное число вариантов решений. ASI-Evolve фактически воспроизводит классический научный метод, генерируя гипотезы, проверяя их на практике и пошагово улучшая итоговый результат.
В экспериментах с поиском новых лекарств система показала результаты выше существующих решений в этой сфере. Подобный успех намекает на её применимость в биомедицине и прочих направлениях, где приходится анализировать большие массивы данных и выискивать оптимальные комбинации параметров среди миллионов возможных.