Американский инженер создал дрон, способный самостоятельно писать код управления в полёте

Исследователь из Калифорнийского университета в Ирвайне наглядно показал, что летающий аппарат способен не только исполнять команды, но и формировать собственную управляющую программу без участия человека.

Такой результат был описан профессором кафедры электротехники и вычислительных систем Питером Бёрком в его препринте. В документе указывается, как генеративные нейросетевые модели могут быть использованы для создания автономной управляющей инфраструктуры, размещённой не на наземной станции, а прямо на борту дрона.

В проекте термин «робот» применён одновременно к двум компонентам. Первый — это искусственный интеллект, формирующий программный код. Второй — летательный аппарат, собранный на основе мини-компьютера Raspberry Pi Zero 2 W, который запускает полученный код.

Стандартная схема управления полётом строится с использованием внешнего оборудования, взаимодействующего с дроном по каналам телеметрии через интерфейсы Mission Planner или QGroundControl. Такие программы служат промежуточным звеном между человеком и устройством, предоставляя визуализацию маршрута и контроль над миссией.

При этом внутри самого дрона функционирует низкоуровневая прошивка — например, Ardupilot, а задачами высокого порядка занимается модуль навигации на базе ROS.

Суть эксперимента заключалась в том, чтобы доверить генеративному ИИ полную разработку программного обеспечения — от взаимодействия по MAVLink до интерфейса управления в браузере. Итогом стал WebGCS — веб-сервер, интегрированный в бортовую плату дрона и позволяющий управлять аппаратом прямо во время полёта через сеть. Оператор подключается к системе и отдаёт команды в интерфейсе веб-браузера.

Разработка проходила в формате спринтов с использованием различных ИИ-инструментов и специализированных платформ. В начальной фазе эксперимент предполагал работу с Claude, где формировались задачи по созданию Python-скриптов для подъёма дрона на заданную высоту, генерации карты с координатами GPS и созданию веб-страницы с интерактивным управлением.

Также система должна была составить полный инсталляционный скрипт, в т. ч. структуру файлов. Но на этом этапе возникли сложности, т. к. Claude не смог справиться с объёмом данных, поскольку не уместил весь запрос в своё контекстное окно.

Gemini 2.5 также показал нестабильность — в процессе возникли ошибки в bash-скриптах. Попытка с Cursor привела к прототипу, но итоговый код потребовал переработки из-за превышения допустимого объёма. Наиболее продуктивным оказался этап с участием Windsurf, в рамках которого за 2,5 недели было создано около 10 тыс. строк программного кода. Для реализации проекта потребовалось около 100 часов участия человека. Для сравнения, аналогичная система Cloudstation создавалась несколькими студентами на протяжении четырёх лет.

Итоги эксперимента показывают существующие пределы генеративных ИИ-систем, проявляющиеся при увеличении масштаба проекта.

По словам самого Бёрка, это соответствует наблюдениям, сделанным в рамках предыдущих исследований. В частности, анализ показателей модели Claude 3.5 Sonnet на тесте LongSWEBench продемонстрировал резкое снижение точности — от 29% при 32K токенах до 3% при объёме в 256K токенов.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube

Американский инженер создал дрон, способный самостоятельно писать код управления в полёте

Кирилл Поляков

Apple TV+ запускает музыкальное шоу KPOPPED

С 2027 года крупному бизнесу запретят иностранные «облака»