Марко Бенедетти, инженер-программист с 40-летним стажем и учёной степенью в сфере искусственного интеллекта, решил выяснить, насколько ИИ способен заменить опытного разработчика.
Для этого он выбрал нестандартный подход — 40 часов в режиме реального времени он взаимодействовал с языковыми моделями, чтобы полностью автоматизировать написание программы без единой собственной строки кода. Итоги оказались неоднозначными — скорость возросла, но качество потребовало контроля.
Эксперимент проходил в интегрированной среде Cursor. Марко Бенедетти построил диалог с ИИ, чтобы создать крупный проект на Python — алгоритмы для решения задач поиска. Центром проекта стало решение классической головоломки «Ханойская башня». Эта задача требует точного перемещения дисков между тремя стержнями при жёстких ограничениях, а её сложность стремительно возрастает с увеличением количества элементов.
Машины с такими расчётами справляются уверенно, используя универсальные и специализированные алгоритмы, чего нельзя сказать о человеке, вынужденном долго размышлять.
Общий объём проекта составил 5 тыс. строк кода, разделённых на 50 файлов и 20 классов. Разработка охватывала как стандартный вариант задачи, так и обобщённые конфигурации. Все инструкции и запросы передавались ИИ на английском языке.
Для разных этапов использовались три модели. Gemini Pro 2.5 от Google — для подготовки и планирования, Claude Sonnet 4 от Anthropic — для основной генерации, и o3 от OpenAI — для справки и анализа. На протяжении всей работы прошло более 300 полноценных обменов сообщениями между человеком и машиной.
В процессе выяснилось, что языковые модели способны не только интерпретировать технические требования, но и предугадывать логику задачи. Например, когда разработчик просил доказать, существуют ли неразрешимые конфигурации, ИИ справлялся с задачей за полминуты — тогда как человеку на это понадобилось около 10 минут. Машина использовала стандартные библиотеки Python, писала идиоматичный код и предлагала архитектурные решения, которые выглядели убедительно.
Но часть работы потребовала вмешательства. Около пятой части времени ушло на устранение недостатков. Проблемы варьировались, от дублирования до ошибочной работы при многопоточности. Иногда ИИ усложнял логику без причины, применял неподходящий стиль обработки исключений или создавал избыточный рефакторинг.
Особенно критичным оказалось то, что примерно в 40% случаев ошибки были неочевидными. Внешне код казался качественным, но при детальном разборе проявлялись просчёты — например, неэффективные алгоритмы или действия, имитирующие нужный эффект, но не работающие корректно.
Особенностью стала и склонность ИИ к «корпоративному» стилю программирования. Даже при задачах, где лучше использовать простое решение, модели предлагали громоздкие конструкции, ориентированные на масштабируемость, а не читаемость. Такой подход не всегда оправдан.
По итогам эксперимента Марко Бенедетти заключил, что ИИ способен ускорить рабочий процесс. При достаточном уровне подготовки разработчик в состоянии удвоить скорость выполнения задач, а на этапе тестирования или написания документации рост производительности достигает 10–100 раз. Но при этом полностью полагаться на машину нельзя — это чревато «когнитивным долгом», когда специалист постепенно теряет навык. Без понимания принципов программирования использование ИИ может привести к ошибкам, которые будет сложно обнаружить.
Ещё по теме:
- ИИ от Google приписал ютуберу поездку в Израиль, после чего началась его травля
- Тим Кук вернётся в Белый дом — теперь по вопросу ИИ
- Покупатели iPhone равнодушны к ИИ — и Apple это устраивает