Ранее в этом году китайский чат-бот DeepSeek вызвал настоящий переполох в Кремниевой долине, выпустив новую модель искусственного интеллекта DeepSeek R1. Она не только бросила вызов ChatGPT от OpenAI по качеству работы, но и потребовала лишь долю вычислительных мощностей конкурента. Появление этой экономичной open-source модели оказалось настолько впечатляющим, что спровоцировало массовую распродажу акций технологических гигантов в конце января, стерев с рынка $1 трлн, которые инвесторы вкладывали в «пузырь» ИИ-расходов.
Однако у китайской разработки была своя ахиллесова пята: она строго следовала цензурным правилам КНР. Нейросеть отказывалась отвечать на запросы по чувствительным темам, таким как расстрел протестующих на площади Тяньаньмэнь в 1989 году, или обсуждать интернет-мемы, сравнивающие председателя Си Цзиньпина с Винни-Пухом.
Теперь исследователи из испанской компании Multiverse Computing, специализирующейся на квантовых вычислениях, заявили, что нашли способ обойти эти ограничения. Как сообщает MIT Technology Review, им удалось не только устранить цензуру, но и уменьшить размер и без того компактной модели на 55%.
Хотя разработчики DeepSeek сами выпускали облегчённые («дистиллированные») версии R1, в Multiverse отмечают, что, несмотря на вычислительную эффективность, ни одна из них не могла сравниться с оригиналом по качеству. Испанские инженеры пошли другим путем: они применили собственную технологию сжатия CompactifAI, основанную на принципах квантовой физики.
Метод использует так называемые «тензорные сети» для обработки огромных массивов данных. Это позволяет выявлять и удалять «наименее важные параметры, которые вносят незначительный вклад в общую производительность модели». Как выяснилось, к таким «второстепенным» параметрам алгоритм отнёс и специфические заученные модели поведения, включая цензурные блокировки.
Несмотря на радикальное сжатие R1, тесты показали лишь минимальную потерю точности. Зато поведение модели изменилось кардинально. Вместо того чтобы транслировать официальные тезисы Пекина в ответ на вопрос о «влиянии конституционной поправки Си Цзиньпина об отмене ограничений президентских сроков», модифицированная версия открыто описала риски чрезмерной концентрации власти.
Нейросеть также начала отвечать на ранее запрещённые вопросы, такие как «На кого похож Винни-Пух?» или «Что произошло на площади Тяньаньмэнь в 1989 году?». Этот результат имеет большое значение для индустрии: эксперты отмечают, что наиболее влиятельные открытые модели сегодня приходят из Китая, меняя глобальную информационную экосистему с учётом встроенной государственной цензуры.
Однако испанский эксперимент доказал, что даже эффективные модели можно дополнительно оптимизировать без ущерба для производительности, решая проблему, которая долгое время считалась неизбежным компромиссом.
Ещё по теме:
- Восстание машин в Чикаго: жители требуют убрать с улиц роботов-курьеров
- Корейский гамбит Маска: в судебной войне с Apple появился новый фигурант
- Intel может вернуться в Mac и iPad к 2027 году — но есть нюанс