Специалисты в сфере искусственного интеллекта американской корпорации Apple и Корнельского университета США незаметно для общественности выложили в свободный доступ большую мультимодальную языковую модель с открытым исходным кодом.
Нейросеть получила название Ferret. В процессе своей работы она пользуется частями изображений в качестве запросов.
По информации издания VentureBeat, корпорация Apple представила свою нейросеть Ferret на GitHub ещё в октябре 2023 года, но об этом событии не было никаких официальных новостей со стороны разработчика. Поэтому релиз прошёл максимально скрытно от общественности. Это заметили лишь некоторые исследователи, в результате чего интерес специалистов к Ferret стал постепенно расти.
По словам Барта Де Витта, управляющего некоммерческой организацией, занимающейся ИИ с открытым исходным кодом в медицине, выпуск Ferret со стороны Apple позволит укрепить позицию компании в качестве одного из мировых лидеров в сфере мультимодального искусственного интеллекта.
Эксперты подчёркивают, что принцип работы нейросети Ferret состоит в том, что модель проводит анализ выбранного фрагмента изображения, устанавливает объекты в этой зоне и выделяет их рамкой. Выявленные на фрагменте объекты нейросеть рассматривает в качестве части запросов, на которые предоставляются текстовые ответы.
К примеру, пользователи имеют возможность выделить на фотографии изображения животных и попросить нейросеть распознать их. После обработки запроса технология Ferret даст текстовый ответ о том, к какому виду относятся конкретные животные, а затем пользователь будет иметь возможность задать дополнительные вопросы, уточнить сведения о других объектах на фотографии и действиях в контексте.
По словам специалиста подразделения Apple AI Чжэ Гана, нейросетевая модель Ferret с открытым исходным кодом представляет собой систему, которая имеет возможность ссылаться и обосновывать что угодно, где угодно и с различной степенью детализации.
Специалисты в сфере искусственного интеллекта отмечают, что выпуск нейросети Ferret корпорацией Apple на GitHub является достаточно важным событием, которое наглядно показывает удивительный уровень открытости американской компании, что напрямую контрастирует с её традиционным скрытным характером.
Ситуацию немного прояснил известный американский технический блогер Бен Диксон, который говорит, что на данный момент ИТ-инфраструктура американской корпорации Apple вовсе не подходит для обслуживания больших языковых моделей в столь серьёзных масштабах. В связи с этим можно уже сейчас говорить о том, что корпорация Apple вряд ли будет конкурировать с такими популярными моделями, как ChatGPT.
Именно поэтому разработчики Apple уже выбрали между партнёрством с крупными игроками рынка в сфере создания новой технологии искусственного интеллекта и простой публикацией своей разработки с открытым исходным кодом на GitHub.
Ещё по теме:
- Jamie — бизнес-помощник с искусственным интеллектом
- Gamma.app – создатель презентаций с помощью ИИ и руководство по загрузке PPT
- Учебное пособие и обзор NightCafe AI 2023