Nvidia втайне скачивает миллионы роликов с YouTube для обучения своего ИИ

Некоторые сотрудники выражают обеспокоенность юридической стороной вопроса

1 мин.
Nvidia втайне скачивает миллионы роликов с YouTube для обучения своего ИИ

Новое расследование 404 Media раскрыло занимательные подробности о деятельности технологического гиганта Nvidia. Компания, известная своими графическими процессорами, оказалась в центре скандала, связанного с масштабным сбором данных с популярного видеохостинга YouTube.

Согласно полученным внутренним документам, достоверность которых подтвердил бывший сотрудник, Nvidia разрабатывает амбициозную AI-модель под кодовым названием Cosmos. Для её обучения компания ежедневно скачивает огромные объёмы видеоконтента с YouTube. Масштабы этой операции поражают воображение: в феврале датасет насчитывал уже 130 миллионов роликов, просмотр которых занял бы у человека 80 лет непрерывного просмотра.

Особую пикантность ситуации придаёт тот факт, что даже некоторые сотрудники Nvidia выражают обеспокоенность юридической стороной вопроса. Однако, как выяснилось, проект получил одобрение на самом высоком уровне руководства компании.

Чтобы избежать блокировки со стороны YouTube, Nvidia прибегает к хитроумным техническим решениям. Компания использует специальную утилиту и парк из двух-трёх десятков виртуальных машин, что позволяет осуществлять выгрузку видеороликов с различных IP-адресов, маскируя свою деятельность.

Конечная цель проекта Cosmos — создание коммерческой модели с широким спектром применения. Nvidia планирует использовать её в системах автопилота, генераторе виртуальных миров Omniverse 3D и амбициозном проекте Digital Humans по созданию цифровых моделей людей.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube