Китайский разработчик DeepSeek заявил, что потратил 294 000 долларов на обучение своей модели R1, что значительно меньше показателей, озвученных американскими конкурентами.
В начале года DeepSeek произвела фурор со своей новой моделью, с тех пор компания и ее основатель Лян Вэньфэн практически исчезли из поля зрения общественности, за исключением нескольких обновлений. В статье в журнале Nature, где Лян указан в качестве одного из соавторов, говорится, что обучение модели DeepSeek R1, ориентированной на рассуждения, обошлось в 294 000 долларов, для чего было использовано 512 процессоров Nvidia H800. Они были разработаны компанией Nvidia для китайского рынка после того, как в октябре 2022 года США запретили компании экспортировать в Китай более мощные ИИ-чипы H100 и A100.
Сэм Альтман, генеральный директор американского гиганта искусственного интеллекта OpenAI, заявил в 2023 году, что обучение базовых моделей обошлось «гораздо дороже» 100 миллионов долларов, хотя его компания не предоставила подробных данных ни по одному из своих релизов.
Некоторые заявления DeepSeek о расходах на разработку и использованных технологиях подверглись сомнению со стороны американских компаний и официальных лиц.