Публичные новости

Проблемы с чипами Huawei заставили DeepSeek ещё отложить релиз своей модели искусственного интеллекта R2

Китайская компания DeepSeek, специализирующаяся на искусственном интеллекте, отложила релиз своей новой модели R2 из-за проблем с обучением на чипах Huawei.

В январе 2024 года, после выпуска модели R1, власти Китая поощряли DeepSeek к переходу с чипов Nvidia на процессоры Huawei Ascend. Однако, по словам трёх источников, знакомых с ситуацией, стартап столкнулся с непреодолимыми техническими трудностями при обучении R2 на чипах Ascend. В результате, компания была вынуждена использовать чипы Nvidia для обучения модели и чипы Huawei – для вывода (инференса).

Разница между обучением и выводом важна: обучение – это процесс, в котором модель «учится» на большом наборе данных, а вывод – это использование уже обученной модели для получения прогнозов или ответов, например, на запросы чат-бота.

Задержка релиза напрямую связана с этими трудностями, что уже привело к потере DeepSeek позиций на рынке по сравнению с конкурентами.

Источник: NurPhoto / Contributor

Ситуация усугубляется недавними сообщениями Financial Times о том, что Пекин потребовал от китайских технологических компаний обоснование закупок чипов Nvidia H100, стремясь стимулировать использование отечественных альтернатив от Huawei и Cambricon.

По словам инсайдеров отрасли, китайские чипы страдают от проблем со стабильностью, медленной межчиповой связью и менее совершенным программным обеспечением по сравнению с продукцией Nvidia. Несмотря на помощь со стороны Huawei, направившей в офис DeepSeek команду инженеров, компания так и не смогла успешно обучить модель R2 на чипах Ascend. Дальнейшие шаги DeepSeek пока неизвестны.

Original: iXBT.com: новости

Средний рейтинг 0

Комментарии:

Здесь нет комментариев.
Здесь пока нет ни одного комментария, вы можете стать первым!

16+ Сайт может содержать контент, не предназначенный для лиц младше 16 лет