Новая модель DeepSeek сокращает объём токенов до 20 раз, сохраняя до 97% точности
ixbt
22.10.2025 16:16
2
DeepSeek-OCR — новая модель искусственного интеллекта китайской компании DeepSeek, которая модернизирует обработку больших объёмов текстовой информации за счёт преобразования текста и документов в визуальные представления. Такой подход позволяет значительно сжимать данные — до 7-20 раз по количеству токенов, необходимых для анализа, при сохранении высокой точности распознавания (до 97% на уровне сжатия менее чем в 10 раз). Модель состоит из двух ключевых компонентов: DeepEncoder, который преобразует текст в изображения и сжимает их, и DeepSeek3B-MoE-A570M — языковой декодер с 3 млрд параметров и механизмом mixture-of-experts, который восстанавливает и интерпретирует сжатый визуальный текст. ![]() Технология особенно эффективна при работе с табличными данными, графиками и структурированной информацией, что открывает новые возможности применения в финансах, науке и медицине. DeepSeek-OCR доступен с открытым исходным кодом на платформах Hugging Face и GitHub. Революционная методика через визуальные представления позволяет создавать языковые модели с гораздо более длинным контекстом и уменьшает необходимые вычислительные ресурсы, что снижает стоимость и повышает скорость работы ИИ-инструментов. Это значительный технологический прорыв по сравнению с традиционным текстовым вводом в модели, который может привести к появлению более эффективных и мощных систем обработки естественного языка. Средний рейтинг 0 |
Комментарии:Здесь нет комментариев.Здесь пока нет ни одного комментария, вы можете стать первым! |