DeepSeek V4 стане проривом у мультимодальних великих мовних моделях

01 марта

06:50 2026

Распечатать статью Поделиться с друзьями

28 лютого Financial Times повідомила, що компанія DeepSeek наступного тижня випустить нову мультимодальну велику мовну модель V4 з нативною підтримкою генерації зображень, відео та тексту. Це перше велике оновлення після запуску версії R1 у січні 2025 року, орієнтованої на логічні міркування, і воно має задовольнити попит на недорогі моделі з відкритим кодом у Китаї.

Разом із випуском V4 DeepSeek опублікує коротке технічне пояснення, а детальний інженерний звіт очікується приблизно через місяць. Компанія співпрацює з Huawei та Cambricon для оптимізації апаратної адаптації, що має прискорити процеси інференсу та підвищити попит на вітчизняні напівпровідники.

На відміну від звичайної практики, DeepSeek надає ранній доступ переважно китайським постачальникам, включно з Huawei, не випускаючи тестових версій для NVIDIA та AMD, з якими раніше тісно співпрацював. Попередня версія V4 із кодовою назвою “sealion-lite” пройшла закрите тестування, підтримуючи контекст до 1 мільйона токенів і мультимодальні можливості для аналізу великих текстів і кодових бібліотек.

Рання інформація свідчить, що V4 може стати мега-фундаментальною моделлю з масштабом до трильйона параметрів, забезпечуючи глибоке розуміння складних вхідних даних і значно розширюючи можливості мультимодальних систем штучного інтелекту.

Источник: itechua.com

Статьи по теме

Подняться вверх

Newsua.biz

DeepSeek V4 стане проривом у мультимодальних великих мовних моделях

Статьи по теме

Последние новости

Одна из стран согласилась протестировать у себя «офсайд Венгера»

Мы в соцсетях

Newsua.biz

DeepSeek V4 стане проривом у мультимодальних великих мовних моделях

Статьи по теме

Последние новости

Одна из стран согласилась протестировать у себя «офсайд Венгера»

Мы в соцсетях

Loading..

Загрузка, пожалуйста подождите...