Newsua.biz


DeepSeek V4 стане проривом у мультимодальних великих мовних моделях

01 марта
06:50 2026

28 лютого Financial Times повідомила, що компанія DeepSeek наступного тижня випустить нову мультимодальну велику мовну модель V4 з нативною підтримкою генерації зображень, відео та тексту. Це перше велике оновлення після запуску версії R1 у січні 2025 року, орієнтованої на логічні міркування, і воно має задовольнити попит на недорогі моделі з відкритим кодом у Китаї.

Разом із випуском V4 DeepSeek опублікує коротке технічне пояснення, а детальний інженерний звіт очікується приблизно через місяць. Компанія співпрацює з Huawei та Cambricon для оптимізації апаратної адаптації, що має прискорити процеси інференсу та підвищити попит на вітчизняні напівпровідники.

На відміну від звичайної практики, DeepSeek надає ранній доступ переважно китайським постачальникам, включно з Huawei, не випускаючи тестових версій для NVIDIA та AMD, з якими раніше тісно співпрацював. Попередня версія V4 із кодовою назвою “sealion-lite” пройшла закрите тестування, підтримуючи контекст до 1 мільйона токенів і мультимодальні можливості для аналізу великих текстів і кодових бібліотек.

Рання інформація свідчить, що V4 може стати мега-фундаментальною моделлю з масштабом до трильйона параметрів, забезпечуючи глибоке розуміння складних вхідних даних і значно розширюючи можливості мультимодальних систем штучного інтелекту.

Источник: itechua.com

Share

Статьи по теме




Последние новости

Одна из стран согласилась протестировать у себя «офсайд Венгера»

Читать всю статью

Мы в соцсетях