Newsletter Рассылка новостей Events События подкасты Видео Africanews
Loader
Свяжитесь с нами
Реклама

Китайская DeepSeek выпускает новую ИИ-модель V4 на фоне ускорения гонки ИИ

Страница приложения DeepSeek отображается на экране смартфона в Пекине, 28 января 2025 года. (AP Photo/Энди Вонг, архив)
На экране смартфона в Пекине видна страница приложения DeepSeek, 28 января 2025 года. (AP Photo/Andy Wong, File) Авторское право  AP Photo
Авторское право AP Photo
By Roselyne Min
Опубликовано
Поделиться Комментарии
Поделиться Close Button

Китайский стартап в сфере искусственного интеллекта возвращается спустя год после того, как всколыхнул отрасль, предложив «ведущую в мире» вычислительную мощность за небольшую часть стоимости конкурентов.

Китайская компания в сфере искусственного интеллекта DeepSeek представила предварительную версию своей новой крупной языковой модели V4 по мере того, как мировая гонка ИИ набирает обороты.

РЕКЛАМА
РЕКЛАМА

В прошлом году DeepSeek стала одной из наиболее пристально отслеживаемых компаний в сфере ИИ после того, как в январе 2025-го выпустила модели, которые, по всей видимости, обеспечивали высокую производительность при меньших затратах, чем многие американские конкуренты.

Стартап из Ханчжоу выпустил модель в двух вариантах: DeepSeek V4-Pro и DeepSeek V4-Flash. V4-Pro — более крупная модель, рассчитанная на более требовательные задачи, тогда как V4-Flash — облегчённая версия, разработанная для более быстрого отклика и снижения затрат на её работу.

«В тестах на знания о мире DeepSeek V4-Pro существенно опережает другие открытые модели и лишь немного уступает топовой закрытой модели Gemini-3.1-Pro», — заявили в DeepSeek.

В компании сообщили, что новая модель ИИ поддерживает «контекст длиной в один миллион токенов», то есть способна воспринимать гораздо более объёмные запросы — например, длинные документы или код — перед тем, как сформировать ответ.

В сфере ИИ «длина контекста» означает объём текста, измеряемый в токенах, который модель может учитывать за один раз. Более широкое окно контекста позволяет модели обрабатывать более длинные запросы и включать больше информации в каждый ответ, поясняют в IBM (источник на английском языке).

«Добро пожаловать в эпоху экономичного контекста на 1 млн токенов», — заявили в компании в анонсе на платформе открытого ИИ Hugging Face.

В DeepSeek добавили, что V4 обеспечивает «мировой уровень при работе с длинным контекстом при резко сниженных затратах на вычисления и память».

Компания сравнила V4-Pro с конкурирующими моделями OpenAI, Anthropic и Google, хотя в ряде тестов более высокие результаты показала Gemini-3.1-Pro от Google.

Новую модель можно использовать с популярными ИИ-агентами, такими как Claude Code, OpenClaw и OpenCode, что позволяет разработчикам применять её для задач по разработке программного обеспечения за пределами фирменного чат-бота DeepSeek.

Известная более открытым подходом по сравнению с конкурентами, использующими закрытые модели ИИ, DeepSeek также выложила V4 на Hugging Face — модель можно свободно скачивать, тестировать и адаптировать.

Китайский стартап привлёк внимание в конце 2024 года благодаря своей открытой модели V3, которая удивила индустрию ИИ высокой производительностью при более низкой стоимости и работе на менее мощных чипах, чем у многих американских конкурентов, включая OpenAI и Google.

Глобальная гонка ИИ

Компания привлекла внимание во всём мире в январе 2025 года, когда выпустила R1 — модель ИИ для логических рассуждений, которая, по её утверждению, была дешевле и не уступала по качеству крупным языковым моделям ChatGPT от конкурирующей OpenAI.

Однако в ряде стран в прошлом году госучреждениям запретили пользоваться DeepSeek, в их числе Италия, США и Южная Корея, сославшись на соображения национальной безопасности.

В 2025 году Германия также запретила DeepSeek в магазинах приложений Apple и Google, указав на незаконную передачу пользовательских данных в Китай.

Выход V4 состоялся спустя день после того, как американский гигант ИИ OpenAI представил свою новейшую модель GPT-5.5, которую назвал «самой умной и интуитивной» на сегодняшний день.

Запуск также последовал спустя день после того, как Белый дом обвинил Китай в краже интеллектуальной собственности американских лабораторий ИИ в промышленных масштабах с использованием тысяч подставных аккаунтов.

OpenAI, Anthropic и Google предупредили в этом году, что китайские компании в сфере ИИ, включая DeepSeek, осуществляют атаки по извлечению моделей (model extraction attacks, MEA), иначе называемые «дистилляцией».

Этот метод подразумевает, что более крупной модели задают тысячи вопросов, собирают её ответы и используют их, чтобы обучить новую, более компактную модель «думать» аналогичным образом.

Перейти к комбинациям клавиш для доступности
Поделиться Комментарии

Также по теме

Разбор: что такое британский налог на цифровые услуги и почему он раздражает Трампа

На пекинском заводе Xiaomi: конвейер, выпускающий смартфон каждые 6 секунд

Китайская DeepSeek выпускает новую ИИ-модель V4 на фоне ускорения гонки ИИ