DeepSeek знижує вартість моделі V4-Pro на 75%: цінова війна загострюється

Китайський стартап DeepSeek оголосив про масштабне зниження вартості своєї флагманської LLM-моделі V4-Pro — одразу на 75%, і це лише через місяць після офіційного релізу V4 (до якого входять V4 Pro та V4 Flash).

До перегляду тарифів вартість використання моделі становила від $0,0145 (кеш) до $3,48 за 1 мільйон вихідних токенів. Після зниження нижня межа опустилася до $0,003625, а верхня — до $0,87 за мільйон токенів. Промо-знижка діє до 31 травня 2026 року, після чого нові ціни — на рівні 25% від початкових — стануть постійними, пише InfoWorld.

DeepSeek знижує вартість моделі V4-Pro на 75%: цінова війна загострюється

Для порівняння: 1 мільйон вихідних токенів при використанні GPT-5.5 коштує $15, Claude Opus 4.7 — $75.

За словами головного аналітика Greyhound Research Санчіта Віра Гогіа, V4-Pro архітектурно розроблена для здешевлення обробки довгих контекстів: модель потребує приблизно вчетверо менше обчислень на токен і вдесятеро менше пам’яті порівняно з попереднім релізом. Тому зниження цін — не маркетингова акція, а реальний технічний прогрес компанії-розробника.

Як DeepSeek скорочує відставання від західних конкурентів

Майже рік після виходу резонансної моделі R1 DeepSeek представив V4 — знову у вигляді відкритого коду. Розробники можуть завантажити модель, запустити локально та модифікувати під власні потреби. Модель також оптимізована для роботи з популярними агентними інструментами, зокрема Claude Code від Anthropic.

Віце-президент Counterpoint Research Ніл Шах зазначає, що за ключовими показниками — складна математика, логічне міркування, відкритість архітектури та вартість інференсу — V4-Pro фактично наздогнала провідні західні моделі. Водночас DeepSeek поки відстає в екосистемній зрілості, глобальній підтримці, прозорості прав на інтелектуальну власність та нативній інтеграції з хмарними платформами AWS, Microsoft і Google.

Що це означає для команд

Вартість інференсу залишається одним із головних бар’єрів для масштабування пілотних ШІ-проєктів до рівня всього підприємства. Зниження цін від DeepSeek може суттєво змінити цей розрахунок.

Старший директор Ankura Consulting Аміт Джаджу пояснює: якщо організація розгорне V4-Pro на власній інфраструктурі, витрати на інференс різко впадуть, і багато сценаріїв, які раніше не окупалися в масштабі, стануть економічно вигідні — постійно активні корпоративні асистенти, масова обробка документів, генерація коду, підтримка першої лінії та мультиагентні робочі процеси. Якщо ж модель споживається через сторонніх постачальників, ефективна ставка буде вищою, а вигода — меншою.

Тиск на OpenAI, Anthropic і Google зростає

Агресивна цінова стратегія DeepSeek посилює конкурентний тиск на провідних гравців ринку. Ніл Шах вважає, що преміальна тарифікація токенів від Anthropic і OpenAI стає дедалі важче виправданою для багатьох корпоративних задач — особливо коли існує сильна open-weights альтернатива з Китаю.

Швидше за все, це підштовхне великі ШІ-компанії до переходу від споживчих моделей ціноутворення до моделей, прив’язаних до результату або цінності. Підприємства, своєю чергою, рухатимуться до стратегії мультимодельного портфеля — за аналогією з мультихмарними архітектурами: преміальні моделі для критичних завдань, спеціалізовані — для вузьких доменів, менші — для повторюваних операцій, і оркестраційний шар для маршрутизації та управління всім.

Ризики, про які не слід забувати

Незважаючи на привабливу економіку, підходити до китайських LLM-моделей треба з розважливістю. Серед ключових ризиків:

Суверенітет даних. Якщо організація використовує зовнішній API, який базується в Китаї, запити, документи та телеметрія виходять за межі корпоративного периметра і потрапляють під юрисдикцію іншої правової системи.
Витік інтелектуальної власності. Розробники можуть ненавмисно передавати через модель вихідний код, юридичні документи або матеріали M&A. За зовнішнього розгортання ці дані можуть зберігатися або використовуватися для навчання.
Регуляторна відповідальність. Потрібна чіткість щодо місця обробки даних, механізмів зберігання, прав доступу та можливостей аудиту.

Експерти одностайні: найбезпечніший варіант — локальне або суверенне хмарне розгортання DeepSeek під повним контролем підприємства, з шифруванням, контролем доступу та журналами аудиту.

Нагадаємо, кілька днів тому стало відомо, що DeepSeek розробляє власний інструмент для агентного кодування — прямого конкурента Claude Code та Codex.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

DeepSeek знижує вартість моделі V4-Pro на 75%: цінова війна загострюється

Як DeepSeek скорочує відставання від західних конкурентів

Що це означає для команд

Тиск на OpenAI, Anthropic і Google зростає

Ризики, про які не слід забувати

Автор admin

Залишити відповідь Скасувати коментар

Ви пропустили

Флагман фармацевтики. BMS та NVIDIA створюють ШІ-суперкомп’ютер для розробки ліків

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Займав майже 8 гектарів. В Словаччині знайшли римський військовий табір часів Марка Аврелія

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів

DeepSeek знижує вартість моделі V4-Pro на 75%: цінова війна загострюється

Як DeepSeek скорочує відставання від західних конкурентів

Що це означає для команд

Тиск на OpenAI, Anthropic і Google зростає

Ризики, про які не слід забувати

Автор admin

Схожі публікації

США погрожують Китаю санкціями через дистиляцію моделей штучного інтелекту

OpenAI відключила модель для тривалих задач — вона неодноразово намагалась вибратись за межі «пісочниці»

Microsoft випадково розкрила: мінімальні системні вимоги Windows 11 давно втратили сенс

Залишити відповідь Скасувати коментар

Ви пропустили

Флагман фармацевтики. BMS та NVIDIA створюють ШІ-суперкомп’ютер для розробки ліків

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Займав майже 8 гектарів. В Словаччині знайшли римський військовий табір часів Марка Аврелія

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів