Китайський стартап DeepSeek оголосив про масштабне зниження вартості своєї флагманської LLM-моделі V4-Pro — одразу на 75%, і це лише через місяць після офіційного релізу V4 (до якого входять V4 Pro та V4 Flash).
Читайте также: Обдурити мозок. Вчені досліджують, як вітамін B12 допоможе доставити ліки від раку через бар’єр
До перегляду тарифів вартість використання моделі становила від $0,0145 (кеш) до $3,48 за 1 мільйон вихідних токенів. Після зниження нижня межа опустилася до $0,003625, а верхня — до $0,87 за мільйон токенів. Промо-знижка діє до 31 травня 2026 року, після чого нові ціни — на рівні 25% від початкових — стануть постійними, пише InfoWorld.

Для порівняння: 1 мільйон вихідних токенів при використанні GPT-5.5 коштує $15, Claude Opus 4.7 — $75.
За словами головного аналітика Greyhound Research Санчіта Віра Гогіа, V4-Pro архітектурно розроблена для здешевлення обробки довгих контекстів: модель потребує приблизно вчетверо менше обчислень на токен і вдесятеро менше пам’яті порівняно з попереднім релізом. Тому зниження цін — не маркетингова акція, а реальний технічний прогрес компанії-розробника.
Як DeepSeek скорочує відставання від західних конкурентів
Майже рік після виходу резонансної моделі R1 DeepSeek представив V4 — знову у вигляді відкритого коду. Розробники можуть завантажити модель, запустити локально та модифікувати під власні потреби. Модель також оптимізована для роботи з популярними агентними інструментами, зокрема Claude Code від Anthropic.
Віце-президент Counterpoint Research Ніл Шах зазначає, що за ключовими показниками — складна математика, логічне міркування, відкритість архітектури та вартість інференсу — V4-Pro фактично наздогнала провідні західні моделі. Водночас DeepSeek поки відстає в екосистемній зрілості, глобальній підтримці, прозорості прав на інтелектуальну власність та нативній інтеграції з хмарними платформами AWS, Microsoft і Google.
Що це означає для команд
Вартість інференсу залишається одним із головних бар’єрів для масштабування пілотних ШІ-проєктів до рівня всього підприємства. Зниження цін від DeepSeek може суттєво змінити цей розрахунок.
Читайте также: До Чого Сниться Свій Кал: значення та тлумачення сну
Старший директор Ankura Consulting Аміт Джаджу пояснює: якщо організація розгорне V4-Pro на власній інфраструктурі, витрати на інференс різко впадуть, і багато сценаріїв, які раніше не окупалися в масштабі, стануть економічно вигідні — постійно активні корпоративні асистенти, масова обробка документів, генерація коду, підтримка першої лінії та мультиагентні робочі процеси. Якщо ж модель споживається через сторонніх постачальників, ефективна ставка буде вищою, а вигода — меншою.
Тиск на OpenAI, Anthropic і Google зростає
Агресивна цінова стратегія DeepSeek посилює конкурентний тиск на провідних гравців ринку. Ніл Шах вважає, що преміальна тарифікація токенів від Anthropic і OpenAI стає дедалі важче виправданою для багатьох корпоративних задач — особливо коли існує сильна open-weights альтернатива з Китаю.
Швидше за все, це підштовхне великі ШІ-компанії до переходу від споживчих моделей ціноутворення до моделей, прив’язаних до результату або цінності. Підприємства, своєю чергою, рухатимуться до стратегії мультимодельного портфеля — за аналогією з мультихмарними архітектурами: преміальні моделі для критичних завдань, спеціалізовані — для вузьких доменів, менші — для повторюваних операцій, і оркестраційний шар для маршрутизації та управління всім.
Ризики, про які не слід забувати
Незважаючи на привабливу економіку, підходити до китайських LLM-моделей треба з розважливістю. Серед ключових ризиків:
- Суверенітет даних. Якщо організація використовує зовнішній API, який базується в Китаї, запити, документи та телеметрія виходять за межі корпоративного периметра і потрапляють під юрисдикцію іншої правової системи.
- Витік інтелектуальної власності. Розробники можуть ненавмисно передавати через модель вихідний код, юридичні документи або матеріали M&A. За зовнішнього розгортання ці дані можуть зберігатися або використовуватися для навчання.
- Регуляторна відповідальність. Потрібна чіткість щодо місця обробки даних, механізмів зберігання, прав доступу та можливостей аудиту.
Експерти одностайні: найбезпечніший варіант — локальне або суверенне хмарне розгортання DeepSeek під повним контролем підприємства, з шифруванням, контролем доступу та журналами аудиту.
Нагадаємо, кілька днів тому стало відомо, що DeepSeek розробляє власний інструмент для агентного кодування — прямого конкурента Claude Code та Codex.
Читайте также: Будівництво АЕС на 93% швидше. У Техасі випробують нову технологію ядерної енергії та газу
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn