Вдвічі скоротили витрати: біржа Coinbase перевела розробників на китайські моделі GLM та Kimi

Генеральний директор криптовалютної біржі Coinbase Браян Армстронг розповів, що перевів команду розробників та інших фахівців на дешевші китайські моделі — GLM 5.2 та Kimi 2.7. Це ще один тривожний сигнал для американських ШІ-компаній, які зараз готуються до можливих IPO, пише The Decoder.

За словами Армстронга, у Coinbase працює система автоматичного вибору моделі залежно від типу запиту, ціни та потенціалу кешування: за замовчуванням система обирає саме GLM чи Kimi. Водночас співробітники й досі можуть вручну підключити будь-яку іншу модель, зокрема від Anthropic чи OpenAI — заборони на це немає.

На практиці це майже не має значення: 91% працівників більше не наближаються до старих лімітів використання, які раніше вважалися нормою. У результаті компанія, за словами Армстронга, тепер «використовує більше токенів, ніж будь-коли, але платить вдвічі менше».

Подібний крок раніше зробив CEO стартапу Lindy, повністю перейшовши на DeepSeek v4. Аналогічно китайські моделі тестує в роботі і Snowflake — компанія бачить в них дешевшу альтернативу продуктам OpenAI та Anthropic. Усе це створює реальний ціновий тиск на в момент, коли американські гіганти штучного інтелекту готуються до виходу на біржу — і це своєрідний стрес-тест для показників зростання, якими вони мають виправдати залучені інвестиції.

Кешування підняло хіт-рейт із 5% до 60%

Завдяки покращеному кешуванню показник влучних повторних звернень до вже обробленого контексту зріс з 5% до 60%. Розробникам також рекомендують тримати контекст компактним і починати нові сесії під кожне нове завдання — підхід, що належить до ширшої практики «контекстної інженерії».

Зростання споживання токенів у компанії прискорилося в останні місяці на фоні появи на ринку потужних агентних reasoning-моделей, таких як GPT-5.x-Thinking та Opus 4.5.

У Coinbase, як і в Amazon та Meta, зробили видимим обсяг використання токенів кожним розробником — без жорстких лімітів. Це перетинається з культурою «токенмаксингу» (tokenmaxxing), коли співробітники отримують визнання за активне використання нейромереж, незалежно від прямого результату.

Однак Coinbase додала умову, яка відрізняє їхній підхід від класичного токенмаксингу: від співробітників із високими витратами на LLM очікують пропорційно вищої ефективності. Як каже сам Армстронг: чим більше компанія витрачає на токени, тим більшого впливу на бізнес вона очікує від цих витрат.

Цінова війна між OpenAI та Anthropic

Тепер, коли компанії почали обирати дешевші альтернативи, між OpenAI та Anthropic назріває цінова війна. Нова модель OpenAI GPT-5.6-Sol коштує стільки ж, скільки GPT-5.5, але має бути більш ефективною за токенами порівняно з Claude Fable та Mythos. Паралельно OpenAI пропонує і два слабші варіанти GPT-5.6 за значно нижчими цінами.

Тенденція переходу бізнесу на дешевші китайські моделі — частина ширшого явища, яке перетворює токени на повноцінну метрику бізнес-ефективності для корпорацій.

Нагадаємо, нещодавно стало відомо, що Сергій Брін та інші IT-мільярдери таємно обговорювали в Signal, як зупинити 5% податок на багатство.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Вдвічі скоротили витрати: біржа Coinbase перевела розробників на китайські моделі GLM та Kimi

Кешування підняло хіт-рейт із 5% до 60%

Цінова війна між OpenAI та Anthropic

Автор admin

Залишити відповідь Скасувати коментар

Ви пропустили

Rockstar заблокувала частину GTA VI за пейвол — фанати в гніві

Вікові захворювання. Еволюція пояснила, чому довге життя часто супроводжується хворобами

Після обмежень Anthropic. Компанії закликали владу США чітко визначити правила для розвитку ШІ

Навіть без дозволу Вашингтона. Apple хоче купувати чипи у китайської компанії з чорного списку Пентагону

Вдвічі скоротили витрати: біржа Coinbase перевела розробників на китайські моделі GLM та Kimi

Кешування підняло хіт-рейт із 5% до 60%

Цінова війна між OpenAI та Anthropic

Автор admin

Схожі публікації

Rockstar заблокувала частину GTA VI за пейвол — фанати в гніві

Найбільший проєкт в історії: Корея вкладе $585 млрд у 4 заводи з виробництва мікропроцесорів

Claude в Китаї: як працює підпільний ринок доступу до штучного інтелекту

Залишити відповідь Скасувати коментар

Ви пропустили

Rockstar заблокувала частину GTA VI за пейвол — фанати в гніві

Вікові захворювання. Еволюція пояснила, чому довге життя часто супроводжується хворобами

Після обмежень Anthropic. Компанії закликали владу США чітко визначити правила для розвитку ШІ

Навіть без дозволу Вашингтона. Apple хоче купувати чипи у китайської компанії з чорного списку Пентагону