Генеральний директор криптовалютної біржі Coinbase Браян Армстронг розповів, що перевів команду розробників та інших фахівців на дешевші китайські моделі — GLM 5.2 та Kimi 2.7. Це ще один тривожний сигнал для американських ШІ-компаній, які зараз готуються до можливих IPO, пише The Decoder.
Читайте также: Навіть за 15 мільйонів років. Сміх людей і людиноподібних мавп майже не змінився — дослідження

За словами Армстронга, у Coinbase працює система автоматичного вибору моделі залежно від типу запиту, ціни та потенціалу кешування: за замовчуванням система обирає саме GLM чи Kimi. Водночас співробітники й досі можуть вручну підключити будь-яку іншу модель, зокрема від Anthropic чи OpenAI — заборони на це немає.
На практиці це майже не має значення: 91% працівників більше не наближаються до старих лімітів використання, які раніше вважалися нормою. У результаті компанія, за словами Армстронга, тепер «використовує більше токенів, ніж будь-коли, але платить вдвічі менше».
Подібний крок раніше зробив CEO стартапу Lindy, повністю перейшовши на DeepSeek v4. Аналогічно китайські моделі тестує в роботі і Snowflake — компанія бачить в них дешевшу альтернативу продуктам OpenAI та Anthropic. Усе це створює реальний ціновий тиск на в момент, коли американські гіганти штучного інтелекту готуються до виходу на біржу — і це своєрідний стрес-тест для показників зростання, якими вони мають виправдати залучені інвестиції.
Кешування підняло хіт-рейт із 5% до 60%
Завдяки покращеному кешуванню показник влучних повторних звернень до вже обробленого контексту зріс з 5% до 60%. Розробникам також рекомендують тримати контекст компактним і починати нові сесії під кожне нове завдання — підхід, що належить до ширшої практики «контекстної інженерії».
Зростання споживання токенів у компанії прискорилося в останні місяці на фоні появи на ринку потужних агентних reasoning-моделей, таких як GPT-5.x-Thinking та Opus 4.5.
Читайте также: ASUS представляє в Україні Zenbook DUO (UX8407) — ноутбук із двома OLED-екранами для ефективної роботи зі штучним інтелектом
У Coinbase, як і в Amazon та Meta, зробили видимим обсяг використання токенів кожним розробником — без жорстких лімітів. Це перетинається з культурою «токенмаксингу» (tokenmaxxing), коли співробітники отримують визнання за активне використання нейромереж, незалежно від прямого результату.
Однак Coinbase додала умову, яка відрізняє їхній підхід від класичного токенмаксингу: від співробітників із високими витратами на LLM очікують пропорційно вищої ефективності. Як каже сам Армстронг: чим більше компанія витрачає на токени, тим більшого впливу на бізнес вона очікує від цих витрат.
Цінова війна між OpenAI та Anthropic
Тепер, коли компанії почали обирати дешевші альтернативи, між OpenAI та Anthropic назріває цінова війна. Нова модель OpenAI GPT-5.6-Sol коштує стільки ж, скільки GPT-5.5, але має бути більш ефективною за токенами порівняно з Claude Fable та Mythos. Паралельно OpenAI пропонує і два слабші варіанти GPT-5.6 за значно нижчими цінами.
Тенденція переходу бізнесу на дешевші китайські моделі — частина ширшого явища, яке перетворює токени на повноцінну метрику бізнес-ефективності для корпорацій.
Нагадаємо, нещодавно стало відомо, що Сергій Брін та інші IT-мільярдери таємно обговорювали в Signal, як зупинити 5% податок на багатство.
Читайте также: Найбільший проєкт в історії: Корея вкладе $585 млрд у 4 заводи з виробництва мікропроцесорів
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
