Директорка напрямку штучного інтелекту в компанії AMD Стела Лоренцо публічно розкритикувала інструмент Claude Code від Anthropic. За її словами, колись найкращий помічник для програмістів тепер «халтурить» і не справляється зі складними завданнями, пише The Register.
Читайте также: Технологічний прорив. Орбітальні дата-центри можуть вплинути на оцінку SpaceX перед можливим IPO

Команда AMD проаналізувала 6852 сеанси роботи Claude Code, які включали 234 760 викликів інструментів та 17 871 блок мислення. Ось що вони виявили:
- Поверхневий аналіз: Раніше Claude перечитував код в середньому 6,6 разів перед правками. Тепер — лише 2 рази.
- Епідемія «лінощів»: Кількість випадків, коли штучний інтелект уникає відповідальності або кидає роботу на півдорозі, зросла з нуля до 10 разів на день.
- Швидкі, але погані рішення: Замість точкових виправлень Claude почав просто переписувати цілі файли, що свідчило про небажання вникати в деталі.
Що пішло не так?
Проблеми почалися після березневого оновлення. Лоренцо вважає, що в Anthropic почали приховувати внутрішні процеси мислення моделі (thinking blocks).
«Клоду не можна довіряти виконання складних завдань з розробки. Коли мислення стає поверхневим, модель обирає найдешевший шлях: правити без читання та пропонувати найпростіший фікс замість правильного», — написала Лоренцо.
Наслідки для Anthropic
Через падіння якості команда AMD була змушена відмовитися від Claude на користь іншого постачальника обробки даних, назва якого не розголошується.
Читайте также: Брак кадрів. Японія масово впроваджує роботів з ШІ через нестачу працездатних робітників
Лоренцо пропонує додати в Claude Code рівень максимального мислення для розробників, які виконують складні робочі процеси.
«Поточна модель підписки не розрізняє користувачів, яким потрібно 200 токенів мислення за відповідь, і користувачів, яким потрібно 20 000. Користувачі, які виконують складні інженерні робочі процеси, заплатять значно більше за гарантоване глибоке мислення», — пояснює керівник напрямку штучного інтелекту AMD.
Судячи з обговорення в темі проблеми, багато інших коментаторів Reddit висловили схожі почуття.
Нагадаємо, нещодавно компанія OpenAI випустила плагін Codex, який працює в конкуруючому інструменті Claude Code.
Читайте также: OpenAI просить правоохоронців розслідувати діяльність Ілона Маска
Підписуйтесь на наші соцмережі: Telegram | Facebook | LinkedIn
