Claude Code: в AMD вважають, що він став «лінивим» і йому не можна довіряти складні завдання

Директорка напрямку штучного інтелекту в компанії AMD Стела Лоренцо публічно розкритикувала інструмент Claude Code від Anthropic. За її словами, колись найкращий помічник для програмістів тепер «халтурить» і не справляється зі складними завданнями, пише The Register.

Команда AMD проаналізувала 6852 сеанси роботи Claude Code, які включали 234 760 викликів інструментів та 17 871 блок мислення. Ось що вони виявили:

Поверхневий аналіз: Раніше Claude перечитував код в середньому 6,6 разів перед правками. Тепер — лише 2 рази.
Епідемія «лінощів»: Кількість випадків, коли штучний інтелект уникає відповідальності або кидає роботу на півдорозі, зросла з нуля до 10 разів на день.
Швидкі, але погані рішення: Замість точкових виправлень Claude почав просто переписувати цілі файли, що свідчило про небажання вникати в деталі.

Що пішло не так?

Проблеми почалися після березневого оновлення. Лоренцо вважає, що в Anthropic почали приховувати внутрішні процеси мислення моделі (thinking blocks).

«Клоду не можна довіряти виконання складних завдань з розробки. Коли мислення стає поверхневим, модель обирає найдешевший шлях: правити без читання та пропонувати найпростіший фікс замість правильного», — написала Лоренцо.

Наслідки для Anthropic

Через падіння якості команда AMD була змушена відмовитися від Claude на користь іншого постачальника обробки даних, назва якого не розголошується.

Лоренцо пропонує додати в Claude Code рівень максимального мислення для розробників, які виконують складні робочі процеси.

«Поточна модель підписки не розрізняє користувачів, яким потрібно 200 токенів мислення за відповідь, і користувачів, яким потрібно 20 000. Користувачі, які виконують складні інженерні робочі процеси, заплатять значно більше за гарантоване глибоке мислення», — пояснює керівник напрямку штучного інтелекту AMD.

Судячи з обговорення в темі проблеми, багато інших коментаторів Reddit висловили схожі почуття.

Нагадаємо, нещодавно компанія OpenAI випустила плагін Codex, який працює в конкуруючому інструменті Claude Code.

Підписуйтесь на наші соцмережі: Telegram | Facebook | LinkedIn

Claude Code: в AMD вважають, що він став «лінивим» і йому не можна довіряти складні завдання

Що пішло не так?

Наслідки для Anthropic

Автор admin

Залишити відповідь Скасувати коментар

Ви пропустили

Флагман фармацевтики. BMS та NVIDIA створюють ШІ-суперкомп’ютер для розробки ліків

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Займав майже 8 гектарів. В Словаччині знайшли римський військовий табір часів Марка Аврелія

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів

Claude Code: в AMD вважають, що він став «лінивим» і йому не можна довіряти складні завдання

Що пішло не так?

Наслідки для Anthropic

Автор admin

Схожі публікації

США погрожують Китаю санкціями через дистиляцію моделей штучного інтелекту

OpenAI відключила модель для тривалих задач — вона неодноразово намагалась вибратись за межі «пісочниці»

Microsoft випадково розкрила: мінімальні системні вимоги Windows 11 давно втратили сенс

Залишити відповідь Скасувати коментар

Ви пропустили

Флагман фармацевтики. BMS та NVIDIA створюють ШІ-суперкомп’ютер для розробки ліків

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Займав майже 8 гектарів. В Словаччині знайшли римський військовий табір часів Марка Аврелія

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів