Про це пише видання TechCrunch.
Дослідження провела команда лікарів і науковців із Гарвардської медичної школи та медцентру Beth Israel Deaconess. Вони порівнювали, як мовні моделі OpenAI працюють у різних медичних ситуаціях, зокрема на реальних випадках із приймального відділення.
Читайте также: Світло для 24 000 домогосподарств. У Китаї встановили найбільшу у світі плавучу вітряну турбіну
В одному з експериментів проаналізували 76 пацієнтів, які звернулися до лікарні. Діагнози двох лікарів внутрішньої медицини порівнювали з відповідями моделей o1 і 4o. Оцінку проводили інші лікарі, які не знали, де діагноз людини, а де — ШІ.
На кожному етапі діагностики модель o1 працювала не гірше або трохи краще за лікарів і модель 4o. Найбільша різниця була на початковому етапі, коли про пацієнта є мінімум інформації і потрібно швидко ухвалити рішення.
Дослідники підкреслили, що дані не обробляли заздалегідь — ШІ отримував ту саму інформацію, що була в електронних медичних записах під час встановлення діагнозу.
За словами одного з авторів дослідження Арджуна Манраї, модель перевершила попередні системи і показала кращі результати за базові показники лікарів.
Водночас автори наголошують, що це не означає готовність ШІ самостійно ухвалювати рішення, від яких залежить життя. Результати лише вказують на потребу подальших досліджень у реальних умовах лікування.
Читайте также: Брат Билли Айлиш: подробности биографии, карьеры и личной жизни Финнеаса О’Коннелла
Також зазначається, що оцінювали лише роботу з текстовими даними. Інші дослідження показують, що сучасні моделі гірше працюють із нетекстовою інформацією.
Один з авторів, лікар Адам Родман, зауважив, що наразі немає чіткої системи відповідальності за діагнози, зроблені ШІ, і пацієнти все ще хочуть, щоб складні рішення пояснювали люди.
Лікарка невідкладної допомоги Крістен Пантагані назвала дослідження цікавим, але вказала на перебільшені заголовки. Вона звернула увагу, що ШІ порівнювали з лікарями внутрішньої медицини, а не з фахівцями приймального відділення.
За її словами, порівнювати інструменти ШІ варто саме з лікарями тієї спеціальності, яку вони імітують. Вона також пояснила, що для лікаря в приймальному відділенні головне — не одразу встановити точний діагноз, а визначити, чи є у пацієнта небезпечний для життя стан.
Читайте также: Людям подобається. Понад третину нових подкастів створює штучний інтелект
- Замість вченого. Написана штучним інтелектом наукова стаття пройшла рецензування
- Єдиний інтелект машин. У Китаї презентували універсальний мозок для робототехніки
- Цифрова діагностика. Штучний інтелект навчився виявляти рак підшлункової залози за три роки до перших симптомів
