Про це пише видання SciTechDaily.
Нове дослідження показало, що комерційні мовні моделі здатні генерувати оригінальні математичні докази. Команда лабораторії Data Analytics Lab зазначає, що ChatGPT-5.2(Thinking) зміг самостійно працювати над доведенням задачі, запропонованої математиками Раном і Тенгом у 2024 році. Гіпотеза — це твердження, яке вважають правильним на основі спостережень, але яке ще не доведене. Після доведення вона стає теоремою.
Читайте также: Деградація темної енергії. Вчені здійснили аналіз 3D-карти космосу, що кидає виклик теоріям Ейнштейна
За даними дослідження, остаточний доказ сформувався після семи чат-сесій із ChatGPT і чотирьох версій аргументації. Модель допомагала знаходити підходи до розв’язання, тоді як дослідники перевіряли логіку і повноту доказу.
Автори зазначають, що ChatGPT-5.2 створив значну частину структури доказу з мінімальною допомогою людей. У лабораторії вважають, що це один із перших прикладів, коли доступна широкому загалу мовна модель змогла самостійно розробити оригінальний математичний доказ. Постдокторант Брехт Вербекен сказав, що давно припускав можливість використання ChatGPT для нерозв’язаних задач, але був здивований тим, наскільки ефективно це виявилось.
Читайте также: Автоматизація процесів. Роботи навчилися брати скло і блискучі предмети без датчиків глибини
Команда описує підхід як «vibe-proving» — метод, у якому мовні моделі допомагають структурувати складні теоретичні ідеї. Дослідники також порівнюють його з «vibe-coding», де ШІ допомагає створювати код. Професор Вінсент Гініс зазначив, що існує думка, ніби творчість таких систем обмежена переформулюванням навчальних даних, але результати роботи це спростовують.
Водночас дослідники підкреслюють, що участь людини залишається необхідною для фінальної перевірки і усунення прогалин у доведенні. Мовні моделі допомагають швидше формулювати можливі докази, але перевірка все ще потребує часу. Професор Андрес Алгаба підсумував, що цей процес може прискоритися, і мовні моделі, ймовірно, допоможуть і на етапі перевірки.
Читайте также: Без людей. Гуманоїдного робота HMND 01 протестували на складі автомобільного заводу
- Замість статичних схем. ChatGPT тепер показує інтерактивні візуальні пояснення для математики та науки
- Ілюзія інтелекту. Дослідження викрило критичні помилки ChatGPT у наукових питаннях
- ChatGPT, браузер і генератор коду. OpenAI об’єднає свої ключові сервіси в один застосунок
