Повідомлення Gate News, 29 квітня — дослідники OpenAI Себастьєн Бюбек і Ернест Рю кажуть, що системи ШІ зможуть виконувати більшість людської дослідницької роботи вже протягом двох років, представляючи математику як чітку міру прогресу ШІ. На відміну від розмитих тестів продуктивності, математичні задачі дають точну перевірку: відповіді або правильні, або неправильні, тож без двозначностей.

Бюбек зазначив, що справжнє мислення ШІ потребує здатності витримувати довгі ланцюги міркувань. Одна помилка в багатокроковому міркуванні руйнує весь доказ, тож виявлення та виправлення помилок у процесі — це головна мета для вдосконалених моделей. Внутрішні лабораторії OpenAI вже створили понад десять цілком нових теорем, які можна опублікувати в провідних журналах з комбінаторики, демонструючи, що ШІ вже створює справді оригінальні, проривні роботи, а не лише повторне комбінування наявних статей.

Однак тривалі наукові прориви вимагають стабільної зосередженості протягом тижнів тестування. Нинішнім системам усе ще потрібне суворе людське керування, щоб спрямовувати й перевіряти кожну зміну курсу. Бюбек використовує поняття "часу AGI", щоб виміряти, скільки часу модель може самостійно імітувати людське мислення; нинішні системи працюють приблизно від кількох днів до одного тижня, а ціль індустрії — тижні або місяці, щоб забезпечити автономну роботу в таких сферах, як біологія.

Довготривала пам’ять критично важлива для цього майбутнього. Стандартні вікна чату обмежують глибину — складні математичні докази часто перевищують 50 сторінок — тоді як репозиторії коду демонструють, як тривалі сесії роботи дозволяють глибше розв’язувати проблеми. Коли ШІ отримує незалежність і пам’ять, людська експертиза стає ціннішою, а не меншою. Працівники мають зберігати глибокі базові знання, щоб кидати виклик і перевіряти відповіді машини, а організаціям знадобляться нові автоматизовані фільтри та системи репутації, щоб підтримувати довіру в умовах потоку досліджень, підсилених ШІ.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

04-29 03:35

Звіт a16z Crypto: AI-агенти досягають до 70% успішності у використанні вразливостей маніпуляції цінами в DeFi завдяки структурованим знанням

04-28 18:52

Anthropic досягає оцінки $1 трильйона, випереджаючи OpenAI на вторинних ринках

04-28 08:31

Adobe запускає Firefly AI Assistant із багатододатковими робочими процесами, інтегрує Claude

04-27 09:11

Грег Брокман з OpenAI: ШІ переходить від чату до автономного виконання завдань

04-27 05:17

GPT-5.5 повертається на передній край у кодуванні, але OpenAI змінює бенчмарки після поразки від Opus 4.7

Поглиблений аналіз