Повідомлення Gate News, 29 квітня — дослідники OpenAI Себастьєн Бюбек і Ернест Рю кажуть, що системи ШІ зможуть виконувати більшість людської дослідницької роботи вже протягом двох років, представляючи математику як чітку міру прогресу ШІ. На відміну від розмитих тестів продуктивності, математичні задачі дають точну перевірку: відповіді або правильні, або неправильні, тож без двозначностей.
Бюбек зазначив, що справжнє мислення ШІ потребує здатності витримувати довгі ланцюги міркувань. Одна помилка в багатокроковому міркуванні руйнує весь доказ, тож виявлення та виправлення помилок у процесі — це головна мета для вдосконалених моделей. Внутрішні лабораторії OpenAI вже створили понад десять цілком нових теорем, які можна опублікувати в провідних журналах з комбінаторики, демонструючи, що ШІ вже створює справді оригінальні, проривні роботи, а не лише повторне комбінування наявних статей.
Однак тривалі наукові прориви вимагають стабільної зосередженості протягом тижнів тестування. Нинішнім системам усе ще потрібне суворе людське керування, щоб спрямовувати й перевіряти кожну зміну курсу. Бюбек використовує поняття "часу AGI", щоб виміряти, скільки часу модель може самостійно імітувати людське мислення; нинішні системи працюють приблизно від кількох днів до одного тижня, а ціль індустрії — тижні або місяці, щоб забезпечити автономну роботу в таких сферах, як біологія.
Довготривала пам’ять критично важлива для цього майбутнього. Стандартні вікна чату обмежують глибину — складні математичні докази часто перевищують 50 сторінок — тоді як репозиторії коду демонструють, як тривалі сесії роботи дозволяють глибше розв’язувати проблеми. Коли ШІ отримує незалежність і пам’ять, людська експертиза стає ціннішою, а не меншою. Працівники мають зберігати глибокі базові знання, щоб кидати виклик і перевіряти відповіді машини, а організаціям знадобляться нові автоматизовані фільтри та системи репутації, щоб підтримувати довіру в умовах потоку досліджень, підсилених ШІ.