Зараз штучний інтелект зазнає невдач у складних завданнях у 63% випадків, що підкреслює критичну слабкість у швидко зростаючій сфері автономного ШІ. Patronus AI, стартап із фінансуванням у розмірі 20 мільйонів доларів США, каже, що його нові «генеративні симулятори» можуть значно підвищити продуктивність, створюючи динамічні, адаптивні навчальні середовища, які імітують непередбачуваність реального світу. Ця розробка відбувається у вирішальний час, оскільки компанії та розробники намагаються запровадити надійні системи ШІ, які можуть виконувати багатоетапні завдання.
Зміст
Проблема зі статичними тестами
Протягом багатьох років галузь ШІ покладалася на статичні тести для вимірювання прогресу. Однак ці стандартизовані тести не враховують переривання, зміни контексту та складне прийняття рішень, які характеризують сценарії реального світу. Ананд Каннаппан, генеральний директор Patronus AI, пояснює, що «традиційні тести вимірюють ізольовані можливості… але пропускають хаотичну, непередбачувану природу продуктивності в реальному світі». У результаті агенти штучного інтелекту, навчені на статичних даних, часто погано працюють у реальних умовах, незважаючи на те, що вони виглядають компетентними в контрольованих умовах.
Генеративні симулятори: динамічний підхід
Генеративне моделювання Patronus AI є фундаментальним зрушенням у методології навчання. Замість фіксованих наборів даних система генерує завдання, змінює умови та динамічно налаштовує правила на основі продуктивності агента. Цей підхід імітує людське навчання, де досвід і постійний зворотний зв’язок спонукають до вдосконалення. Ребекка Цянь, технічний директор Patronus AI, зазначає, що «межі між навчанням і оцінюванням… розмиті», оскільки тести тепер функціонують більше як інтерактивні навчальні платформи.
Навчання з підкріпленням і «золота середина»
Технологія заснована на навчанні з підкріпленням (RL), де агенти ШІ навчаються методом проб і помилок. Хоча RL може підвищити продуктивність, він часто вимагає значної переробки коду, що перешкоджає прийняттю. Patronus AI вирішує цю проблему, запроваджуючи «регулятор навчальної програми», який динамічно змінює складність навчання, щоб утримувати агентів, не перевантажуючи їх. Мета полягає в тому, щоб знайти «приємне місце» — навчальні дані, які не є ані надто простими, ані надто складними для оптимального навчання.
Запобігання обходу системи винагород і забезпечення постійного вдосконалення
Постійною проблемою в RL є «обхід винагороди», коли агенти використовують лазівки замість вирішення проблем. Генеративне моделювання пом’якшує цю проблему, перетворюючи навчальне середовище на рухому мішень. Через постійну зміну умов система не дозволяє агентам запам’ятовувати статичні уразливості. Patronus AI також представив Open Recursive Self-Improvement (ORSI), що дозволяє агентам безперервно навчатися без повного перенавчання.
Швидке зростання та стратегічне розширення
Patronus AI повідомляє про зростання доходів у 15 разів завдяки попиту на нову лінійку продуктів «RL Environments». Компанія виходить за рамки інструментів оцінювання, надаючи комплексну навчальну інфраструктуру для розробників ШІ та підприємств. Каннаппан стверджує, що навіть великі лабораторії штучного інтелекту, такі як OpenAI, Anthropic і Google, виграють від ліцензування спеціалізованих навчальних середовищ, оскільки непрактично створювати їх власними силами в різних доменах.
Майбутнє навчання ШІ
Patronus AI передбачає майбутнє, в якому всі робочі процеси людини перетворюються на структуровані системи навчання для AI. Компанія описує це як змагання за контроль над середовищем, у якому навчаються агенти штучного інтелекту, стверджуючи, що різниця між навчанням та оцінюванням стає все більш розмитою. Розробка динамічного, адаптивного навчального середовища — це вже не просто технічне вдосконалення, а стратегічна необхідність для формування майбутнього штучного інтелекту.
Перехід до генеративного моделювання є парадигмальним зрушенням у розвитку ШІ. У той час як такі конкуренти, як Microsoft і NVIDIA, також виходять на ринок, Patronus AI зосередилася на адаптивних навчальних середовищах і позиціонує компанію як ключового гравця в наступному поколінні навчання ШІ.
