Компанія OpenAI представила нові інструменти, які допоможуть розробникам і підприємствам створювати AI-агентів — автоматизовані системи, які здатні самостійно виконувати завдання, використовуючи власні моделі штучного інтелекту та технологічні рішення компанії.
Нові інструменти стали частиною Responses API — інтерфейсу, який дозволяє бізнесу розробляти індивідуальних AI-агентів для пошуку інформації в інтернеті, аналізу корпоративних документів та навігації вебресурсами. Цей API фактично замінює Assistants API, який OpenAI планує поступово вивести з експлуатації у першій половині 2026 року.
Популярність AI-агентів стрімко зростає, хоча технологічна індустрія досі не дала чіткого визначення цьому поняттю. Нещодавно китайський стартап Butterfly Effect привернув увагу до своєї платформи AI-агентів Manus, яка швидко стала вірусною, але не виправдала обіцянок розробників.Це означає, що для OpenAI зараз критично важливо правильно реалізувати концепцію AI-агентів.
"Продемонструвати роботу агента легко", — зазначає Олів'є Годемент, керівник API-продуктів OpenAI, в інтерв'ю TechCrunch.
"Але масштабувати його та зробити зручним для користувачів — дуже складно".
Раніше цього року OpenAI інтегрувала два AI-агенти у ChatGPT: Operator, який допомагає користувачам навігувати сайтами, та deep research, що генерує аналітичні звіти. Проте обидва інструменти поки що мають обмежені можливості з точки зору автономності.
Що пропонує новий API?
Responses API відкриває доступ до технологій, які лежать в основі ChatGPT Search — нового пошукового інструменту OpenAI. Зокрема, розробники можуть використовувати дві AI-моделі:
GPT-4o search
GPT-4o mini search
Ці моделі сканують веб, шукають відповіді на запити та генерують відповіді з посиланнями на джерела. OpenAI стверджує, що вони мають високу точність. За внутрішнім тестом SimpleQA, який оцінює здатність моделей відповідати на короткі інформаційні запити, GPT-4o search набрав 90%, а GPT-4o mini search — 88%. Для порівняння, новітня модель GPT-4.5 показала лише 63%.
Окрім вебпошуку, API також має функцію файлового пошуку, що дозволяє компаніям швидко знаходити необхідну інформацію у внутрішніх базах даних. Важливо, що OpenAI не використовуватиме ці дані для навчання своїх моделей.
Ще одна ключова новинка — Computer-Using Agent (CUA), модель, яка дає змогу автоматизувати дії на комп’ютері, зокрема введення даних або роботу з додатками. Бізнес-клієнти зможуть запускати CUA на власних серверах, тоді як споживча версія в Operator працюватиме лише у вебсередовищі.
Технологічні виклики
Попри обіцянки OpenAI, Responses API не вирішує всіх проблем AI-агентів.
Навіть найточніші AI-пошуковики не є ідеальними: GPT-4o search все ще помиляється у 10% випадків. Крім того, такі інструменти мають труднощі з короткими запитами, як-от "рахунок гри Lakers сьогодні", а посилання на джерела можуть бути ненадійними.
OpenAI також визнає, що CUA поки що не забезпечує стабільної автоматизації роботи з операційними системами, і його результати можуть містити помилки.
Нові можливості для розробників
Разом із Responses API OpenAI випускає Agents SDK — набір відкритих інструментів для інтеграції AI-моделей у корпоративні системи, а також контролю та налагодження агентів. Цей SDK став продовженням проєкту Swarm, який OpenAI запустила наприкінці 2024 року для управління взаємодією між кількома AI-агентами.
Олів'є Годемент вважає, що у 2025 році OpenAI зможе зменшити розрив між демонстраціями AI-агентів та їх реальним застосуванням:
"Агенти — це найвпливовіша технологія штучного інтелекту, яка тільки починає розкривати свій потенціал".
Цю думку підтверджує і CEO OpenAI Сем Альтман, який у січні заявив, що 2025 стане роком AI-агентів у робочому середовищі.
Чи справдяться ці прогнози — покаже час.
Авторка: Дар’я Бровченко
Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.