середа, 16 квітня 2025 р.

OpenAI представила нову лінійку моделей GPT-4.1 зі спеціалізацією на програмуванні

OpenAI оголосила про запуск нової серії штучного інтелекту GPT-4.1. У лінійку входять моделі GPT-4.1, GPT-4.1 mini та GPT-4.1 nano — і всі вони, за заявою компанії, демонструють високу ефективність у програмуванні та виконанні інструкцій.

Моделі доступні через API OpenAI, однак не інтегровані в ChatGPT. Вони мультимодальні й підтримують контекстне вікно до 1 мільйона токенів, що приблизно дорівнює 750 тисячам слів — довше, ніж роман «Війна і мир».

Конкуренція загострюється

Запуск GPT-4.1 відбувається на тлі активного розвитку аналогічних моделей у конкурентів OpenAI. Google нещодавно представила Gemini 2.5 Pro — теж із контекстним вікном у мільйон токенів і високими результатами в тестах для розробників. Схожі показники демонструють Claude 3.7 Sonnet від Anthropic та оновлена модель V3 від китайського стартапу DeepSeek.

Світові техногіганти, включно з OpenAI, прагнуть створити AI-інженерів нового покоління — здатних виконувати складні завдання з розробки програмного забезпечення. Як зазначила фінансова директорка OpenAI Сара Фраєр на саміті в Лондоні, кінцева мета — створити "агентного програміста", який зможе розробляти додатки від початку до кінця, включно з тестуванням, написанням документації та контролем якості.

GPT-4.1

«Ми оптимізували GPT-4.1 для реальних задач на основі зворотного зв’язку від розробників. Зосередились на фронтенд-коді, мінімізації зайвих змін, чіткому дотриманні форматування, структурованості відповідей і послідовності у використанні інструментів», — повідомили в OpenAI у коментарі для TechCrunch.

Ці покращення, на думку компанії, дозволяють створювати AI-агентів, значно ефективніших у виконанні прикладних інженерних завдань. Повноцінна модель GPT-4.1, за словами компанії, перевершує GPT-4o та GPT-4o mini у низці бенчмарків для програмування, включаючи SWE-bench. Водночас GPT-4.1 mini та nano відзначаються меншою точністю, але швидшою роботою та кращою ефективністю. GPT-4.1 nano — найшвидша та найдешевша модель з усіх, які OpenAI створювала коли-небудь.

Ціни

  • GPT-4.1: $2 за 1 млн вхідних токенів / $8 за 1 млн вихідних

  • GPT-4.1 mini: $0.40 / $1.60

  • GPT-4.1 nano: $0.10 / $0.40

За внутрішніми тестами компанії, GPT-4.1 може генерувати більше токенів за раз, ніж GPT-4o (32 768 проти 16 384). У тесті SWE-bench Verified — модель показала результат від 52% до 54.6%. Для порівняння: Gemini 2.5 Pro отримала 63.8%, а Claude 3.7 Sonnet — 62.3%.

У додатковому тестуванні OpenAI перевірила GPT-4.1 за допомогою Video-MME — метрики, що оцінює розуміння відеоконтенту. У категорії "довгі відео без субтитрів" модель досягла найвищого результату — 72%.

Попри вражаючі показники, навіть найкращі моделі на ринку досі можуть допускати критичні помилки — зокрема при написанні коду. Дослідження свідчать, що AI-інструменти часто не лише не виправляють баги, а й створюють нові.

Також OpenAI визнає: чим більший обсяг вхідної інформації, тим менш стабільною стає модель. Наприклад, у внутрішньому тесті OpenAI-MRCR точність GPT-4.1 знизилася з 84% при 8 000 токенів до 50% при 1 мільйоні. Крім того, GPT-4.1 виявилася більш «буквальною» у порівнянні з GPT-4o, що вимагає точніших і чіткіших запитів.

OpenAI продовжує впевнено просуватися в напрямку створення повноцінних AI-розробників. GPT-4.1 — це не революція, але важливий крок до автономного програмного агента. А розробникам — ще один інструмент у скриньку, щоб спростити роботу та збільшити продуктивність.


Авторка: Дар’я Бровченко


Джерело




Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.