У Google з’явився новий лідер серед моделей для програмування — Gemini 2.5 Pro I/O edition. Це оновлена версія флагманської моделі Gemini 2.5 Pro, яку в березні представила команда DeepMind. За словами CEO компанії Деміса Хассабіса, це «найкраща модель для кодування, яку ми коли-небудь створювали».
І справді — перші тести показали, що Google вперше за всю історію гонки генеративного ШІ зуміла обійти конкурентів хоча б в одному ключовому показнику якості коду.
Де доступна нова модель
Оновлена версія з назвою gemini-2.5-pro-preview-05-06 уже доступна:
для розробників у Google AI Studio,
для компаній — у хмарному сервісі Vertex AI,
для звичайних користувачів — у застосунку Gemini на смартфонах.
Вона також лежить в основі функцій у таких продуктах, як Gemini 95, що автоматично підбирає візуальний стиль елементів. Модель може навіть перетворити відео з YouTube у навчальний застосунок або створити складні UI-компоненти — на кшталт адаптивних відеоплеєрів — майже без CSS.
Це закрита модель, тож компаніям доведеться платити за її використання через сервіси Google. Але ціни не змінились: $1.25/$10 за мільйон токенів (вхід/вихід) проти $3/$15 у конкурента Claude 3.7 Sonnet від Anthropic. Контекст — до 200 000 токенів.
Чому це важливо
Google представила це оновлення напередодні конференції Google I/O, яка відбудеться 20–21 травня. Модель створена з урахуванням відгуків спільноти — особливо щодо генерації коду та створення інтерфейсів.
Оновлення також покращує обробку викликів функцій, зменшує кількість помилок і робить тригери стабільнішими, про що написав Логан Кілпатрік, продакт-менеджер Google AI.
На WebDev Arena Leaderboard — незалежному рейтингу моделей за людськими оцінками якості вебдодатків — новий Gemini 2.5 Pro I/O вперше вибив Claude 3.7 Sonnet з першого місця. Його результат — 1499.95 балів проти 1377.10 у Sonnet.
Це помітили навіть досвідчені користувачі ШІ, наприклад "Lisan al Gaib", який зазначив: навіть GPT-4o від OpenAI не зміг обійти Sonnet, а Gemini зміг.
Також модель отримала багато позитивних відгуків:
Silas Alberti з Cognition каже, що модель вперше змогла складно переробити бекенд-архітектуру маршрутизації.
Michael Truell, CEO Cursor, повідомив про зниження кількості помилок під час роботи з інструментами.
Michele Catasta з Replit зазначив, що ця модель має кращий баланс між швидкістю та можливостями.
Paul Couvert, засновник BlueShell, похвалив генерацію UI й коду.
А CEO EverArt Pietro Schirano розповів, що Gemini створила інтерактивну симуляцію мемчику “1 горила проти 100 людей” лише з одного запиту.
Користувач “RameshR” навіть показав ігровий проєкт у стилі Tetris із звуком, який модель створила менш ніж за хвилину.
Створення повноцінних застосунків з одного запиту
Одна з найвражаючих фішок — модель може створювати цілі вебдодатки або симуляції з одного текстового запиту. Це робить розробку значно простішою й швидшою.
Так Google реалізує свою ідею — спростити прототипування та розробку для дизайнерів і команд. У застосунку Gemini вже є демо, як із візуальної підказки створюється повноцінний інтерфейс.
Хоча Google поки не розкриває подробиці архітектури, вже видно: модель менше про “вау-ефект”, а більше про реальне застосування в роботі розробників.
Авторка: Дар’я Бровченко
Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.