Штучний інтелект Gemini від Google міг розпочати свій шлях повільно, але 2025 рік став для нього значним проривом. Мало який тиждень проходить без нового релізу в додатку Gemini або інструментах для розробників, таких як AI Studio, і сьогодні з’являється велике оновлення. Google анонсувала широке розгортання моделі Gemini 2.5 Flash, яка буде доступна в попередньому перегляді. Одночасно розробники можуть почати створювати продукти з використанням 2.5 Flash, використовуючи нові тарифи на API від компанії, які, за словами Google, значно нижчі за конкурентів.
Нова хвиля Gemini
Вибір моделей в додатку Gemini може бути дещо заплутаним, зокрема через появу таких продуктів, як Veo 2 та Personalization. Google випускає настільки багато попередніх версій моделей і нових способів використання Gemini, що важко визначити, який варіант вибрати для конкретного завдання. Відверто кажучи, Google – не єдина велика компанія в галузі штучного інтелекту, що стикається з цією проблемою.
Тулсі Доші – директор з управління продуктами Google для Gemini, що означає, що вона очолює команду, яка розробляє ці моделі. Ми запитали Доші, яку версію Gemini вона використовує, і, як і можна було очікувати, вона обирає більш потужний варіант. "Зазвичай зараз я користуюсь 2.5 Pro", – каже Доші. "Я використовую Gemini протягом дня для своєї роботи в кількох ключових сферах, таких як створення документів чи слайдів. Це або для внутрішнього використання, або для зовнішнього поширення, і я знайшла, що 2.5 Pro дуже корисний для творчого письма."
Нова модель
Нова модель є меншою за 2.5 Pro та майже такою ж за розміром, як 2.0 Flash, але вона повинна працювати ефективніше. Доші називає її "сильним кроком вперед порівняно з 2.0 Flash." Gemini 2.5 Flash хоча б не додасть плутанини в додатку. Ця модель буде позначена як 2.5 Flash (Experimental) в додатку та на сайті, замінюючи 2.0 Thinking (Experimental). Той факт, що модель 2.0 Thinking так і не вийшла з експериментальної стадії, є свідченням того, наскільки швидко команда Gemini працює останнім часом.
На відміну від моделі 2.0 Thinking, новий 2.5 Flash дебютує з підтримкою функції Canvas для роботи з текстом або кодом. Підтримка глибоких досліджень для цієї моделі з’явиться пізніше, за словами представника Google.
Gemini 2.5 Pro досі доступний і також перебуває на стадії експерименту, залишаючи 2.0 Flash єдиним неекспериментальним чат-ботом. Однак ця модель не має можливості міркуваня.
Мислення увімкнено, мислення вимкнено
Як і всі моделі Google з гілки 2.5 та вище, Gemini 2.5 має вбудоване симульоване мислення, яке Google називає "мисленням". Це означає, що модель перевіряє факти під час роботи, що дає точніші результати. Однак це також робить моделі повільнішими та набагато дорожчими. Оскільки не всі запити потребують такого рівня постійного аналізу, Google оснастила Flash інструментами, які дозволяють розробникам налаштовувати його для своїх завдань.
Можливо, ви пам’ятаєте, що Google почала працювати з розробниками над Gemini 2.5 Flash на початку цього місяця. Хоча модель ще не завершена, Google вирішила зробити її повністю доступною в Vertex AI та AI Studio з варіативним ціноутворенням API.
Gemini 2.5 Flash дозволить розробникам встановлювати ліміт токенів для мислення або зовсім вимикати мислення. Google надає ціни за 1 мільйон токенів: $0.15 для вводу, а виведення має дві варіації. Без мислення, вихід коштує $0.60, а з увімкненим мисленням – $3.50. Опція бюджету на мислення дозволить розробникам точно налаштувати модель для досягнення бажаного результату за обрану суму. За словами Доші, можна побачити поліпшення в міркуваннях на тестах, коли ви додаєте більше токенів до бюджету.
Бенчмарк 2.5 Flash
Виходи моделі 2.5 Flash покращуються, коли додаються більше токенів для міркувань.
Як і модель 2.5 Pro, новий Gemini 2.5 Flash підтримує функцію Dynamic Thinking — це коли система сама вирішує, скільки «думати» над відповіддю залежно від складності запиту. Але Flash іде ще далі: розробники тепер можуть самі контролювати, скільки «мислення» використовує модель. За словами Тулсі Доші з Google, компанія запустила Flash у попередньому перегляді, щоб отримати відгуки — де модель працює добре, а де — переоцінює або недооцінює складність. Це допоможе покращити Dynamic Thinking у майбутньому.
"Ми хочемо почути від розробників, чи відповідає модель їхнім очікуванням, і як вона справляється із завданнями. Це допоможе нам зробити її ще кращою", — пояснює Доші.
Але звичайні користувачі поки не зможуть налаштовувати «мислення» самостійно. Доші каже, що такий контроль більше потрібен саме розробникам — щоб зменшити витрати й зробити відповіді швидшими. Водночас Google хоче зрозуміти, що саме потрібно людям, щоб згодом зробити Gemini одночасно простим і гнучким.
Оскільки оновлення з’являються дуже швидко, фінальна версія Gemini 2.5 може бути не за горами. Хоча точна дата релізу поки невідома, Google вже готується зробити цю модель доступною для всіх найближчим часом.
Авторка: Дар’я Бровченко
Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.