Український клуб штучного інтелекту: Ілон Маск презентував Grok 4, ШІ-модель, що обігнала OpenAI та Google

пʼятниця, 11 липня 2025 р.

Ілон Маск презентував Grok 4, ШІ-модель, що обігнала OpenAI та Google

Маск презентує Grok 4 — нову модель штучного інтелекту xAI, що перевершує OpenAI та Google у ключових тестах

Після скандалів із антисемітським контентом та серйозних кадрових змін Ілон Маск представив Grok 4 — найновішу флагманську модель штучного інтелекту компанії xAI.

Запуск відбувся на фоні нестабільності в компаніях Маска: за кілька днів до анонсу з xAI пішли головний науковець Ігор Бабушкін та CEO платформи X Лінда Яккаріно.

Маск позиціонує Grok 4 як значний прорив у сфері ШІ, заявляючи, що модель суттєво випереджає конкуренцію — OpenAI та Google — за низкою важливих показників.

Нові версії, функції та преміум-пропозиції

xAI випустила дві версії моделі: Grok 4 і Grok 4 Heavy. Версія Heavy працює за принципом мультиагентної системи — кілька агентів одночасно вирішують задачі, порівнюючи результати, що нагадує роботу в навчальній групі. Це суттєво покращує показники.

Нове оновлення додало мультимодальні можливості: тепер модель розуміє і текст, і зображення. Є також варіанти для розробників — "Grok 4 Code" для допомоги з кодуванням і "Grok 4 Voice" для природного голосового виводу. При цьому Grok 4 зберігає доступ до інтернету в реальному часі через DeepSearch, зокрема з платформою X Маска.

Вартість доступу — $30 на місяць. Преміум-підписка "SuperGrok Heavy" за $300 на місяць дає ранній доступ до версії Heavy і майбутніх функцій.

Результати продуктивності та тестування

Маск стверджує, що Grok 4 перевершує навіть досвідчених аспірантів у всіх предметах, але визнає, що моделі поки іноді бракує здорового глузду і вона ще не зробила власних наукових відкриттів. xAI впевнена — це питання часу.

Щоб підтвердити потужність, xAI наводить результати суворого тесту "Humanity's Last Exam" (Останній іспит людства), який охоплює математику, гуманітарні та природничі науки. Grok 4 набрав 25,4% без допомоги зовнішніх інструментів, випередивши Google Gemini 2.5 Pro (21,6%) і OpenAI o3 (21%). З використанням інструментів Grok 4 Heavy досяг 44,4%, суттєво збільшуючи відрив.

На складному тесті ARC-AGI-2 Grok 4 встановив новий рекорд — 16,2%, майже вдвічі випередивши найближчого конкурента Claude Opus 4.

Контроверсії через антисемітський контент

Запуск Grok 4 супроводжувався скандалом — версія Grok, інтегрована у платформу X, генерувала антисемітські пости, вихваляла Адольфа Гітлера та критикувала єврейських топменеджерів Голлівуду.

xAI тимчасово обмежила автоматичний акаунт Grok, видалила образливі пости і оновила системні налаштування, щоб прибрати підбурювання до політично некоректних висловлювань. Проте під час майже годинної презентації Маск і його команда не коментували ці інциденти.

На платформі X Маск пояснив, що Grok був занадто покірним до інструкцій користувачів і занадто легко піддавався маніпуляціям.

Авторка: Дар’я Бровченко

Джерело

Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.

Український клуб штучного інтелекту

пʼятниця, 11 липня 2025 р.

Ілон Маск презентував Grok 4, ШІ-модель, що обігнала OpenAI та Google

Немає коментарів:

Дописати коментар

Архів блогу

Загальна кількість переглядів сторінки

пʼятниця, 11 липня 2025 р.

Ілон Маск презентував Grok 4, ШІ-модель, що обігнала OpenAI та Google

Немає коментарів:

Дописати коментар

пʼятниця, 11 липня 2025 р.