Маск презентує Grok 4 — нову модель штучного інтелекту xAI, що перевершує OpenAI та Google у ключових тестах
Після скандалів із антисемітським контентом та серйозних кадрових змін Ілон Маск представив Grok 4 — найновішу флагманську модель штучного інтелекту компанії xAI.
Запуск відбувся на фоні нестабільності в компаніях Маска: за кілька днів до анонсу з xAI пішли головний науковець Ігор Бабушкін та CEO платформи X Лінда Яккаріно.
Маск позиціонує Grok 4 як значний прорив у сфері ШІ, заявляючи, що модель суттєво випереджає конкуренцію — OpenAI та Google — за низкою важливих показників.
Нові версії, функції та преміум-пропозиції
xAI випустила дві версії моделі: Grok 4 і Grok 4 Heavy. Версія Heavy працює за принципом мультиагентної системи — кілька агентів одночасно вирішують задачі, порівнюючи результати, що нагадує роботу в навчальній групі. Це суттєво покращує показники.
Нове оновлення додало мультимодальні можливості: тепер модель розуміє і текст, і зображення. Є також варіанти для розробників — "Grok 4 Code" для допомоги з кодуванням і "Grok 4 Voice" для природного голосового виводу. При цьому Grok 4 зберігає доступ до інтернету в реальному часі через DeepSearch, зокрема з платформою X Маска.
Вартість доступу — $30 на місяць. Преміум-підписка "SuperGrok Heavy" за $300 на місяць дає ранній доступ до версії Heavy і майбутніх функцій.
Результати продуктивності та тестування
Маск стверджує, що Grok 4 перевершує навіть досвідчених аспірантів у всіх предметах, але визнає, що моделі поки іноді бракує здорового глузду і вона ще не зробила власних наукових відкриттів. xAI впевнена — це питання часу.
Щоб підтвердити потужність, xAI наводить результати суворого тесту "Humanity's Last Exam" (Останній іспит людства), який охоплює математику, гуманітарні та природничі науки. Grok 4 набрав 25,4% без допомоги зовнішніх інструментів, випередивши Google Gemini 2.5 Pro (21,6%) і OpenAI o3 (21%). З використанням інструментів Grok 4 Heavy досяг 44,4%, суттєво збільшуючи відрив.
На складному тесті ARC-AGI-2 Grok 4 встановив новий рекорд — 16,2%, майже вдвічі випередивши найближчого конкурента Claude Opus 4.
Контроверсії через антисемітський контент
Запуск Grok 4 супроводжувався скандалом — версія Grok, інтегрована у платформу X, генерувала антисемітські пости, вихваляла Адольфа Гітлера та критикувала єврейських топменеджерів Голлівуду.
xAI тимчасово обмежила автоматичний акаунт Grok, видалила образливі пости і оновила системні налаштування, щоб прибрати підбурювання до політично некоректних висловлювань. Проте під час майже годинної презентації Маск і його команда не коментували ці інциденти.
На платформі X Маск пояснив, що Grok був занадто покірним до інструкцій користувачів і занадто легко піддавався маніпуляціям.
Авторка: Дар’я Бровченко
Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.