Компанія ElevenLabs, відома як інноваційний стартап у сфері голосових технологій, презентувала масштабне оновлення своєї платформи — Conversational AI 2.0. Рішення створене для бізнесу й допомагає автоматизувати спілкування з клієнтами через кол-центри, служби підтримки та маркетинг.
Нова версія пропонує низку передових функцій, завдяки яким голосові агенти звучать ще природніше, краще розуміють співрозмовника та дотримуються ритму живого діалогу.
Оновлення вийшло лише через чотири місяці після релізу першої версії. І що цікаво — всього на день пізніше після того, як конкурент ElevenLabs, компанія Hume, анонсувала власну модель EVI 3. У той же час на ринку почали з’являтися відкриті голосові AI-моделі, що спонукало деяких експертів засумніватися у подальших перспективах ElevenLabs. Але новий реліз переконливо доводить: компанія продовжує задавати темп в індустрії.
За словами інженера ElevenLabs Йозефа Марка, версія 2.0 суттєво випереджає попередню та встановлює нові стандарти голосової взаємодії.
Ключовим оновленням став механізм чергування реплік, що дає змогу агенту правильно визначати момент для відповіді. Система в реальному часі аналізує паузи, вагання й заповнювачі на кшталт «ее», «гм», аби уникнути переривань або затягнутих пауз.
Така динаміка значно покращує досвід взаємодії — особливо в службах підтримки, де важливо не лише швидко відповідати, а й звучати природно.
Автоматичне розпізнавання мови
Conversational AI 2.0 отримала інтегроване визначення мови, яке дозволяє вести багатомовні розмови без додаткових налаштувань.
Агент миттєво визначає, якою мовою говорить користувач, і продовжує діалог тією ж мовою. Це особливо актуально для міжнародних компаній, що прагнуть забезпечити однакову якість обслуговування для різних аудиторій.
Доступ до знань у реальному часі
У новій версії з’явилася підтримка Retrieval-Augmented Generation (RAG) — це означає, що голосовий агент може звертатися до зовнішніх баз знань і миттєво повертати релевантну інформацію.
У медичній сфері, наприклад, це дозволяє асистенту отримувати клінічні рекомендації напряму з внутрішніх баз даних. У службах підтримки — надавати точну інформацію про продукти без затримок.
Водночас RAG працює з мінімальною затримкою та з урахуванням конфіденційності даних.
Один агент — багато каналів
Платформа стала мультимодальною, тобто підтримує голосову, текстову або комбіновану взаємодію. Це зменшує навантаження на розробників: достатньо один раз налаштувати агента, і він зможе працювати в різних каналах.
Окрім того, тепер один голосовий агент може мати кілька “персонажів” — корисно для створення інтерактивного контенту, навчання чи маркетингових сценаріїв.
Масові вихідні дзвінки
З новою функцією стала можливість масових вихідних дзвінків — бізнеси можуть одночасно запускати сотні або тисячі персоналізованих розмов. Це ефективне рішення для опитувань, розсилок або інформування клієнтів.
Високі стандарти безпеки
Conversational AI 2.0 створено з урахуванням вимог до безпеки даних: платформа відповідає стандарту HIPAA, що критично важливо для медичних застосунків, і підтримує зберігання даних в межах ЄС, відповідаючи вимогам цифрового суверенітету.
Платформа легко інтегрується з іншими системами, забезпечує високу надійність і готова до використання в регульованих сферах.
Тарифні плани ElevenLabs:
Готовність до нової ери голосових технологій
У презентаційному відео компанія заявляє:
«Потенціал голосового ШІ як ніколи великий. Час будувати — саме зараз.»
ElevenLabs прагне надати бізнесам усі інструменти для створення розумних, контекстно чутливих голосових агентів, які дійсно звучать по-людськи.
Зацікавлені компанії можуть ознайомитися з технічною документацією на сайті, скористатися розробницьким порталом або звернутися до команди продажів для персональної консультації.
Авторка: Дар’я Бровченко
Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.