30 May 2025, 00:41
Hume представив EVI 3 і пропонує налаштовувати голоси ШІ для різних сфер
- Модель EVI 3 дозволяє швидко створювати унікальні голоси для ШІ на основі опису користувача.
- Внутрішні тести показали перевагу EVI 3 над аналогами за емоційною виразністю та швидкістю.
- API для розробників стане доступним найближчим часом, а тарифні плани залишаються гнучкими.
Про це повідомляють ZDNet, VentureBeat.
29 травня 2025 року компанія Hume анонсувала нову версію свого голосового ШІ — Empathic Voice Interface (EVI 3). Модель дозволяє користувачам створювати власні голоси за допомогою простого опису бажаних характеристик. EVI 3 реагує на емоції співрозмовника і може модулювати інтонацію під час розмови.
Модель орієнтована на бізнес, розробників і креаторів. Її можна використовувати у підтримці клієнтів, створенні віртуальних помічників, озвучці аудіокниг, іграх та інших проєктах. Доступ до демо-версії EVI 3 вже відкритий на сайті Hume і в додатку для iOS. Для розробників API буде доступний найближчими тижнями.
Внутрішні тести компанії продемонстрували, що EVI 3 перевершує GPT-4o та Google Gemini Live за природністю, емоційністю, швидкістю відповіді і розпізнаванням емоцій. Модель забезпечує низьку затримку (приблизно 300 мілісекунд) й підтримує англійську та іспанську мови з планами розширення.
Hume не пропонує функцію клонування голосу у EVI 3, але працює над її впровадженням у іншому продукті — Octave. Основний акцент робиться на гнучкому налаштуванні голосу і емоційній взаємодії.
Вартість доступу до EVI 3 через API ще не оголошена. Для інших продуктів компанії діє гнучка тарифна сітка, включаючи безкоштовний тариф для невеликих обсягів тексту й корпоративні плани для великих користувачів.
Теги: Технології/ШІ