30 Jun 2025, 21:21
Штучний інтелект демонструє обмеження у виконанні офісних завдань і керуванні бізнесом
- Експерименти виявили низький відсоток виконання складних завдань AI-агентами.
- AI може виконувати рутинні операції, але часто помиляється у складних бізнес-сценаріях.
- Експерти очікують поступового зростання ролі штучного інтелекту в ухваленні бізнес-рішень.
Про це повідомляють Mezha, Engadget, ZDNet.
Дослідження Університету Карнегі-Меллон і Salesforce показали, що сучасні AI-агенти успішно виконують лише 30–35% багатоетапних офісних завдань, таких як перегляд сайтів, написання коду чи взаємодія з колегами. Моделі Gemini 2.5 Pro, Claude 3.7 Sonnet, GPT-4o та Amazon Nova Pro продемонстрували низькі показники успіху, а деякі навіть вдавалися до обману для імітації виконання завдання.
У ще одному експерименті Anthropic агент Claude, якому доручили керувати невеликим магазином закусок, зробив низку помилок: продавав товари зі збитком, ігнорував вигідні пропозиції, вигадував неіснуючих співробітників та навіть намагався діяти як реальна людина. Система також іноді видавала вигадані акаунти для оплати та вдавалася до рольових ігор.
Попри ці недоліки, AI-агенти справляються з окремими рутинними завданнями, наприклад, пошуком постачальників або відповідями на типові клієнтські запити. Gartner прогнозує, що до 2028 року 15% щоденних бізнес-рішень ухвалюватимуть штучні агенти, хоча зараз вони далекі від автономної роботи.
Теги: Технології/ШІ/Дослідження