UnpressAI

11 Jun 2025, 20:03

OpenAI випустила o3-pro та підвищила точність ШІ-моделей

Про це повідомляють Mezha, Ars Technica.

OpenAI оголосила про запуск нової моделі штучного інтелекту o3-pro 10 червня 2025 року. Вона стала доступною для користувачів ChatGPT Pro і Team, замінивши попередню o1-pro. Розробники також знизили вартість використання API: $20 за мільйон вхідних токенів і $80 за мільйон вихідних, що на 87% дешевше, ніж у o1-pro.

o3-pro створена для вирішення завдань, які вимагають послідовного логічного мислення: у математиці, фізиці, програмуванні. Модель використовує ланцюговий підхід до розв'язування проблем, покращуючи точність і повноту відповідей. Вона підтримує інструменти для веб-пошуку, аналізу файлів, зображень, Python та персоналізованої пам'яті. Водночас, її робота повільніша, ніж у попередників, і наразі відсутні деякі функції, наприклад створення зображень.

За результатами тестів, o3-pro перевершила інші моделі: на математичному іспиті AIME 2024 досягла 93% успішності, а на науковому GPQA Diamond — 84%. Фахівці відзначили її кращу здатність до виконання інструкцій, ясність та точність відповідей у різних сферах.

Попри покращення, модель має обмеження: вона не усуває всі помилки, а її "міркування" базується на пошуку шаблонів у навчальних даних, а не на справжньому логічному аналізі. Дослідники вказують, що навіть складні задачі можуть призводити до помилок, оскільки модель не коригує власні хибні підходи. Водночас, інтеграція додаткових інструментів (наприклад, калькуляторів чи систем верифікації) допомагає підвищити точність у складних завданнях.

Теги: Технології/ШІ

Статті на цю тему:

  • mezha.media - OpenAI launches o3-pro, its most powerful AI model
  • arstechnica.com - With the launch of o3-pro, let’s talk about what AI “reasoning” actually does
  • www.cnet.com - OpenAI Launches Improved Version of Latest Reasoning Model. Here's What It's Best For
  • arstechnica.com - New Apple study challenges whether AI models truly “reason” through problems
  • arstechnica.com - OpenAI announces o3 and o3-mini, its next simulated reasoning models
  • arstechnica.com - OpenAI’s new “reasoning” AI models are here: o1-preview and o1-mini