UnpressAI

30 May 2025, 00:46

DeepSeek оновив R1 і випередив конкурентів за показниками

Про це повідомляють Mezha, TechCrunch, VentureBeat.

29 травня 2025 року китайський стартап DeepSeek представив оновлену версію свого моделі штучного інтелекту для міркувань — R1-0528. Ця модель досягла значних результатів у тестах на розв'язання складних математичних, програмних і загальноосвітніх завдань, майже зрівнявшись із флагманськими моделями OpenAI o3 та Google Gemini 2.5 Pro.

Оновлений R1-0528 доступний на платформі Hugging Face з відкритою MIT-ліцензією, що дозволяє комерційне використання і гнучке налаштування під потреби розробників. Модель отримала нові функції, зокрема підтримку JSON-формату та виклику функцій, а також зменшила рівень "галюцинацій".

Значно покращилися показники на бенчмарках: точність на тесті AIME 2025 піднялася з 70% до 87,5%, а на LiveCodeBench — з 63,5% до 73,3%. Крім того, DeepSeek випустив компактну дистильовану версію R1-0528-Qwen3-8B, яка може працювати на одній сучасній відеокарті та перевершує аналогічні моделі від Google та Alibaba за результатами окремих тестів.

У той же час, дослідники відзначають, що R1-0528 стала найбільш цензурованою з усіх моделей DeepSeek щодо запитань на чутливу політичну тематику, зокрема щодо критики уряду Китаю. Законодавство КНР вимагає від місцевих компаній впроваджувати суворі інформаційні обмеження в штучному інтелекті.

DeepSeek планує незабаром представити нове покоління моделей — R2.

Теги: Технології/ШІ

Статті на цю тему:

  • venturebeat.com - DeepSeek R1-0528 arrives in powerful open source challenge to OpenAI o3 and Google Gemini 2.5 Pro
  • techcrunch.com - DeepSeek’s updated R1 AI model is more censored, test finds
  • techcrunch.com - DeepSeek’s distilled new R1 AI model can run on a single GPU
  • mezha.media - DeepSeek has improved its R1 reasoning model to better compete with OpenAI