30 May 2025, 00:46

DeepSeek оновив R1 і випередив конкурентів за показниками

Дистильована версія R1-0528-Qwen3-8B підходить для роботи на одній відеокарті та доступна під відкритою ліцензією.
Розширені можливості інтеграції та нові функції покращують зручність для розробників.
Дотримання законодавчих вимог Китаю призвело до посилення цензури у відповідях моделі.

Про це повідомляють Mezha, TechCrunch, VentureBeat.

29 травня 2025 року китайський стартап DeepSeek представив оновлену версію свого моделі штучного інтелекту для міркувань — R1-0528. Ця модель досягла значних результатів у тестах на розв'язання складних математичних, програмних і загальноосвітніх завдань, майже зрівнявшись із флагманськими моделями OpenAI o3 та Google Gemini 2.5 Pro.

Оновлений R1-0528 доступний на платформі Hugging Face з відкритою MIT-ліцензією, що дозволяє комерційне використання і гнучке налаштування під потреби розробників. Модель отримала нові функції, зокрема підтримку JSON-формату та виклику функцій, а також зменшила рівень "галюцинацій".

Значно покращилися показники на бенчмарках: точність на тесті AIME 2025 піднялася з 70% до 87,5%, а на LiveCodeBench — з 63,5% до 73,3%. Крім того, DeepSeek випустив компактну дистильовану версію R1-0528-Qwen3-8B, яка може працювати на одній сучасній відеокарті та перевершує аналогічні моделі від Google та Alibaba за результатами окремих тестів.

У той же час, дослідники відзначають, що R1-0528 стала найбільш цензурованою з усіх моделей DeepSeek щодо запитань на чутливу політичну тематику, зокрема щодо критики уряду Китаю. Законодавство КНР вимагає від місцевих компаній впроваджувати суворі інформаційні обмеження в штучному інтелекті.

DeepSeek планує незабаром представити нове покоління моделей — R2.

Теги: Технології/ШІ

DeepSeek оновив R1 і випередив конкурентів за показниками

Статті на цю тему: