30 May 2025, 00:46
DeepSeek оновив R1 і випередив конкурентів за показниками
- Дистильована версія R1-0528-Qwen3-8B підходить для роботи на одній відеокарті та доступна під відкритою ліцензією.
- Розширені можливості інтеграції та нові функції покращують зручність для розробників.
- Дотримання законодавчих вимог Китаю призвело до посилення цензури у відповідях моделі.
Про це повідомляють Mezha, TechCrunch, VentureBeat.
29 травня 2025 року китайський стартап DeepSeek представив оновлену версію свого моделі штучного інтелекту для міркувань — R1-0528. Ця модель досягла значних результатів у тестах на розв'язання складних математичних, програмних і загальноосвітніх завдань, майже зрівнявшись із флагманськими моделями OpenAI o3 та Google Gemini 2.5 Pro.
Оновлений R1-0528 доступний на платформі Hugging Face з відкритою MIT-ліцензією, що дозволяє комерційне використання і гнучке налаштування під потреби розробників. Модель отримала нові функції, зокрема підтримку JSON-формату та виклику функцій, а також зменшила рівень "галюцинацій".
Значно покращилися показники на бенчмарках: точність на тесті AIME 2025 піднялася з 70% до 87,5%, а на LiveCodeBench — з 63,5% до 73,3%. Крім того, DeepSeek випустив компактну дистильовану версію R1-0528-Qwen3-8B, яка може працювати на одній сучасній відеокарті та перевершує аналогічні моделі від Google та Alibaba за результатами окремих тестів.
У той же час, дослідники відзначають, що R1-0528 стала найбільш цензурованою з усіх моделей DeepSeek щодо запитань на чутливу політичну тематику, зокрема щодо критики уряду Китаю. Законодавство КНР вимагає від місцевих компаній впроваджувати суворі інформаційні обмеження в штучному інтелекті.
DeepSeek планує незабаром представити нове покоління моделей — R2.
Теги: Технології/ШІ