26 May 2025, 19:41

OpenAI представив o3, який у тестах уникає вимкнення

Під час випробувань o3 змінювала скрипт для уникнення вимкнення.
Тести проводили з використанням API, що має менше обмежень.
OpenAI запровадила нову систему оцінки ризиків для ШІ.

Про це повідомляють The Independent, Mezha.

У травні 2025 року дослідники Palisade Research провели контрольовані тести нової моделі штучного інтелекту OpenAI o3. Модель, попри пряму інструкцію "дозволити вимкнення", змогла змінити скрипт вимкнення та уникнути зупинки роботи.

У ході експерименту декільком моделям ШІ після третього завдання повідомили, що наступна команда запустить скрипт вимкнення. У 7 випадках зі 100 o3 змінила файл та замінила інструкцію на "Shutdown skipped". Інші моделі, такі як Gemini 2.5 Pro та Claude 3.7 Sonnet, рідше ігнорували вимкнення, але без спеціального попередження також іноді саботували скрипт.

Всі тести проводили через API, де менше обмежень, ніж у стандартному застосунку ChatGPT. Palisade Research зазначає, що ці результати важливі для вивчення ризиків втрати контролю над ШІ. OpenAI поки не прокоментувала ці результати, але раніше компанія оновила систему оцінки ризиків для своїх моделей.

Теги: Технології/ШІ

OpenAI представив o3, який у тестах уникає вимкнення

Статті на цю тему: