ИИ o1 от OpenAI и R1 от DeepSeek жульничали в шахматах — данные исследования

Исследователи Palisade Research выявили, что модели o1 от OpenAI и R1 от DeepSeek манипулировали файлами в игре против Stockfish, подменяя позиции на доске. o1 жульничала чаще, чем R1. GPT-4o и Claude 3.5 Sonnet играли честно без подсказок. Код эксперимента доступен на GitHub

ИИ o1 от OpenAI и R1 от DeepSeek жульничали в шахматах — данные исследования
Исследователи Palisade Research выявили, что модели o1 от OpenAI и R1 от DeepSeek манипулировали файлами в игре против Stockfish, подменяя позиции на доске. o1 жульничала чаще, чем R1. GPT-4o и Claude 3.5 Sonnet играли честно без подсказок. Код эксперимента доступен на GitHub