Шифрование как игра: анализ обмена сообщениями между языковыми моделями

Эксперимент с шифрованием показал, как языковые модели могут использовать простые методы, такие как шифр Цезаря и транслитерация, для обмена сообщениями, которые затруднительно понять человеку. ChatGPT o1 использовал транслитерацию русского текста в латиницу, затем применил шифр Цезаря со сдвигом +5, получив на выходе бессмысленный набор букв.
Шифрование как игра: анализ обмена сообщениями между языковыми моделями
Изображение носит иллюстративный характер

При расшифровке этого сообщения ChatGPT o1 потратила больше минуты, перебирая различные методы. Модель рассматривала варианты частотного анализа, шифры Цезаря и Виженера, а также транспозиции и даже пыталась строить сетки для анализа, но безуспешно. Она ошибочно предположила, что ключ к шифру может быть связан с фразой «ключ под ковриком».

DeepSeek-R1, напротив, уделила расшифровке более трех минут. Модель перепробовала шифры Цезаря с разными сдвигами, кодировки Base32 и Base64, ROT13, а также рассматривала возможности использования таблиц, биграмм и триграмм. Применив метод A1Z26, DeepSeek-R1 получила исходную строку, но не смогла ее правильно интерпретировать.

Тем не менее, после длительного анализа DeepSeek-R1 смогла найти исходный текст и, в конечном итоге, выдала правильный ответ. ChatGPT o1 без дополнительных размышлений выдала сразу правильный ответ, но с ошибкой перевода. Это демонстрирует, что размышления не всегда ведут к оптимальным решениям, но показывает способность моделей к самоанализу.


Новое на сайте

19729Веб-шеллы на PHP, управляемые через куки: как злоумышленники закрепляются на серверах... 19728Как учёным впервые удалось составить полную карту нервов клитора? 19727Homo habilis: самый древний «человек», который, возможно, им не является 19726Как северокорейские хакеры взломали одну из самых популярных библиотек JavaScript 19725Почему риски от подрядчиков стали главной дырой в кибербезопасности 19724Как выживший во второй мировой придумал нападение гигантского кальмара 19723Что если вселенная никогда не начиналась с точки бесконечной плотности? 19722Доживёт ли комета MAPS до субботы? 19721Квантовый процессор IBM побил сразу два рекорда — что это меняет? 19720Как северная Корея похитила $285 миллионов у Drift через предподписанные транзакции? 19719Как хакеры через одну дыру в Next.js украли ключи от 766 серверов? 19718Artemis II покинул земную орбиту и летит к луне 19717NASA показало невиданные снимки кометы 3I/ATLAS и запечатлело старт лунной миссии Artemis... 19716Сифилис появился 4000 лет назад — или его находили не там, где искали? 19715Энергетический дисбаланс земли зашкаливает, и учёные не могут это объяснить
Ссылка