Можно ли уверенно выявить текст, созданный искусственным интеллектом?

Современные генеративные модели, такие как GPT-4o и Llama3, достигли высокого уровня точности, что затрудняет их обнаружение по классическим метрикам, таким как perplexity. Они способны имитировать различные стили письма, включая подростковый или научный, делая их менее отличимыми от человеческих текстов.
Можно ли уверенно выявить текст, созданный искусственным интеллектом?
Изображение носит иллюстративный характер

Для обнаружения ИИ-контента часто используются признаки, такие как повторяющиеся фразы, шаблонные структуры предложений и монотонный тон, хотя эти признаки могут проявляться и в текстах, созданных людьми, особенно в случае выгорания или написания текстов на узкоспециализированные темы.

Существуют сервисы для детекции ИИ-текстов, например, GPTZero, которые используют комбинацию лингвистических признаков и метрик, таких как perplexity и burstiness. В то же время, есть инструменты, такие как Undetectable AI, которые стремятся «обмануть» детекторы, переформатируя ИИ-тексты, вызывая постоянную гонку между методами обнаружения и маскировки.

Таким образом, хотя некоторые признаки могут указывать на ИИ-текст, особенно в случаях использования устаревших моделей или отсутствия редактирования человеком, надежная автоматическая детекция, работающая в 100% случаев, на данный момент не существует, и вопрос идентификации ИИ-контента остается открытым.


Новое на сайте

19209Как беспрецедентный бунт чернокожих женщин в суде Бостона разрушил планы рабовладельцев? 19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран... 19200Как простое открытие репозитория в Claude Code позволяет хакерам получить полный контроль... 19199Зачем киберсиндикат SLH платит женщинам до 1000 долларов за один телефонный звонок в... 19198Устранение слепых зон SOC: переход к доказательной сортировке угроз для защиты бизнеса 19197Скрытые бэкдоры в цепочках поставок по: атаки через вредоносные пакеты NuGet и npm 19196Как абсолютная самоотдача, отказ от эго и физиологическое переосмысление тревоги помогают... 19195Отказ от стратегии гладиаторов как главный драйвер экспоненциального роста корпораций
Ссылка