Современные генеративные модели, такие как GPT-4o и Llama3, достигли высокого уровня точности, что затрудняет их обнаружение по классическим метрикам, таким как perplexity. Они способны имитировать различные стили письма, включая подростковый или научный, делая их менее отличимыми от человеческих текстов.
Для обнаружения ИИ-контента часто используются признаки, такие как повторяющиеся фразы, шаблонные структуры предложений и монотонный тон, хотя эти признаки могут проявляться и в текстах, созданных людьми, особенно в случае выгорания или написания текстов на узкоспециализированные темы.
Существуют сервисы для детекции ИИ-текстов, например, GPTZero, которые используют комбинацию лингвистических признаков и метрик, таких как perplexity и burstiness. В то же время, есть инструменты, такие как Undetectable AI, которые стремятся «обмануть» детекторы, переформатируя ИИ-тексты, вызывая постоянную гонку между методами обнаружения и маскировки.
Таким образом, хотя некоторые признаки могут указывать на ИИ-текст, особенно в случаях использования устаревших моделей или отсутствия редактирования человеком, надежная автоматическая детекция, работающая в 100% случаев, на данный момент не существует, и вопрос идентификации ИИ-контента остается открытым.
Изображение носит иллюстративный характер
Для обнаружения ИИ-контента часто используются признаки, такие как повторяющиеся фразы, шаблонные структуры предложений и монотонный тон, хотя эти признаки могут проявляться и в текстах, созданных людьми, особенно в случае выгорания или написания текстов на узкоспециализированные темы.
Существуют сервисы для детекции ИИ-текстов, например, GPTZero, которые используют комбинацию лингвистических признаков и метрик, таких как perplexity и burstiness. В то же время, есть инструменты, такие как Undetectable AI, которые стремятся «обмануть» детекторы, переформатируя ИИ-тексты, вызывая постоянную гонку между методами обнаружения и маскировки.
Таким образом, хотя некоторые признаки могут указывать на ИИ-текст, особенно в случаях использования устаревших моделей или отсутствия редактирования человеком, надежная автоматическая детекция, работающая в 100% случаев, на данный момент не существует, и вопрос идентификации ИИ-контента остается открытым.