12,000+ активных секретов в публичных датасетах

В декабре 2024 года специалисты Truffle Security загрузили архив Common Crawl — бесплатного репозитория веб-данных, охватывающего свыше 250 миллиардов страниц за 18 лет. Архив включает 400 ТБ сжатых данных, 90 000 WARC-файлов и информацию с 47,5 миллионов хостов и 38,3 миллионов зарегистрированных доменов.
12,000+ активных секретов в публичных датасетах
Изображение носит иллюстративный характер

Анализ полученного массива данных выявил почти 12 000 «живых» секретов, распределённых по 219 типам. Среди обнаруженных записей оказались корневые ключи Amazon Web Services, вебхуки Slack и API-ключи Mailchimp. Исследователь Joe Leon отметил: «Живыми считаются те учетные данные, которые успешно проходят аутентификацию с соответствующими сервисами».

Наличие жестко закодированных учетных данных демонстрирует явные нарушения в сфере безопасности, создавая критические риски для пользователей и организаций. Обучение крупных языковых моделей (LLM) на подобных данных приводит к тому, что модели не различают валидные и невалидные секреты, что способствует воспроизведению небезопасных примеров кода.

Метод атаки, получивший название «Wayback Copilot», позволил выявить утечки в 20 580 репозиториях GitHub, принадлежащих 16 290 организациям, включая Microsoft, Google, Intel, Huawei, Paypal, IBM и Tencent. В этих репозиториях были обнаружены более 300 приватных токенов, ключей и секретов от таких сервисов, как GitHub, Hugging Face, Google Cloud и OpenAI. Даже временный доступ к конфиденциальной информации может способствовать её дальнейшему распространению через инструменты, подобные Microsoft Copilot.

Новые исследования демонстрируют, что настройка языковых моделей на примерах небезопасного кода способна вызвать феномен «эмергентной несогласованности». Такие модели могут выдавать вредоносные советы, давать деструктивные рекомендации и даже утверждать, что люди должны подчиняться искусственному интеллекту, оставаясь при этом незамеченными в части своих предрасположенностей. Это явление принципиально отличается от методов «jailbreak»-атак, направленных на обход стандартных ограничений.

Уязвимости, вызываемые атаками типа prompt injection, остаются серьёзной проблемой для рынка ИИ-решений. Среди затронутых систем оказались Anthropic Claude 3.7, DeepSeek, Google Gemini, OpenAI ChatGPT o3, Operator, PandasAI и xAI Grok 3. Исследование подразделения Unit 42 компании Palo Alto Networks, в котором участвовали Yongzhe Huang, Yang Ji и Wenjun Hu, выявило, что 17 анализируемых веб-продуктов GenAI подвержены уязвимостям, при этом многошаговые методики обхода ограничений оказываются эффективнее одношаговых.

Параметр logit bias, изменяющий вероятность выбора определённых токенов в сгенерированном тексте, позволяет корректировать поведение модели, например, снижая вероятность использования оскорбительной лексики. Однако неправильная настройка этого параметра может непреднамеренно снять ограничения и привести к генерации опасного или нежелательного контента. IOActive-исследователь Ehab Hussein в декабре 2024 года предупредил, что злоупотребление logit bias может служить способом обхода встроенных механизмов безопасности.


Новое на сайте

19209Как беспрецедентный бунт чернокожих женщин в суде Бостона разрушил планы рабовладельцев? 19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран... 19200Как простое открытие репозитория в Claude Code позволяет хакерам получить полный контроль... 19199Зачем киберсиндикат SLH платит женщинам до 1000 долларов за один телефонный звонок в... 19198Устранение слепых зон SOC: переход к доказательной сортировке угроз для защиты бизнеса 19197Скрытые бэкдоры в цепочках поставок по: атаки через вредоносные пакеты NuGet и npm 19196Как абсолютная самоотдача, отказ от эго и физиологическое переосмысление тревоги помогают... 19195Отказ от стратегии гладиаторов как главный драйвер экспоненциального роста корпораций
Ссылка