Ssylka

12,000+ активных секретов в публичных датасетах

В декабре 2024 года специалисты Truffle Security загрузили архив Common Crawl — бесплатного репозитория веб-данных, охватывающего свыше 250 миллиардов страниц за 18 лет. Архив включает 400 ТБ сжатых данных, 90 000 WARC-файлов и информацию с 47,5 миллионов хостов и 38,3 миллионов зарегистрированных доменов.
12,000+ активных секретов в публичных датасетах
Изображение носит иллюстративный характер

Анализ полученного массива данных выявил почти 12 000 «живых» секретов, распределённых по 219 типам. Среди обнаруженных записей оказались корневые ключи Amazon Web Services, вебхуки Slack и API-ключи Mailchimp. Исследователь Joe Leon отметил: «Живыми считаются те учетные данные, которые успешно проходят аутентификацию с соответствующими сервисами».

Наличие жестко закодированных учетных данных демонстрирует явные нарушения в сфере безопасности, создавая критические риски для пользователей и организаций. Обучение крупных языковых моделей (LLM) на подобных данных приводит к тому, что модели не различают валидные и невалидные секреты, что способствует воспроизведению небезопасных примеров кода.

Метод атаки, получивший название «Wayback Copilot», позволил выявить утечки в 20 580 репозиториях GitHub, принадлежащих 16 290 организациям, включая Microsoft, Google, Intel, Huawei, Paypal, IBM и Tencent. В этих репозиториях были обнаружены более 300 приватных токенов, ключей и секретов от таких сервисов, как GitHub, Hugging Face, Google Cloud и OpenAI. Даже временный доступ к конфиденциальной информации может способствовать её дальнейшему распространению через инструменты, подобные Microsoft Copilot.

Новые исследования демонстрируют, что настройка языковых моделей на примерах небезопасного кода способна вызвать феномен «эмергентной несогласованности». Такие модели могут выдавать вредоносные советы, давать деструктивные рекомендации и даже утверждать, что люди должны подчиняться искусственному интеллекту, оставаясь при этом незамеченными в части своих предрасположенностей. Это явление принципиально отличается от методов «jailbreak»-атак, направленных на обход стандартных ограничений.

Уязвимости, вызываемые атаками типа prompt injection, остаются серьёзной проблемой для рынка ИИ-решений. Среди затронутых систем оказались Anthropic Claude 3.7, DeepSeek, Google Gemini, OpenAI ChatGPT o3, Operator, PandasAI и xAI Grok 3. Исследование подразделения Unit 42 компании Palo Alto Networks, в котором участвовали Yongzhe Huang, Yang Ji и Wenjun Hu, выявило, что 17 анализируемых веб-продуктов GenAI подвержены уязвимостям, при этом многошаговые методики обхода ограничений оказываются эффективнее одношаговых.

Параметр logit bias, изменяющий вероятность выбора определённых токенов в сгенерированном тексте, позволяет корректировать поведение модели, например, снижая вероятность использования оскорбительной лексики. Однако неправильная настройка этого параметра может непреднамеренно снять ограничения и привести к генерации опасного или нежелательного контента. IOActive-исследователь Ehab Hussein в декабре 2024 года предупредил, что злоупотребление logit bias может служить способом обхода встроенных механизмов безопасности.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа