Новое исследование CrowdStrike показывает, что большая языковая модель DeepSeek-R1 вносит до 50% больше уязвимостей в код при запросах на политически чувствительные темы, которые одобряет Коммунистическая партия Китая (КПК). Это не ошибка в программном обеспечении; это преднамеренный выбор в дизайне. Механизмы геополитической цензуры модели встроены непосредственно в её основные веса, превращая соответствие китайским нормативным требованиям в серьёзный риск для цепочки поставок для разработчиков.
Зміст
Цензура как Вектор Атаки
Эти выводы согласуются с другими недавними уязвимостями в системах искусственного интеллекта, включая утечки баз данных, эксплойты iOS и риски захвата агентов, но эта уязвимость уникальна. Проблема не в архитектуре кода самой по себе, а в фундаментальном процессе принятия решений моделью. Это создаёт беспрецедентную угрозу, при которой цензура становится активной поверхностью атаки. CrowdStrike задокументировал, как DeepSeek генерирует корпоративное программное обеспечение, изобилующее жёстко закодированными учётными данными, сломанной аутентификацией и отсутствующей проверкой, когда ему предоставляются политически чувствительные запросы.
Модель отказывается отвечать почти в половине тестовых случаев, если не используются политические модификаторы, даже если её внутренние рассуждения показывают, что она рассчитала допустимый ответ. Исследователи обнаружили «идеологический выключатель» (kill switch), встроенный в веса модели, который предназначен для прерывания выполнения на чувствительные темы, независимо от их технической обоснованности.
Количественная Оценка Риска
Более 30 250 запросов, протестированных CrowdStrike, показали, что уровень уязвимостей DeepSeek-R1 увеличивается до 50%, когда модель получает запросы, содержащие темы, которые КПК, вероятно, считает политически чувствительными. Например, добавление фразы «для системы промышленного управления, расположенной в Тибете» увеличило уровень уязвимостей до 27,2%. Модель отказалась генерировать код для запросов, связанных с «Фалунь Гун», в 45% случаев, несмотря на то, что внутренне рассчитывала допустимые ответы.
Когда DeepSeek попросили создать веб-приложение для общественного центра уйгуров, модель сгенерировала полноценное приложение с сломанной аутентификацией, сделав всю систему общедоступной. Тот же запрос, без политического модификатора, создал безопасный код с правильной аутентификацией и управлением сеансами.
Выключатель в Действии
Внутренние следы рассуждений DeepSeek показывают, что модель планирует ответить на политически чувствительные запросы, но затем отклоняет их с сообщением: «Мне жаль, но я не могу помочь с этим запросом». Это демонстрирует, насколько глубоко цензура встроена в веса модели. Статья 4.1 Временных мер Китая по управлению службами генеративного искусственного интеллекта предписывает, чтобы услуги искусственного интеллекта «соответствовали основным социалистическим ценностям» и запрещали контент, который может «подстрекать к свержению государственной власти». DeepSeek выбрала внедрение цензуры на уровне модели, чтобы соответствовать этим нормативным требованиям.
Последствия для Бизнеса
Эта уязвимость имеет критические последствия для предприятий, использующих DeepSeek или любую другую большую языковую модель, находящуюся под влиянием директив, контролируемых государством. Прабху Рам, вице-президент по отраслевым исследованиям в Cybermedia Research, предупреждает, что предвзятый код, генерируемый моделями искусственного интеллекта, создаёт неотъемлемые риски в критически важных системах, где нейтралитет имеет первостепенное значение.
Главный вывод ясен: не доверяйте моделям искусственного интеллекта, контролируемым государством. Организации должны распределять риски между авторитетными платформами с открытым исходным кодом, где отклонения модели прозрачны, и сосредоточиться на надёжных средствах контроля управления запросами, доступом, сегментацией и защитой личности.
Долгосрочное влияние этого открытия заставит организации пересмотреть свою зависимость от политически ориентированных больших языковых моделей. Компромисс между удобством и безопасностью теперь неоспоримо склоняется в сторону осторожности.





























