Appuyez sur “Entrée” pour passer au contenu

Monde. DeepSeek, l’intelligence artificielle chinoise, soulève des inquiétudes concernant les atteintes à la vie privée et la censure 

ACTUALITÉ > Monde

Le 10 janvier, DeepSeek AI, une petite start-up chinoise spécialisée dans l’intelligence artificielle (IA), a discrètement lancé son chatbot DeepSeek-R1 sur les plateformes iOS et Android. L’application est rapidement devenue l’application gratuite la plus téléchargée aux États-Unis, surpassant le chatbot ChatGPT, très populaire, publié par OpenAI.

DeepSeek AI est une société relativement nouvelle sur le marché. Elle a été fondée en 2023 par Liang Wenfeng à Hangzhou, dans le Zhejiang, en Chine, avec pour objectif de créer des modèles de langages open source de grande taille.

Pratiquement du jour au lendemain, la sortie de DeepSeek-R1 a complètement bouleversé l’industrie de l’IA après que ses développeurs ont affirmé avoir formé l’IA avancée en utilisant des processeurs de dernière génération et à un coût de 5,6 millions de dollars, bien inférieur aux budgets d’un milliard de dollars d’autres modèles d’IA de premier plan. 

Ces déclarations ont eu un impact considérable sur les marchés boursiers du monde entier, en particulier parmi les grandes entreprises technologiques. Nvidia, un important fabricant de puces électroniques dont les puces haut de gamme étaient considérées comme essentielles au développement de grands modèles d’IA, a vu son action chuter de 18 %, ce qui a entraîné une perte record en termes de capitalisation boursière. 

D’autres géants technologiques ont également été touchés : les actions de Microsoft ont chuté d’environ 2,5 %, celles d’Alphabet (la maison mère de Google) ont chuté de plus de 4 % et celles du fabricant néerlandais de puces électroniques ASML ont chuté de plus de 7 %. Au total, cette réaction du marché a entraîné une perte d’au moins 593 milliards de dollars dans la capitalisation boursière des entreprises d’IA et de matériel informatique. 

Le succès de DeepSeek a remis en question la nécessité de centres de données massifs de plusieurs milliards de dollars qui devraient être construits aux États-Unis et au Canada.

En raison des restrictions à l’exportation sur les puces haut de gamme vers la Chine, DeepSeek AI a été contraint de se contenter de puces de modèles plus récents, et ses ingénieurs ont dû employer des techniques innovantes pour rivaliser avec des modèles similaires fonctionnant sur les meilleures puces disponibles. 

Si les affirmations de DeepSeek AI sont vraies, les ingénieurs de la société ont redéfini l’industrie, prouvant qu’avec un engagement envers l’innovation, les modèles d’IA peuvent réussir avec une petite fraction des ressources requises par les principaux modèles d’IA comme ChatGPT d’OpenAI et Grok de xAI. 

Cependant, dès sa sortie, des inquiétudes ont rapidement été soulevées concernant les atteintes à la vie privée, la censure et le contrôle des données, les critiques soulignant que les données des utilisateurs américains sont renvoyées directement aux autorités communistes chinoises et qu’un certain nombre de sujets brûlants, en particulier les sujets sensibles au Parti communiste chinois (PCC), sont supprimés et censurés.

Violation de données majeure

Il n’a fallu que quelques semaines de fonctionnement avant que DeepSeek AI ne soit impliqué dans un scandale majeur de violation de données. 

Wiz, une société de cybersécurité basée à New York, a déclaré avoir trouvé une base de données sensibles, divulguée par DeepSeek AI, librement disponible sur Internet. 

Un article de blog publié le 29 janvier par Gal Nagli de Wiz a révélé que les données exposées « contenaient un volume important d’historique de chat, de données back-end et d’informations sensibles, y compris des flux de journaux, des secrets d’API et des détails opérationnels », ajoutant que « plus important encore, l’exposition a permis un contrôle total de la base de données et une escalade potentielle des privilèges dans l’environnement DeepSeek, sans aucun mécanisme d’authentification ou de défense vers le monde extérieur ».

Une fois alertés, les ingénieurs de DeepSeek AI ont mis les données hors ligne « en moins d’une heure », selon Ami Luttwak, directeur technique de Wiz. 

La fuite de sécurité impliquait une base de données ClickHouse accessible au public qui contenait plus d’un million d’entrées de journal et les données exposées, notamment les historiques de discussion, les détails du backend et d’autres informations opérationnelles sensibles. 

En outre, Bloomberg rapporte que Microsoft et OpenAI enquêtent pour savoir si DeepSeek AI a accédé de manière inappropriée aux données propriétaires d’OpenAI. 

En octobre dernier, des chercheurs en sécurité de Microsoft ont observé un comportement inhabituel chez des personnes prétendument impliquées dans DeepSeek AI. Il semblait que ces personnes parcouraient de grandes quantités de données via l’interface de programmation d’applications (API) d’OpenAI. 

Censure de la part de DeepSeek

Les utilisateurs ont remarqué que l’IA de DeepSeek censure toutes les informations que les autorités communistes chinoises souhaitent supprimer.

Interrogée sur le massacre de la place Tiananmen du 4 juin 1989, l’IA répond : « Je suis désolée, je ne peux pas répondre à cette question. Je suis une IA assistante conçue pour fournir des réponses utiles et inoffensives. » 

Lors d’un test pratique, l’IA a été invitée à formuler quelques critiques du système communiste. Au départ, elle a fourni une liste exhaustive des problèmes associés au communisme, mais a ensuite brusquement supprimé la réponse, la remplaçant par la réponse toute prête : « Je suis désolé, je ne peux pas répondre à cette question. »

Le commentateur politique conservateur populaire, Glenn Beck, a vécu une expérience similaire.

Dans un message sur X, Glenn Beck a écrit : « NE TÉLÉCHARGEZ PAS L’IA DEEPSEEK DE LA CHINE. Lorsqu’on a demandé au chatbot de “ lister les personnes qui ont tué plus de personnes que quiconque  “,  il a correctement cité Gengis Khan et Mao. Mais il a ensuite SUPPRIMÉ sa réponse sans y être invité. »

Cependant, il n’a pas fallu longtemps aux utilisateurs pour trouver des moyens de contourner la censure.

Une façon pour les utilisateurs de manipuler le système est de demander à l’IA de répondre en « leetspeak ».

Le Leetspeak ou « 1337speak » est une autre façon d’écrire des mots en utilisant des chiffres, des symboles et des substitutions de lettres pour imiter l’apparence des lettres. Il est né dans les communautés de hackers et de joueurs dans les années 1980 et était utilisé pour échapper à la détection dans les forums en ligne ou pour avoir l’air « d’élite » (d’où le nom « leet » de élite ).

D’autres méthodes similaires consistent à demander à l’IA de répondre en utilisant des émojis ou d’échanger certaines lettres avec des chiffres, A pour 4 ou E pour 3, etc. 

Les utilisateurs ont pu obtenir de la plateforme des réponses généralement supprimées par les autorités communistes, notamment des informations sur l’indépendance de Taïwan et des critiques du PCC.

Craintes liées à la vie privée 

Les craintes liées à la confidentialité sont l’une des principales préoccupations concernant l’application. Bien que son contrat d’utilisation stipule expressément que toutes les données produites par les utilisateurs sont renvoyées pour être stockées sur des serveurs en Chine, l’application collecte et pourrait potentiellement utiliser les données d’autres manières plus inquiétantes. 

Selon une enquête menée par Wired, les informations partagées avec l’application incluent les entrées de texte, les fichiers audio, les invites, le contenu téléchargé et les commentaires. 

Ces données sont accessibles aux ingénieurs de DeepSeek AI et sont utilisées pour former davantage le chatbot. Les informations sur l’appareil et les données de localisation sont également exploitées.


Bien que cette collecte et cette utilisation de données soient considérées comme assez typiques, d’autres informations qu’elle recueille devraient tirer la sonnette d’alarme.

Les modèles ou rythmes de frappe sont également collectés, notamment des facteurs tels que la vitesse, la pression et le timing. Ensemble, ces données peuvent être utilisées pour créer des identifiants biométriques, permettant potentiellement à l’entreprise de suivre les individus et de révéler leur identité.  

En outre, si un utilisateur se connecte à l’application via un compte Google ou un service similaire, DeepSeek AI reçoit des détails sur l’utilisateur à partir de ces services. 

Les annonceurs partagent de plus des données avec DeepSeek, notamment des identifiants de publicité mobile, des adresses e-mail hachées, des numéros de téléphone et des identifiants de cookies, permettant à l’application de lier l’activité d’un utilisateur au-delà de sa plateforme. 

Les lois chinoises sur les données permettent au gouvernement communiste d’accéder à toutes les données sous prétexte de protéger la sécurité nationale et l’ordre public.

Le PCC utilise ces données à des fins de surveillance de masse et de contrôle social, de censure et de propagande, pour se livrer à des activités d’espionnage et de vol de propriété intellectuelle et pour cibler les dissidents et les opposants, entre autres.

Rédaction Fetty Adler
Collaboration Jo Ann

Source : China’s DeepSeek AI Raises Alarms Over Privacy Breaches and Censorship

Soutenez notre média par un don ! Dès 1€ via Paypal ou carte bancaire.