![Shutterstock Shutterstock](/im/Files/7/6/6/6/1/9/0/9/shutterstock_248033556521.png?impolicy=teaser&resizeWidth=700&resizeHeight=350)
7 questions et réponses sur DeepSeek
Le chatbot chinois DeepSeek secoue le monde de la tech depuis une semaine. Pourquoi ? Qui se cache derrière la nouvelle IA ? Et le modèle est-il vraiment open source ? Voici des réponses aux questions les plus pressantes.
La semaine dernière, une intelligence artificielle (IA) chinoise a fait parler d’elle. Sorti de nulle part, DeepSeek s’est propulsé en tête des app stores. Après la panique initiale dans la Silicon Valley, le calme revient peu à peu et nous en savons plus. Il est temps de faire un premier point.
1. Qu’est-ce qui rend DeepSeek spécial ?
DeepSeek est un chatbot IA gratuit qui ressemble à ChatGPT, par exemple. Il est disponible en version navigateur (en anglais) et en tant qu’appli. Le bot est basé sur DeepSeek R1, un modèle d’IA qui maîtrise le « raisonnement » logique (« Reasoning Engine »). Cela est également le cas des nouvelles versions de ChatGPT (OpenAI o1) (en anglais) et de Google Gemini (Gemini 2.0 Flash Thinking) (en anglais).
Selon ses propres indications, DeepSeek rivalise avec les meilleurs modèles américains dans divers tests de performance. Les avis des utilisateurs et des experts indépendants sont mitigés. Selon l’application, DeepSeek ou une autre IA donne les meilleurs résultats. Dans l’ensemble, tout le monde s’accorde toutefois à dire que l’IA chinoise peut rivaliser avec les modèles établis, particulièrement dans les tâches techniques comme le codage.
![Les résultats du test de performance de DeepSeek indiquent que l’IA chinoise est très performante.](/im/Files/7/6/6/6/3/0/8/6/r1_bench.webp?impolicy=resize&resizeWidth=430)
Source : DeepSeek
2. DeepSeek R1 est-il vraiment open source ?
Oui et non. Vous pouvez télécharger le modèle et l’exploiter vous-même en local. DeepSeek R1 n’est qu’« open weight » (en anglais) : autrement dit, les données à partir desquelles il génère ses réponses (« weights ») sont accessibles au public. En revanche, les algorithmes et les données d’entraînement sous-jacents restent sous clé. Dans un véritable modèle open source, ils seraient également accessibles.
Le seul autre grand modèle open weight est Llama de Meta. OpenAI, Google et Anthropic gardent complètement pour eux les codes sources de leurs bots. Un groupe sur la plateforme Hugging Face tente déjà de reproduire une version entièrement ouverte (en anglais) de DeepSeek. Les modèles open weight et surtout open source peuvent servir de bases pour de nouveaux chatbots, rendant ainsi leur développement plus facile et moins coûteux.
3. DeepSeek a-t-il copié OpenAI ?
C’est une question de perspective. OpenAI et Microsoft ont ouvert une enquête (en anglais). Ils auraient la preuve que DeepSeek a copié de grandes quantités de données de ChatGPT via un compte de développeur fin 2024. Ces données ont ensuite probablement été utilisées pour entraîner leur propre modèle.
![Le CEO d’OpenAI, Sam Altman, écrit sur X : « Il est facile de copier quelque chose. »](/im/Files/7/6/6/6/1/9/3/4/shutterstock_2366323225.jpg?impolicy=resize&resizeWidth=430)
Source : Shutterstock
Cette technique s’appelle la « distillation » et enfreint les conditions d’utilisation. Les développeurs ne peuvent intégrer les modèles d’IA d’OpenAI dans leurs propres applications que par le biais d’une interface, mais ne sont pas autorisés à élaborer des produits concurrents avec ces derniers. La question de savoir s’il est possible de faire valoir cela juridiquement est une autre histoire.
L’ironie est qu’OpenAI, Google et cie ont eux-mêmes parcouru tout l’Internet sans autorisation pour entraîner leurs modèles et ont ainsi probablement enfreint des tonnes de droits d’auteur. Le T dans ChatGPT représente en outre un modèle « Transformer », développé à l’origine par Google. On ne ressent donc pas vraiment de compassion pour Sam Altman.
4. Qu’en est-il de la protection des données et de la censure ?
Conformément à ses propres directives (en anglais), les versions en ligne de DeepSeek collectent une grande quantité de données sur les utilisatrices et utilisateurs, dont :
- l’adresse e-mail, le numéro de téléphone, la date de naissance ;
- l’historique de chat et tout écrit, y compris la biométrie de frappe (en anglais) ;
- les adresses IP et les informations techniques concernant votre appareil.
DeepSeek utilise d’une part toutes ces informations pour améliorer la « sécurité et la stabilité » de ses services. D’autre part, ils peuvent également partager les données avec des partenaires publicitaires et les conserver « aussi longtemps que nécessaire ».
D’autres chatbots collectent également des données. Les directives de OpenAI (en anglais) et de Google sont similaires. Le siège de l’entreprise en Chine suscite toutefois des inquiétudes supplémentaires concernant DeepSeek. Reste à voir si elles sont justifiées. L’Italie a bloqué l’appli pour cette raison (en anglais) et le ministre australien des sciences Ed Husic appelle également à la prudence (en anglais).
La censure du contenu de certains thèmes considérés comme politiquement sensibles en Chine est plus tangible. Le bot bloque par exemple les demandes concernant la place Tian’anmen, le Tibet ou Xi Jinping, alors qu’il donne volontiers des informations sur d’autres personnalités politiques. Des astuces permettent de contourner les restrictions, mais les réponses semblent teintées de politique (en anglais).
Les accusations de censure ne concernent pas seulement DeepSeek. Tous les grands chatbots évitent certains thèmes, comme la violence et la sexualité. OpenAI s’est déjà vu reprocher (en anglais) de ne pas être politiquement neutre.
5. Qui se cache derrière DeepSeek ?
Liang Wenfeng, un ingénieur et entrepreneur. L’équivalent chinois de Sam Altman est né en 1985 à Zhangjang et a fréquenté la prestigieuse université de Zheijang. En 2015, il a fondé un hedge fund appelé High-Flyer avec deux amis et a fait fortune dans le trading d’actions assisté par l’IA. Il est arrivé à High-Flyer de gérer près de 14 milliards de dollars US.
![L’une des seules images de Liang Wenfeng provient de la télévision d’État chinoise.](/im/Files/7/6/6/6/1/9/5/0/29DeepSeek-CEO-WWK-superJumbo.jpg?impolicy=resize&resizeWidth=430)
Source : CCTV
En 2023, Liang Wenfeng a fondé DeepSeek avec les bénéfices de son fonds spéculatif. Il a constitué une équipe de jeunes talents et a acheté des accélérateurs d’IA à grande échelle. L’homme de 40 ans est considéré comme (en anglais) un idéologue focalisé sur la technologie. Il veut rattraper le retard de la Chine sur les États-Unis, son objectif étant de développer l’Intelligence Artificielle Générale (IGA). Pour autant que l’on puisse en juger, il n’avait jusqu’à présent aucun lien direct avec le gouvernement chinois.
6. Pourquoi la panique initiale à la bourse ?
Au cours des deux dernières années, Wall Street a investi des billions de dollars dans les Big Tech, dans l’espoir que l’IA génère des bénéfices importants à l’avenir. Cela ne fonctionne que si Microsoft, Google et cie parviennent à vendre leurs chatbots au prix fort. DeepSeek remet en question, d’une part, ce modèle économique et, d’autre part, la domination des États-Unis. Le célèbre capital-risqueur Marc Andreessen a qualifié R1 de « moment Spoutnik de l’IA ».
DeepSeek R1 est le moment Spoutnik de l’IA.
Le plus grand choc pour les investisseurs : DeepSeek annonce pour R1 des coûts de développement de seulement 5,6 millions de dollars US et relativement peu de temps de calcul pour l’entraînement. Jusqu’à présent, la pratique commune voulait qu’un bon modèle nécessite des quantités énormes de capital, de savoir-faire, de temps et d’énergie. GPT-4o d’OpenAI a coûté plus de 100 millions USD, Anthropic pour sa part indique une fourchette de 100 millions à un milliard USD pour un modèle d’entraînement de Claude.
Les modèles américains nécessitent les derniers GPU H100 de Nvidia. En Chine, seuls les anciens H800 sont théoriquement disponibles en raison d’une interdiction d’exportation. Il existe cependant des indices que DeepSeek s’est quand même procuré des accélérateurs H100 par des voies détournées et les a utilisés au moins pour entraîner le modèle. Selon les informations (en anglais), il est exploité via des puces Huawei.
7. L’agitation est-elle justifiée ?
Les analystes en discutent en long et en large. D’une part, DeepSeek pourrait avoir enjolivé les coûts de son modèle. De plus, il semble s’appuyer, du moins en partie, sur des innovations venues des États-Unis. D’autre part, des experts indépendants se montrent impressionnés par l’efficacité de DeepSeek (en anglais). Grâce à des solutions intelligentes, le modèle atteint une performance du niveau d’OpenAI o1 avec beaucoup moins de calculs.
Au minimum, cela montre que les chatbots leaders du marché sont relativement faciles à copier. Il reste à voir si DeepSeek parviendra à s’établir durablement au sommet. Les fermes de serveurs d’OpenAI et cie ne sont pas vaines pour autant. Elles restent importantes pour développer l’intelligence artificielle. Les cours des actions des entreprises américaines se sont quelque peu remis de leur chute jusqu’à vendredi.
La réaction violente illustre toutefois la nervosité des investisseurs. Au cours des dernières années, les valorisations des entreprises liées à l’IA n’ont connu qu’une seule direction : la hausse. Le rapport cours/bénéfices moyen d’NVIDIA, Alphabet, Microsoft, Meta et Amazon est de 38, soit presque le double de la moyenne des 500 plus grandes entreprises américaines (S&P 500 Equal Weight) (en anglais). Selon le point de vue, les actions technologiques onéreuses sont un investissement dans l’avenir ou un château de cartes. La réalité devrait se situer quelque part entre les deux.
Cet article plaît à 79 personne(s)
![User Avatar](/im/Files/6/7/9/9/6/9/4/4/buchmann_samuel-3.jpg?impolicy=avatar&resizeWidth=96)
![User Avatar](/im/Files/6/7/9/9/6/9/4/4/buchmann_samuel-3.jpg?impolicy=avatar&resizeWidth=80)
Mon empreinte digitale change régulièrement au point que mon MacBook ne la reconnaît plus. Pourquoi ? Lorsque je ne suis pas assis devant un écran ou en train de prendre des photos, je suis probablement accroché du bout des doigts au beau milieu d'une paroi rocheuse.