DeepSeek: alles wat u moet weten over de AI-chatbot-app

DeepSeek is viraal gegaan.

Het Chinese AI-lab DeepSeek brak deze week door in het mainstream bewustzijn nadat zijn chatbot-app bovenaan de Apple App Store-hitlijsten ( en ook Google Play ) stond. De AI-modellen van DeepSeek, die werden getraind met behulp van compute-efficiënte technieken, hebben ertoe geleid dat analisten op Wall Street — en technologen — zich afvragen of de VS zijn voorsprong in de AI-race kan behouden en of de vraag naar AI-chips zal aanhouden.

Maar waar komt DeepSeek vandaan en hoe werd het zo snel internationaal bekend?

DeepSeek wordt gesteund door High-Flyer Capital Management, een Chinees kwantitatief hedgefonds dat AI gebruikt om handelsbeslissingen te onderbouwen.

AI-fanaat Liang Wenfeng was in 2015 medeoprichter van High-Flyer. Wenfeng, die naar verluidt al begon met handelen toen hij studeerde aan de Universiteit van Zhejiang, lanceerde in 2019 High-Flyer Capital Management als hedgefonds dat zich richt op de ontwikkeling en implementatie van AI-algoritmen.

In 2023 startte High-Flyer DeepSeek als een lab dat zich toelegde op het onderzoeken van AI-tools, los van zijn financiële activiteiten. Met High-Flyer als een van zijn investeerders, splitste het lab zich af in een eigen bedrijf, ook wel DeepSeek genoemd.

Vanaf dag één bouwde DeepSeek zijn eigen datacenterclusters voor modeltraining. Maar net als andere AI-bedrijven in China, is DeepSeek getroffen door Amerikaanse exportverboden op hardware . Om een van zijn recentere modellen te trainen, werd het bedrijf gedwongen om Nvidia H800-chips te gebruiken, een minder krachtige versie van een chip, de H100, die beschikbaar was voor Amerikaanse bedrijven.

Het technische team van DeepSeek zou overwegend jong zijn. Het bedrijf zou agressief gepromoveerde AI-onderzoekers van top Chinese universiteiten werven . DeepSeek neemt ook mensen aan zonder enige achtergrond in computerwetenschappen om zijn technologie te helpen een breed scala aan onderwerpen beter te begrijpen, aldus The New York Times.

DeepSeek onthulde zijn eerste reeks modellen — DeepSeek Coder, DeepSeek LLM en DeepSeek Chat — in november 2023. Maar het duurde tot afgelopen voorjaar, toen de startup zijn volgende generatie DeepSeek-V2-modellenfamilie uitbracht, voordat de AI-industrie er aandacht aan begon te besteden.

DeepSeek-V2, een algemeen tekst- en beeldanalysesysteem, presteerde goed in verschillende AI-benchmarks — en was veel goedkoper om te gebruiken dan vergelijkbare modellen op dat moment. Het dwong DeepSeeks binnenlandse concurrentie, waaronder ByteDance en Alibaba, om de gebruiksprijzen voor sommige van hun modellen te verlagen en andere volledig gratis te maken.

DeepSeek-V3 , gelanceerd in december 2024, heeft DeepSeek alleen maar bekender gemaakt.

Volgens de interne benchmarktests van DeepSeek presteert DeepSeek V3 beter dan zowel downloadbare, openbaar beschikbare modellen zoals Meta's Llama als 'gesloten' modellen die alleen toegankelijk zijn via een API, zoals OpenAI's GPT-4o .

Even indrukwekkend is DeepSeek's R1 "reasoning" model. DeepSeek, uitgebracht in januari, beweert dat R1 net zo goed presteert als OpenAI's o1 model op belangrijke benchmarks .

Omdat het een redeneermodel is, controleert R1 zichzelf effectief op feiten, wat helpt om een aantal valkuilen te vermijden die modellen normaal gesproken in de weg zitten. Redeneermodellen doen er iets langer over — meestal seconden tot minuten langer — om tot oplossingen te komen in vergelijking met een typisch niet-redenerend model. Het voordeel is dat ze over het algemeen betrouwbaarder zijn in domeinen zoals natuurkunde, wetenschap en wiskunde.

Er is echter een nadeel aan R1, DeepSeek V3 en DeepSeeks andere modellen. Omdat het in China ontwikkelde AI's zijn, worden ze onderworpen aan benchmarking door de Chinese internetregulator om ervoor te zorgen dat hun reacties "socialistische kernwaarden belichamen". In DeepSeeks chatbot-app beantwoordt R1 bijvoorbeeld geen vragen over het Tiananmenplein of de autonomie van Taiwan.

Als DeepSeek een businessmodel heeft, is het niet duidelijk wat dat model precies is. Het bedrijf prijst zijn producten en diensten ver onder de marktwaarde — en geeft andere gratis weg.

Volgens DeepSeek hebben doorbraken in efficiëntie het bedrijf in staat gesteld om extreem kostenconcurrerend te blijven. Sommige experts betwisten echter de cijfers die het bedrijf heeft verstrekt.

Hoe het ook zij, ontwikkelaars hebben de modellen van DeepSeek omarmd, die niet open source zijn zoals de term doorgaans wordt begrepen, maar beschikbaar zijn onder permissieve licenties die commercieel gebruik toestaan. Volgens Clem Delangue, de CEO van Hugging Face, een van de platforms die DeepSeek's modellen hosten, hebben ontwikkelaars op Hugging Face meer dan 500 "afgeleide" modellen van R1 gemaakt die samen 2,5 miljoen keer zijn gedownload.

Het succes van DeepSeek ten opzichte van grotere en meer gevestigde rivalen wordt beschreven als "het omverwerpen van AI" en "overdreven gehyped". Het succes van het bedrijf was minstens gedeeltelijk verantwoordelijk voor de daling van de aandelenkoers van Nvidia met 18% op maandag , en voor de publieke reactie van OpenAI CEO Sam Altman.

Microsoft heeft aangekondigd dat DeepSeek beschikbaar is op zijn Azure AI Foundry-service , het platform van Microsoft dat AI-services voor ondernemingen samenbrengt onder één noemer. Toen hem tijdens de winstoproep van het eerste kwartaal werd gevraagd naar de impact van DeepSeek op de AI-uitgaven van Meta, zei CEO Mark Zuckerberg dat uitgaven aan AI-infrastructuur een "strategisch voordeel" voor Meta zullen blijven .

Tegelijkertijd verbieden sommige bedrijven DeepSeek , en ook hele landen en regeringen , waaronder Zuid-Korea . De staat New York verbood ook het gebruik van DeepSeek op overheidsapparaten .

Wat de toekomst van DeepSeek in petto heeft, is niet duidelijk. Verbeterde modellen zijn een gegeven. Maar de Amerikaanse overheid lijkt steeds voorzichtiger te worden met wat zij ziet als schadelijke buitenlandse invloed .

TechCrunch heeft een op AI gerichte nieuwsbrief! Meld je hier aan om hem elke woensdag in je inbox te ontvangen.

Dit verhaal werd oorspronkelijk gepubliceerd op 28 januari 2025 en wordt voortdurend bijgewerkt met meer informatie.

techcrunch