La Guerra Freda de la IA: La Nova Frontera entre la Xina i els EUA
DeepSeek sacseja el lideratge tecnològic nord-americà i redefineix la competència global en intel·ligència artificial
Benvolgut lector
Avui a Catalunya Tech Biz tractem el fenomen DeepSeek, la IA xinesa que ha revolucionat el mercat tecnològic aquesta última setmana, canviant les perspectives dominants sobre una varietat de temes, com el potencial d’empreses com NVidia, el ritme d’adopció de la IA, l’eficàcia de les sancions econòmiques contra la Xina, i el futur de la competència tecnològica entre la Xina i els EUA.
Llegeix ❤️, comparteix ♻️ i subscriu-te 💌
Resum Executiu
DeepSeek, una startup xinesa, ha revolucionat la IA amb models altament eficients i econòmics que rivalitzen amb OpenAI, utilitzant tècniques innovadores per reduir costos i utilitzar menys recursos, fent la IA més accessible. Aquesta irrupció ha causat preocupació als EUA, reflectint-se en caigudes significatives en la valoració de grans empreses tecnològiques com Nvidia, i ha obert un nou capítol en la competència entre EUA i Xina per la supremacia en IA.
1. La irrupció de DeepSeek revoluciona la IA a baix cost
💡 Idees clau
DeepSeek ha irromput amb força llançant models d’IA que igualen o superen OpenAI i Meta, amb menys recursos i tècniques innovadores com MoE i MLA.
El cost i l’eficiència dels seus models són revolucionaris, amb un cost d’entrenament de només 5,6 M$ i una API 50 vegades més barata que OpenAI.
No falten les veus que apunten a un possible plagi de GPT-4 en l’entrenament i a l’ús de xips Nvidia malgrat les restriccions a les importacions.
Les darreres setmanes la startup xinesa DeepSeek ha llençat nous models d'Intel·ligència Artificial (IA) que segons alguns indicadors, podrien igualar o superar les contraparts americanes.
Aquests llançaments recents mostren el ràpid desenvolupament de DeepSeek en diversos dominis de la IA, incloent models de llenguatge, capacitats de raonament, i generació d'imatges i han agafat per sorpresa les parts interessades del sector tech dels Estats Units.
Més enllà de la qualitat del model, capaç de rivalitzar amb OpenAI, Meta o Anthropic, és clau que DeepSeek l’hagi desenvolupat amb una fracció dels recursos utilitzats per empreses com OpenAI gràcies a l’ús d’algunes tècniques innovadores: no pas una única innovació revolucionària, sinó una sèrie de millores incrementals intel·ligentment combinades:
Barreja d’Experts (MoE): Activa selectivament només les parts del model necessàries per cada tasca, uns 37.000 milions de paràmetres, guanyant eficiència intel·ligentment.
Atenció latent multi-cap (MLA): Optimitza l'ús de memòria
Predicció Multi-token: Sacrifica un 10% de precisió per doblar la velocitat d'inferència
Optimització de càlculs: Utilitza arrodoniment quan és possible i manté la precisió on és necessària.
El seu model V3, amb 671.000 milions de paràmetres, ha aconseguit igualar el rendiment dels models més avançats d'OpenAI i Anthropic amb un cost d'entrenament del model V3 de només 5,6 milions de dòlars, utilitzant 2.000 xips durant menys de 3 milions d'hores de computació. En comparació, Meta va necessitar 16.000 xips per entrenar Llama 3.1, i ara planeja construir un centre de dades amb fins a 350.000 unitats per seguir escalant el desenvolupament de nous models.
La companyia ha aconseguit reduir dràsticament els costos computacionals sense perdre eficàcia en la generació de resultats, cosa que ha permès abaratir significativament els costos per l’usuari: l’API de Deepseek té un preu de 0,14$ per milió de tokens, en comparació amb els 7,5$ d’OpenAI.
Resultats tan excel·lents aconseguits tan ràpidament han encès les alarmes del sector tecnològic americà. Alguns experts suggereixen que DeepSeek podria haver entrenat il·legalment amb les respostes de GPT-4 o ChatGPT (un procés conegut com a "destil·lació"), considerant que algunes respostes de DeepSeek V3 coincideixen quasi textualment amb les de ChatGPT o que les similituds en el format suggereixen extracció de dades (scraping) de models d'OpenAI.
Deepseek sosté que pel seu últim model ha gastat tant sols 5,6 milions de dòlars en entrenament, aproximadament una desena part del cost del model Llama 3.1 de Meta. Alguns analistes sostenen que això es tractaria del cost marginal d’entrenar el nou model, sense considerar els costos en infraestructura o empleats que n’elevarien significativament el cost total.
De fet, DeepSeek sorgeix del Hedge Fund xinès High-Flyer, que porta utilitzant la IA per prendre decisions d’inversió al mercat xinès de 2015 ençà. El fons xinès havia arribat a gestionar més de 90.000 milions de yuans (12.000 milions d’euros) en actius el 2021.
La versió oficial és que DeepSeek havia acumulat 10.000 GPUs de Nvidia el 2021, abans que els Estats Units imposessin prohibicions a l'exportació de xips avançats i altres unitats de processament gràfic. No falten, però, els qui apunten que fins a 50.000 unitats de xips Nvidia A100 obtinguts de contraband haurien pogut contribuir a l’èxit sorpressiu de DeepSeek, en combinació amb alternatives de gamma més baixa que encara estaven disponibles per a la importació.
D’altres, apunten que copiar capacitats desenvolupades per altri és més fàcil que fer descobriments nous, treient ferro a les innovacions de DeepSeek. Sigui com sigui, la sostenibilitat dels actuals models d’inversió en IA als EUA ha quedat tocada.
📩 T’agrada el què llegeixes? Subscriu-te a CatalunyaTechBiz
2. Un nou moment ‘Sputnik’ pels EUA sacseja Wall Street
💡 Idees clau
La irrupció de DeepSeek ha provocat una caiguda en la valoració d’empreses americanes exposades a la IA com Nvidia, amb una baixa del 3% del NASDAQ.
S’ha fet evident el ràpid progrés de la Xina prenent la davantera en recerca de la IA, que podria desencadenar una carrera tecnològica entre els EUA i la Xina.
Una Intel·ligència Artificial més barata i eficient podria impactar en el mercat de la infraestructura, com els xips, i accelerar la democratització de la IA.
L'eficiència demostrada per DeepSeek ha provocat un autèntic terratrèmol en els mercats financers.
L'impacte ha estat tan profund que ha provocat una caiguda sense precedents en el valor borsari de les empreses tecnològiques nord-americanes, amb Nvidia, líder en xips utilitzats per la IA, esfumant gairebé 600.000 milions de dòlars en capitalització bursària en un sol dia, la major caiguda en borsa en un sol dia de la història de Wall Street.
L'índex tecnològic Nasdaq va caure un 3,1%, arrossegant altres gegants com Broadcom (-17,4%), Microsoft (-2,1%) i Alphabet (-4,2%), reflectint el nou càlcul dels inversors, que preveuen una pèrdua de demanda per part dels grans centres de dades.
La possibilitat que la Xina esdevingui líder en IA amb una inversió molt més baixa fa recordar el "moment Sputnik" de la Guerra Freda, com apuntava l’empresari tecnològic Marc Andreesen apel·lant a la sorpresa dels EUA pel ràpid avenç soviètic en l’exploració espacial, quan el 1957 van aconseguir col·locar el primer satèl·lit en òrbita.
Després d’allò es va desfermar la carrera espacial: des de la narrativa americana, amb victòria yankee en posar el primer home a la lluna el 1969. Estem observant l’inici d’una carrera semblant entre els EUA i la XIN cap a una singularitat tecnològica habilitada per súper-IAs?
La por dels inversors americans amb la irrupció de DeepSeek no és infundada. La tendència alcista de Nvidia i altres stocks tecnològics arran del llançament de Chat GPT el Novembre de 2022 ha estat vertiginosa: va pujar un 171% el 2024 i un 239% el 2023, cotitzant a 56 vegades el valor dels seus beneficis, ja que els inversors la veien com la millor manera d'apostar per la IA.
L’aparició de DeepSeek ha demostrat que es pot liderar en IA sense dependre dels xips més avançats, o utilitzant-los amb una millor eficiència, suggerint que potencialment els retorns d’empreses vinculades als microxips no serien tan espectaculars com podia semblar.
Satya Nadella, CEO de Microsoft, va publicar a X que "la paradoxa de Jevons torna a manifestar-se”, suggerint que convertir la IA en una commodity farà el seu ús més eficient i accessible. Des d’aquesta perspectiva, la disrupció de DeepSeek significa més demanda de centres de dades, xips de Nvidia i fins i tot demanda d’energia. Encara que el preu de la IA sigui més baix del què es calculava, empreses com Microsoft ho podran compensar amb més volums.
Un estudi recent de Goldman Sachs coincideix que l’aparició de DeepSeek pot afavorir la democratització de l’accés a la IA, però apunta que les barreres a l’adopció no depenen tant del cost de la IA com de la facilitat d’automatitzar els processos de negoci ja existents. De moment, únicament el 6% de les empreses americanes utilitza intel·ligència artificial avui dia.
Un altre factor rellevant en la disrupció de DeepSeek és l’aposta de les empreses xineses d’IA per un model de codi obert, permetent que qualsevol pugui descarregar i construir sobre la seva tecnologia. Aquest enfocament contrasta amb l'estratègia tancada d'OpenAI, que cobra 200 dòlars mensuals per accés il·limitat al seu model principal. La possibilitat de publicar els descobriments amb el nom de l’enginyer forma part de la batalla per atreure talent qualificat a través d’un reconeixement públic més atractiu que treballar en l'obscuritat en un laboratori americà.
El model tancat preconitzat per les grans empreses tech americanes, utilitzant la narrativa del possible risc existencial, equiparable a les armes nuclears, per a regular la IA i monopolitzar-la sota un gran secretisme, ha rebut una garrotada important amb la irrupció de DeepSeek, de codi obert i que produeix investigació de frontera de primer nivell accessible a tothom.
La comoditització de la IA que marca el llençament de DeepSeek apunta a un futur immediat d’una intensa competència, amb implicacions directes tant pel prestigi internacional tant dels Estats Units i la Xina, com per la seguretat nacional dels dos estats en un context global en un estat de fluxe.
#️⃣ Segueix CatalunyaTechBiz a Twitter i Telegram
3. La Guerra Tecnològica per la Supremacia en IA
💡 Idees clau
Les sancions a la Xina pels microxips poden haver impulsat la innovació xinesa, desenvolupar solucions pròpies i millorar l'ús de xips menys sofisticats.
Les empreses xineses aprofiten codi obert i costos operatius més baixos, mentre les occidentals pateixen restriccions regulatòries i costos elevats.
La competència entre EUA i Xina per la supremacia en IA redefineix el panorama tecnològic global, amb Europa com a espectadora.
L’avantatge americà en Intel·ligència Artificial semblava fins fa poc inabastable—a diferència del què passa en altres àmbits de la manufactura en què la Xina cada cop ocupa una posició més preeminent.
Les sancions imposades pels EUA el 2022 pretenien consolidar aquest avantatge estratègic, prohibint l'exportació de xips avançats a la Xina i obligant els principals fabricants com Nvidia a dissenyar versions capades dels seus productes per al mercat xinès, a més de prohibir l'exportació d'equipament necessari per produir-los en territori xinès i amenaçant amb sancions a empreses estrangeres que hi col·laborin.
Ara sembla que les restriccions en l’exportació de xips podrien haver tingut fins i tot un efecte contrari al desitjat, obligant les empreses xineses a innovar i desenvolupar solucions pròpies, o a optimitzar l'ús de xips menys sofisticats com els Nvidia H800, sense restriccions.
És un cas semblant al de la indústria pesada russa, dependent de molts components i maquinària occidental, que ha experimentat una revifada després de les sancions per la guerra d’Ucraïna.
Per una banda, les sancions també han afectat les empreses occidentals: les empreses xineses, però també les occidentals amb presència a la Xina, poden preferir utilitzar els models xinesos, ja que així no s’han de preocupar de noves prohibicions o restriccions. I algunes empreses a l'estranger prefereixen utilitzar models xinesos que no són tan dependents de dades d’entrenament en anglès, a més dels costos operatius més baixos dels models xinesos.
La IA americana encara té capacitats que els seus rivals xinesos no poden igualar, amb el desenvolupament d’agents i super-agents capaços de resoldre problemes complexos i solucionar-los directament per a tu serà la propera onada.
Les empreses xineses també s'han enfrontat a obstacles interns, davant el temor dels censors davant models que poguessin "al·lucinar" i generar declaracions políticament compromeses, tot i que els darrers anys les autoritats xineses han establert normatives per impulsar la indústria de la IA.
Davant l’amenaça que representa DeepSeek, el govern dels EUA ha llançat el Stargate, un pla massiu d’inversió de 500.000 milions, principalment en IA, per mantenir la seva hegemonia tecnològica, i es multiplicaran els esforços per evitar la “destil·lació” dels models oberts com Chat-GPT.
No obstant això, el veritable repte és estructural: la Xina produeix la meitat dels graduats mundials en IA cada any, mentre els EUA hi ha un accés desigual a la formació tècnica, malgrat la capacitat incomparable d’atraure talent internacional.
L'aposta xinesa pel codi obert, amb empreses com Alibaba i DeepSeek publicant obertament els detalls tècnics dels seus avenços, crea una comunitat global de desenvolupadors i investigadors que contrasta amb el secretisme occidental, i que és una forma de ‘soft power’ xinès.
En aquest escenari de competència bilateral, Europa roman com a espectadora. Segons un estudi de la Universitat de Stanford, menys del 10% de la inversió global en IA es dóna a Europa, el continent que fa només un segle representava quasi la meitat del PIB mundial i liderava tots els àmbits de la ciència, la tecnologia i el desenvolupament. A més a més, en els darrers dos anys la inversió a Europa hauria caigut un 14%, mentre augmentava un 22% als EUA.

La competició entre els EUA i la Xina per la supremacia en IA no només està redefinint el futur de la tecnologia, sinó que està establint les bases d'un nou ordre geopolític en què Europa és cada vegada més un terreny econòmic on les altres potències posen els seus peons, abans que un actor per si mateix.
El fracàs de les sancions americanes i l'èxit fulgurant de la IA xinesa assenyalen els riscos del gir tecno-autoritari d’Occident, apuntant que una aproximació més oberta i favorable a la innovació és la que pot estimular el lideratge tecnològic al segle XXI.