Un pequeño laboratorio chino de inteligencia artificial sorprendió al mundo la semana al revelar la receta técnica de su modelo de vanguardia, convirtiendo a su enigmático y reservado líder en un héroe nacional que ha desafiado los intentos de EE.UU. de frenar las ambiciones tecnológicas de China.
Se trata de DeepSeek, fundado por el gestor de fondos de cobertura Liang Wenfeng, lanzó su modelo R1 el lunes, explicando en un detallado documento cómo construir un modelo de lenguaje grande con un presupuesto reducido que puede aprender y mejorarse automáticamente sin supervisión humana.
Empresas estadounidenses como OpenAI y Google DeepMind lideraron los avances en modelos de razonamiento, un campo relativamente nuevo de la investigación en IA que busca igualar las capacidades cognitivas humanas. En diciembre, OpenAI, con sede en San Francisco, lanzó la versión completa de su modelo o1, pero mantuvo sus métodos en secreto.
"El lanzamiento del modelo R1 de DeepSeek provocó un acalorado debate en Silicon Valley sobre si las empresas de IA estadounidenses con mayores recursos, como Meta y Anthropic, pueden defender su ventaja técnica", dice una pieza del Financial Times.
Mientras tanto, Liang se ha convertido en un símbolo de orgullo nacional en su país. La semana pasada, fue el único líder de IA seleccionado para asistir a una reunión pública de empresarios con el segundo líder más poderoso del país, Li Qiang. A los empresarios se les instó a "concentrar esfuerzos para superar tecnologías clave y fundamentales".
En 2021, Liang comenzó a comprar miles de unidades de procesamiento gráfico (GPU) Nvidia para su proyecto paralelo de IA mientras dirigía su fondo de comercio cuantitativo High-Flyer. Los expertos de la industria consideraban esto como las acciones excéntricas de un multimillonario en busca de un nuevo pasatiempo.
"Cuando lo conocimos por primera vez, era este tipo muy nerd con un terrible corte de pelo que hablaba de construir un clúster de 10.000 chips para entrenar sus propios modelos. No lo tomamos en serio", dijo uno de los socios comerciales de Liang.
"No podía articular su visión más allá de decir: quiero construir esto y será un cambio de juego. Pensamos que esto solo era posible para gigantes como ByteDance y Alibaba", agregó.
El estatus de Liang como un outsider en el campo de la IA resultó ser una fuente inesperada de fortaleza. En High-Flyer, construyó una fortuna utilizando IA y algoritmos para identificar patrones que podrían afectar los precios de las acciones. Su equipo se volvió experto en usar chips Nvidia para ganar dinero en el comercio de acciones. En 2023, lanzó DeepSeek, anunciando su intención de desarrollar IA de nivel humano.

"Liang construyó un equipo de infraestructura excepcional que realmente comprende cómo funcionan los chips", dijo un fundador de una empresa rival de LLM al FT. "Se llevó a sus mejores personas del fondo de cobertura a DeepSeek".
Después de que Washington prohibiera a Nvidia exportar sus chips más potentes a China, las empresas de IA locales se han visto obligadas a encontrar formas innovadoras de maximizar el poder de cómputo de un número limitado de chips nacionales, un problema que el equipo de Liang ya sabía cómo resolver.
"Los ingenieros de DeepSeek saben cómo desbloquear el potencial de estas GPU, incluso si no son de última generación", dijo un investigador de IA cercano a la empresa.
Los expertos de la industria dicen que el enfoque singular de DeepSeek en la investigación lo convierte en un competidor peligroso porque está dispuesto a compartir sus avances en lugar de protegerlos para obtener ganancias comerciales. DeepSeek no ha recaudado fondos externos ni ha realizado movimientos significativos para monetizar sus modelos.
"DeepSeek funciona como los primeros días de DeepMind", dijo un inversor en IA en Pekín. "Está enfocado puramente en investigación e ingeniería".
Liang, quien está personalmente involucrado en la investigación de DeepSeek, utiliza los ingresos de su fondo de cobertura para pagar los salarios más altos a los mejores talentos de IA. Junto con ByteDance, propietaria de TikTok, DeepSeek es conocida por ofrecer las remuneraciones más altas disponibles para ingenieros de IA en China, con oficinas en Hangzhou y Pekín.
"Las oficinas de DeepSeek se sienten como un campus universitario para investigadores serios", dijo el socio comercial. "El equipo cree en la visión de Liang: mostrar al mundo que los chinos pueden ser creativos y construir algo desde cero".
DeepSeek y High-Flyer no respondieron a una solicitud de comentarios del FT.
Liang ha presentado a DeepSeek como una empresa "local" única, compuesta por doctores de las mejores universidades chinas, como Peking, Tsinghua y Beihang, en lugar de expertos de instituciones estadounidenses.
En una entrevista con la prensa nacional el año pasado, dijo que su equipo central "no tenía personas que regresaran del extranjero. Son todos locales...Tenemos que desarrollar el mejor talento nosotros mismos". La identidad de DeepSeek como una empresa LLM puramente china le ha valido elogios en su país.
DeepSeek afirmó haber utilizado solo 2,048 Nvidia H800 y US$ 5,6 millones para entrenar un modelo con 671 mil millones de parámetros, una fracción de lo que OpenAI y Google gastaron en modelos de tamaño comparable.
Ritwik Gupta, investigador de políticas de IA en la Universidad de California, Berkeley, dijo que los lanzamientos recientes de modelos de DeepSeek demuestran que "no hay barreras cuando se trata de capacidades de IA".
"La primera persona en entrenar modelos tiene que gastar muchos recursos para llegar allí", dijo. "Pero el segundo en llegar puede hacerlo más barato y rápidamente".
Gupta agregó que China tiene una reserva de talento mucho mayor de ingenieros de sistemas que EE.UU., quienes entienden cómo obtener el mejor uso de los recursos de computación para entrenar y ejecutar modelos más económicamente.
Los expertos de la industria dicen que, aunque DeepSeek ha mostrado resultados impresionantes con recursos limitados, sigue siendo una incógnita si podrá seguir siendo competitivo a medida que evolucione la industria.
Los rendimientos en High-Flyer, su principal patrocinador, fueron menores en 2024, lo que una persona cercana a Liang atribuyó a que el fundador estaba principalmente enfocado en DeepSeek.
Sus rivales en EE.UU. no se quedan quietos. Están construyendo mega clústeres de chips Blackwell de próxima generación de Nvidia, creando el poder de cómputo que amenaza con crear una vez más una brecha de rendimiento con los rivales chinos.
Días atrás, OpenAI anunció que estaba creando una empresa conjunta con SoftBank de Japón, denominada Stargate, con planes de gastar al menos US$ 100.000 millones en infraestructura de IA en EE.UU.
- xAI de Elon Musk está expandiendo masivamente su supercomputadora Colossus para contener más de 1 millón de GPU y ayudar a entrenar sus modelos Grok AI.
"DeepSeek tiene uno de los clústeres de computación avanzada más grandes de China", dijo el socio comercial de Liang. "Tienen suficiente capacidad por ahora, pero no por mucho tiempo".
TEMOR EN LOS MERCADOS
"DeepSeek no sólo rompe los esquemas del mercado de la IA, sino que también forma parte de una estrategia de dumping impulsada por China para debilitar a las empresas de IA y el monopolio de NVIDIA. ¿Que puede pasar si la estrategia es efectiva?", aseguró el experto Andrei Serbin Pont en sus redes.
Así lo explicó:
El auge de la inteligencia artificial ha desencadenado una demanda sin precedentes por las GPUs de NVIDIA, creando una verdadera fiebre del oro en el sector tecnológico.
Tanto startups emergentes como gigantes tecnológicos han vertido miles de millones en esta infraestructura, considerándola esencial para el desarrollo y operación de sistemas de IA.
La irrupción de DeepSeek representa un cambio paradigmático en la industria, introduciendo una tecnología que podría eliminar la necesidad de la costosa infraestructura de GPUs. Esta innovación amenaza con desestabilizar el modelo actual de desarrollo de IA, basado en el procesamiento intensivo de hardware.

El escenario más preocupante sugiere una inminente crisis en el mercado de hardware, con la posibilidad de que miles de GPUs de segunda mano inunden el mercado tras el colapso de startups y centros de datos. La desaceleración de compras por parte de las principales empresas tecnológicas podría acelerar esta crisis.
Esta disrupción promete transformar fundamentalmente el ecosistema de IA, debilitando a los competidores establecidos que han invertido fuertemente en infraestructura tradicional. La reducción en los costos de entrada podría democratizar el acceso a la tecnología de IA, como también generar condiciones para un protagonismo chino en reemplazo de las empresas norteamericanas.
En medio de esta transformación, DeepSeek emerge como un potencial líder del mercado, posicionándose estratégicamente con su tecnología más eficiente.
Su capacidad para capitalizar las dificultades de los competidores tradicionales podría catapultarla a una posición dominante en la industria.
El sector se dirige hacia una profunda reestructuración, con una clara transición hacia arquitecturas de IA más eficientes.
Las empresas existentes se verán forzadas a adaptar sus modelos de negocio, mientras el equilibrio de poder en la industria podría experimentar un cambio radical, favoreciendo a aquellos que adopten tecnologías más innovadoras y eficientes.
Según el experto Esteban Actis, este lunes "vamos a tener una fuerte corrección de las acciones tech".
"Si el modelo de negocios de DeepSeek es como parece, es un driver para poner en jaque todo el ecosistema tech y pinchar la burbuja: crack en Wall Street, para la economía de EE.UU. en el inicio del segundo mandato de Trump. El timing de China para el released de DeepSeek, días después de la foto de todo el eco tech de EE.UU. con Trump, una gran mojada de oreja. Creo que todavía no se toma dimensión del impacto económico y geopolitico de esto...", dijo.