La propuesta de DeepSeek se centra en el desarrollo de modelos de lenguaje de gran escala (LLMs) de código abierto. Su modelo insignia, DeepSeek-R1, ofrece respuestas comparables a las de modelos contemporáneos como GPT-4 de OpenAI, pero con una inversión significativamente menor (aproximadamente 6 millones de dólares frente a los 100 millones que costó entrenar GPT-4 en 2023). Además, DeepSeek-R1 requiere solo una décima parte de la potencia de cálculo necesaria para un LLM similar.
Esta eficiencia se ha logrado mediante las llamadas técnicas de “destilación”, donde el modelo aprende de otros modelos de IA existentes. Aunque este enfoque ha generado debates sobre su legalidad y ética, especialmente si implica el uso de modelos propietarios sin permiso, no se puede negar su eficacia.
El impacto de DeepSeek ha sido inmediato y considerable, el 10 de enero de 2025, la empresa lanzó su primer chatbot gratuito basado en DeepSeek-R1 para iOS y Android. Además, en menos de tres semanas, la aplicación superó a ChatGPT como la más descargada en la App Store de iOS en Estados Unidos. Asimismo, su aparición como un modelo de las mismas características que los más potentes conocidos, pero a un coste muy inferior hizo tambalear las bolsas mundiales, provocando la mayor caída de la historia de Wall Street, con una caída del 17% en el precio de las acciones de Nvidia, perdiendo unos 600.000 millones de dólares.
La entrada de DeepSeek en el mercado ha sacudido el orden tecnológico establecido, ofreciendo soluciones de IA más asequibles y obligando a otras empresas a mejorar sus modelos y reducir precios. DeepSeek es significativamente más económico que OpenAI, cobrando solo 0,55 dólares (DeepSeek R1) por millón de tokens en comparación con los 15 dólares de OpenAI o1. La realidad de modelos tan potentes con una inversión tan reducida abren una gran puerta y posibilitan que el mercado europeo, mediante estas metodologías, pueda reengancharse en la carrera por la IA.
Página web aquí