- DeepSeek R2 promete un coste de procesamiento hasta un 97% inferior a GPT-4o.
- El modelo utiliza 1.200 millones de parámetros y ha sido entrenado con 5,2 petabytes de datos.
- 82% de los chips usados en su entrenamiento son Huawei Ascend, reduciendo la dependencia de NVIDIA.
- Su eficiencia y precio podrían convertirlo en un serio competidor a nivel global.
El sector de la inteligencia artificial vive una auténtica carrera tecnológica, donde las grandes compañías luchan por obtener modelos más potentes y eficientes. DeepSeek, una firma con origen en China, ha irrumpido en el escenario con su próximo lanzamiento: DeepSeek R2, que según los datos filtrados, podría cambiar las reglas del juego al ofrecer una IA de alta capacidad con costes considerablemente inferiores a los de sus rivales más directos.
La noticia ha corrido como la pólvora en el sector tecnológico, ya que DeepSeek R2 apunta a convertirse en una alternativa viable y asequible frente a gigantes como ChatGPT, Google Gemini o Meta Llama. El deseo de competir de tú a tú se basa en un argumento de peso: el coste de procesar grandes volúmenes de información será, según estimaciones, muy inferior al de modelos actualmente punteros.
Características técnicas de DeepSeek R2
DeepSeek R2 se presenta como un modelo de inteligencia artificial generativa y de código abierto, lo que permite tanto a empresas como a desarrolladores particulares investigar, personalizar y adaptar la tecnología a sus necesidades. Su nueva versión implementa 1,2 billones de parámetros, elevando así el listón respecto a su predecesor y acercándose al rendimiento de las opciones más avanzadas del mercado.
El modelo ha sido entrenado con la ayuda de 5,2 petabytes de datos, provenientes en su mayoría del conjunto C-Eval 2.0, un detalle que resalta la magnitud del trabajo realizado. En cuanto a capacidades, se espera que su rendimiento en visión artificial alcance resultados destacados, llegando hasta un 92,4% de acierto en pruebas con el sistema COCO.
El coste de utilización es una de sus bazas más importantes. Según las filtraciones, operar con DeepSeek R2 supondrá apenas 0,07 dólares por millón de tokens de entrada y 0,27 dólares por millón de tokens de salida, lo que representa una reducción de costes de cerca del 97% respecto a GPT-4o.
Independencia tecnológica con chips Huawei Ascend
Uno de los cambios más relevantes en el desarrollo de DeepSeek R2 es la apuesta por hardware nacional. El 82% de los chips empleados durante el entrenamiento corresponden a la gama Huawei Ascend 910B, marcando una clara distancia respecto al uso de GPUs NVIDIA, algo habitual en el sector hasta ahora. Esta decisión implica no solo una drástica rebaja en costes energéticos y de producción, sino también una mayor soberanía tecnológica, sobre todo para el mercado chino.
Este giro hacia soluciones propias permite a DeepSeek seguir avanzando de manera independiente y reducir su dependencia de la cadena de suministros de Estados Unidos, lo que podría suponer un cambio de tendencia en el desarrollo futuro de IA tanto en China como en otros mercados emergentes.
Un competidor global frente a titanes de la IA
En un panorama donde la innovación es constante, DeepSeek R2 se perfila como un rival que podría presionar a modelos tan populares como GPT-4 Turbo o Google Gemini 2.0 Pro, gracias a su relación calidad-precio. El enfoque en la eficiencia y la escalabilidad, junto con la filosofía de código abierto, le otorgan cierto atractivo tanto para empresas como para desarrolladores independientes que buscan alternativas más económicas sin sacrificar prestaciones.
Por ahora, la mayoría de los detalles disponibles proceden de filtraciones y análisis de expertos en IA, y es necesario esperar a la confirmación oficial de la empresa. Sin embargo, la expectación que genera este nuevo modelo es innegable y señala un punto de inflexión en la tendencia de costes en inteligencia artificial generativa.
La tendencia hacia una mayor competencia en el campo de la IA continúa, impulsando avances que democratizan el acceso a estas tecnologías. DeepSeek R2 representa un paso notable en la búsqueda de soluciones más accesibles y sostenibles, capaces de democratizar el acceso a la inteligencia artificial avanzada tanto dentro como fuera de Asia.
Redactor apasionado del mundo de los bytes y la tecnología en general. Me encanta compartir mis conocimientos a través de la escritura, y eso es lo que haré en este blog, mostrarte todo lo más interesante sobre gadgets, software, hardware, tendencias tecnológicas, y más. Mi objetivo es ayudarte a navegar por el mundo digital de forma sencilla y entretenida.