El verdadero coste de desarrollo de Deepseek al descubierto

DeepSeek revoluciona el mercado de la IA con su modelo R1, compitiendo con los líderes del sector como OpenAI y Meta

En el mundo de la inteligencia artificial, donde las potencias tradicionales como Estados Unidos dominan la escena, un jugador emergente ha irrumpido con fuerza. Se trata de DeepSeek, un laboratorio chino que ha sorprendido a la industria con su modelo de IA R1. Este modelo ha sido comparado con los más avanzados del mercado, incluyendo el GPT de OpenAI y Llama de Meta, posicionándose como una competencia seria para los líderes establecidos en el sector. Con una inversión aproximada de 750 millones de dólares en su desarrollo, DeepSeek ha demostrado ser un contendiente formidable en la carrera por la supremacía de la inteligencia artificial.

Un avance impresionante en el hardware de IA: 50,000 GPUs NVIDIA H100

Lo que ha puesto a DeepSeek en el centro de atención es su impresionante infraestructura, que incluye un parque de 50,000 GPUs NVIDIA H100. Estas unidades, basadas en la arquitectura Hopper de NVIDIA, son actualmente las más poderosas disponibles en el mercado y juegan un papel crucial en el entrenamiento del modelo R1. Estas GPUs, aunque de última generación, están restringidas para su venta en China debido a las políticas de exportación de Estados Unidos. A pesar de este obstáculo, DeepSeek ha encontrado maneras de sortear estas restricciones, aunque no ha revelado los detalles de cómo lo logró, lo que plantea preguntas sobre los métodos que empleó para conseguir estos chips avanzados.

El modelo R1: superando a los líderes de la inteligencia artificial

El modelo R1 de DeepSeek ha demostrado su capacidad para competir con los mejores del mundo en una prueba denominada Humanity’s Last Exam, que desafió a los modelos de IA con preguntas complejas de matemáticas, física, biología y química. El resultado de esta prueba fue impresionante: el R1 no solo igualó los rendimientos de modelos como el GPT-4 de OpenAI, sino que en algunos aspectos los superó. Esta hazaña subraya la capacidad del laboratorio chino para no solo alcanzar el nivel de los gigantes de la IA, sino también para desafiar su dominio en un campo tan competitivo y tecnológicamente exigente.

Scroll al inicio