El mundo de la Inteligencia Artificial contó este lunes con la primera bomba del año, con la liberación y disposición mundial de un nuevo modelo de DeepSeek. Rivalizando directamente con GPT-o1, este nuevo LLM desarrollado en China bajo el código R1 revolucionó rápidamente el mercado, dejando las primeras consecuencias en empresas estadounidenses.

Emergiendo como un gran contendiente, DeepSeek-R1 aprovecha los transformadores y otros formatos de razonamiento para optimizar la toma de decisiones. Su V3 es un sólido modelo de lenguaje, que integra aprendizaje por Mezcla de Expertos (MoE) con 671B de parámetros totales y con 37B activados para cada token. Esto le permite superar al GPT-4o y Llama 3.1 en una gran cantidad de campos, tales como Matemáticas 500 (EM), Codeforces (percentil) y DROP (3-shot F1/inglés).

Sin embargo, lo que ha impactado al mercado es su costo y lanzamiento. Según indicaron sus creadores a diferentes medios internacionales, DeepSeek solo contó con una inversión de 5.6 millones USD. Por otra parte, su desarrollo solo necesitó 2048 gráficas H800 NVIDIA, variantes menos potentes que las H100, GPUs actualmente usadas en EEUU para estos campos.

Adicionalmente, DeepSeek es de código abierto y utilizable de forma local. Para correrlo en tu computadora, se puede usar mediante Ollama, mientras que es compatible con GPU AMD y Huawei Ascend NPU. También tiene su API, disponible desde el mismo sitio oficial.

DeepSeek sacude NVIDIA

La llegada de DeepSeek fue bien recibida por la comunidad tecnológica, pero dejó con secuencias directas en las grandes norteamericanas dedicadas a IA. A quien más le impactó fue a NVIDIA, bajando más de 17% de sus acciones y perdiendo más de $589.000 millones de USD al día del nuevo estreno de R1.

Los motivos tienen netamente que ver con un “rompimiento en la actual burbuja de la IA”, centrado en “más gastos dan mejor rendimiento”. Comparado a las potentes GPU NVIDIA H800 y dichos de Sam Altman, CEO de OpenIA, en 2023 que entrenar GPT-4 había costado $100 millones de USD, DeepSeek logró una superioridad de campos utilizando solo una fracción de los recursos y capacidad de procesamiento.

Sam Altman elogia a DeepSeek

Por otro lado, su estreno tampoco ha pasado desapercibido entre expertos y su propia competencia. El mismo CEO de OpenAI indicó por Twitter X que es un “modelo impresionante, especialmente teniendo en cuenta lo que pueden ofrecer por el precio” y que es “estimulante tener un nuevo competidor”.

Esto también hizo reaccionar a Altman en esta carrera de IA, puesto a que mencionó que próximamente ofrecerán modelos mucho mejores y algunos nuevos.

deepseek's r1 is an impressive model, particularly around what they're able to deliver for the price.

we will obviously deliver much better models and also it's legit invigorating to have a new competitor! we will pull up some releases.
— Sam Altman (@sama) January 28, 2025

Pese a que DeepSeek tiene varios puntos donde rivaliza con GPT-o1, el modelo de OpenIA todavía tiene la ventaja gracias a su capacidad de Ver y Escuchar en tiempo real. Sin embargo, tomando en cuenta que este nuevo competidor está acaparando mucho las miradas, es probable que veamos en un futuro cercano avances como GPT-o3. Además, podría adelantar los avances en AGI, campo de investigación de OpenAI que busca crear software con inteligencia similar a la humana.

The Last of Us T2: así trabajan los productores Jacqueline Lesko…

Review | Drop: Amenaza Anónima, una experiencia de tensión

Review | El día que la Tierra explotó, los Looney Tunes…

Ragnarok Online: cómo entrar al Open Beta y activar el OTP…

Review | Kaiju No. 8: Misión de Reconocimiento

Hideo Kojima comenzará su nuevo Podcast por Spotify en septiembre

Avisos | Temporada 2022 de Ñoñocast regresará hoy en vivo

Podcast #4 El Rincón del Anime AGCL | Placeres Culpables

Podcast | El Afro y la Bestia #1

DeepSeek: nuevo modelo IA de origen chino impacta al mercado

DeepSeek sacude NVIDIA

Sam Altman elogia a DeepSeek

Próximos eventos

Evento | Quinta Hobby 2025

Estreno | Until Dawn: Una noche de Terror

Estreno | Colorful Stage! La película: Miku no puede cantar

Estreno | El Contador 2

Estreno | Infierno en el pantano

¡Siguenos!

Últimas noticias

The Last of Us T2: así trabajan los productores Jacqueline Lesko y Cecil O’Connor

Nintendo Switch 2: precios de consola en EEUU se mantendrá, pero accesorios subirán

Anuncian Star Wars: Starfighter, nueva película protagonizada por Ryan Gosling

Te recomendamos leer:

The Last of Us T2: así trabajan los productores Jacqueline Lesko y Cecil O’Connor

Review | Drop: Amenaza Anónima, una experiencia de tensión

Review | El día que la Tierra explotó, los Looney Tunes regresan

Ragnarok Online: cómo entrar al Open Beta y activar el OTP en GNJOY LATAM

Review | Kaiju No. 8: Misión de Reconocimiento

Ragnarok Online América Latina se estrenará en mayo

The Last of Us T2: así trabajan los productores Jacqueline Lesko...

Nintendo Switch 2: precios de consola en EEUU se mantendrá, pero...