DeepSeek adquiere el control: la IA de código abierto que está cambiando las cosas

Tag :

La innovación ha sido el hito más significativo para la humanidad desde el principio de los tiempos. Desde la primera rueda hasta el primer cohete en llegar al espacio, nos hemos esforzado para ser las primeras naciones en tener éxito donde otras han fallado, para traer una nueva era de cambio. Ser humano es evolucionar, y nuestro panorama digital en rápido cambio es sólo un testimonio de esa necesidad inherente. La Inteligencia Artificial (IA) ha sido uno de los mayores avances tecnológicos de nuestra década y parece que solo estamos en la cúspide de su pleno potencial.

Desde que surgió la primera tecnología de IA, países de todo el mundo han entrado en una carrera para ser los primeros en mejorar y elevar la tecnología. Ahora, estamos en una carrera a toda velocidad a medida que la IA se vuelve más accesible y avanzada. A finales del 2022, OpenAI lanzó ChatGPT y abrió las puertas para que otras plataformas de IA y Grandes Modelos de Lenguaje (LLMs) tomen el centro del escenario. Desde entonces, empresas como Google, Microsoft, Anthropic y Meta han lanzado sus propios chatbots y modelos de IA. Sin embargo, el panorama estaba a punto de cambiar una vez más con la aparición de DeepSeek.

La empresa China de IA lanzó su LLM DeepSeek R1 el 20 de enero de 2025, y en cuestión de días, el asistente DeepSeek AI se convirtió en la app más descargada en la AppStore de Apple, superando casi instantáneamente a la aplicación móvil de ChatGPT de OpenAI. La nueva y revolucionaria plataforma acaparó titulares además por costar solo una fracción de lo que sus plataformas rivales gastaron en su creación. DeepSeek también lanzó su plataforma bajo una licencia de código abierto y uso gratuito, lo que significa que cualquiera puede acceder a su código, ver cómo funciona y modificarlo como quiera.

Naturalmente, la repentina popularidad de DeepSeek causó una gran conmoción en el mercado bursátil y varias compañías de IA con sede en EE.UU. perdieron valor, incluyendo NVIDIA. Microsoft, Meta y más. En este artículo de blog, revisamos cómo DeepSeek ha transformado el panorama de la IA y qué puede brindarles a los usuarios de todo el mundo. También examinamos la ciber amenaza inherente de las plataformas de IA como DeepSeek y cómo los actores de amenaza podrían capitalizar estas tecnologías evolucionadas. Por ahora, obtengamos un mejor entendimiento sobre DeepSeek en sí mismo.

What Is DeepSeek - Logo of DeepSeek

Imagen de Shutterstock

¿Qué es DeepSeek?

DeepSeek es una firma de desarrollo de IA con sede en Hangzhou, China. Fundada en 2023 por Liang Wenfeng, la compañía actúa como un laboratorio de investigación de IA independiente bajo el amparo de High-Flyer, un fondo de cobertura cuantitativo también cofundado por Wenfeng. En noviembre de 2023, DeepSeek lanzó su primer modelo de código abierto. Desde entonces, la empresa ha lanzado varias actualizaciones y variaciones de la plataforma de IA original. Sin embargo, fue solo en 2025 que DeepSeek R1 se afianzó a escala global.

La empresa fue noticia después de encabezar las listas de descargas de aplicaciones y provocar la repentina caída de varias acciones tecnológicas americanas. DeepSeek también es una empresa privada, lo que significa que los inversores no pueden comprar sus acciones en ninguna de las bolsas. DeepSeek R1 rivaliza sin esfuerzo con el último Modelo o1 de OpenAI, y DeepSeek no tiene vergüenza de mostrarlo con orgullo, en el banner de su página web se puede leer que “DeepSeek R1 ya está disponible y es de código abierto, compitiendo con el Modelo o1 de OpenAI”. La empresa va más allá e incluso tiene una tabla comparando sus capacidades con las de sus rivales en la página de inicio, donde, sin sorpresa alguna, DeepSeek siempre sale ganando.

DeepSeek V3 Capablities

Imagen de DeepSeek

Sin embargo, la plataforma en sí puede compararse con las plataformas de OpenAI en términos de características y puede usarse para muchas de las mismas tareas. DeepSeek sobresale en varias, incluyendo matemáticas y programación. Al igual que el modelo o1 de OpenAI, y DeepSeek R1 es un “modelo de razonamiento” que produce respuestas de forma incremental, simulando la forma en que razona un humano los problemas o ideas.

Uno de los principales puntos de interés del repentino auge de DeepSeek parece provenir de lo económico de su creación. Según la empresa, se necesitaron menos de 6 millones de dólares para entrenar DeepSeek R1, esto es solo una increíble fracción de los cientos de millones estimados que OpenAI insinúa haber gastado para entrenar a GPT-4. DeepSeek también utiliza menos memoria que sus competidores, reduciendo también el costo de realizar tareas para los usuarios. La compañía también ha encontrado la manera de sortear las restricciones de EE.UU. sobre el acceso de chips potentes a China, ya que, según se informa, el fundador de DeepSeek acumuló un stock de chips NVIDIA A100 en 2022.

El capitalista de riesgo Marc Andreessen describió DeepSeek como “el momento Sputnik de la IA”, una referencia al lanzamiento del satélite soviético que desencadenó la carrera espacial de la Guerra Fría. Continúa afirmando que DeepSeek R1 es uno de los avances más asombrosos e impresionantes que jamás haya visto. Así que, para profundizar en su evaluación, veamos algunas de las principales características y funciones de DeepSeek.

Características y Funciones Clave de DeepSeek

DeepSeek funciona de muchas maneras igual que los modelos de IA anteriores, respondiendo preguntas, redactando historias o letras de canciones, resolviendo problemas matemáticos u ofreciendo escribir una receta para la cena según lo que tienes en el refrigerador. Simplemente debes poner una indicación (prompt) y DeepSeek encontrará la respuesta. DeepSeek también cuenta con una opción de búsqueda integrada en su chatbot, permitiendo a los usuarios usar la plataforma como un motor de búsqueda web. La plataforma también puede comunicarse en múltiples idiomas, pero es más fuerte en inglés y chino.

Actualmente, DeepSeek tiene dos modelos disponibles: DeepSeek-V3 y DeepSeek-R1. DeepSeek-V3 es más un asistente de chatbot de propósito general que puede resolver diversas preguntas y realizar tareas como escribir, editar, programar y analizar datos. Cabe señalar que DeepSeek también está limitado por la incapacidad de verificar información real como sus contrapartes occidentales y también puede ser propenso a “alucinaciones”.

DeepSeek-R1, por otro lado, es el modelo de razonamiento que se centra en tareas más complejas. Este modelo está diseñado para deducciones lógicas paso a paso y resolución de problemas, haciéndolo mejor en preguntas de matemáticas e indicaciones que requieran de un pensamiento más profundo, lo que significa también que tardará más en responder. Si bien el chatbot utilizará por defecto el modelo DeepSeek-V3, puedes cambiar fácilmente a DeepSeek-R1 haciendo clic en el botón “DeepThink (R1)” debajo, en la barra de indicaciones.

DeepSeek es de uso gratuito, lo que significa que no necesitas ningún tipo de suscripción. Simplemente abres DeepSeek.com y haces clic en “Start Now” para crear una cuenta o ingresar con tu cuenta de Google. También puedes descargar la app de DeepSeek. Sin embargo, si deseas usar DeepSeek profesionalmente y utilizar las API para conectarte a DeepSeek para tareas como programar en segundo plano, conllevará un costo. Actualmente es de solo $0.55 USD por millón de tokens de entrada y $2.19 USD por millones de tokens de salida. Esto se compara muy favorablemente con la API de OpenAI que cuesta $15 USD y $60 USD respectivamente.

En una reseña de producto de DeepSeek R1 en Medium, MAA1 elogió las respuestas de pensamiento y razonamiento de DeepSeek. Poniendo a prueba la capacidad de esta IA de pensar en tiempo real, le pidió a la plataforma que le dijera cómo construir una aplicación de chat con un Front-End de React. Usando la búsqueda predeterminada, se le dijo que el servicio de búsqueda de DeepSeek estaba ocupado, pero, al usar DeepSeek-R1 recibió una respuesta más elaborada.

Medium product review of DeepSeek R1

Imagen de Medium

El evaluador encontró que la respuesta dada era un buen ejemplo de las capacidades de pensamiento y razonamiento en tiempo real de DeepSeek. A continuación, probó las capacidades de generación de código de la plataforma y descubrió que eran bastante similares a ChatGPT, Claude y otras plataformas de IA.

Según Tech Radar, DeepSeek ha podido desarrollar LLMs rápidamente utilizando un proceso innovador de entrenamiento que se basa en prueba y error para automejorarse. Así que, en esencia, los Modelos de Aprendizaje de Lenguaje de DeepSeek aprenden de una manera similar al aprendizaje humano, recibiendo retroalimentación basada en sus acciones. Los modelos de la empresa también utilizan una arquitectura de Mezcla de Expertos (MoE) que activa sólo una pequeña fracción de los parámetros en un momento dado, reduciendo significativamente los costos computacionales y haciendo que los modelos sean más eficientes.

Mientras DeepSeek puede parecer similar al modelo de OpenIA, la empresa reveló que utiliza un enfoque diferente para entrenar a sus modelos de R1. Este método consume menos tiempo, es más rentable y utiliza menos aceleradores de IA. En un artículo de investigación, DeepSeek describe las múltiples innovaciones que desarrolló como parte del modelo R1, incluyendo las siguientes:

Aprendizaje por Refuerzo: Un enfoque de aprendizaje por refuerzo a gran escala centrado en tareas de razonamiento.
Ingeniería de Recompensas: El desarrollo de un sistema de recompensas basado en reglas para el modelo que supera a los modelos de recompensa neuronales que se usan más comúnmente, creando un sistema de incentivos que guía el aprendizaje de un modelo de IA en el entrenamiento.
Destilación: El uso de técnicas eficientes de transferencia de conocimientos para comprimir capacidades en modelos tan pequeños como 1.5 mil millones de parámetros.
Red de Comportamiento Emergente: Un entendimiento de que patrones complejos de razonamiento pueden desarrollarse naturalmente a través del aprendizaje por refuerzo sin programarlos explícitamente.

Ahora, para poner las cosas en perspectiva, veamos una línea de tiempo más concreta de los eventos clave e hitos que alcanzó DeepSeek con su repentino ascenso a la fama.

Eventos Clave e Hitos para DeepSeek

Mayo de 2023: Se funda DeepSeek y comienza su trabajo en crear varias iteraciones de modelos de IA generativa.

Noviembre de 2023: Se lanza DeepSeek Coder. Este fue el primer modelo de código abierto de la empresa diseñado específicamente para tareas relacionadas con la programación.

Diciembre de 2023: Lanzamiento de DeepSeek LLM como la primera versión del modelo de propósito general de la empresa.

Mayo de 2024: Se lanza DeepSeek-V2 como la segunda versión del LLM de la empresa y se centra principalmente en ofrecer un rendimiento sólido y reducir los costos de entrenamiento. El modelo también tenía un plan de precios competitivamente bajo que obligó a las marcas rivales locales a bajar sus precios.

Julio de 2024: Se presenta DeepSeek-Coder-V2. Este modelo de 236 mil millones de parámetros ofreció una ventana de contexto de 128,000 tokens y fue diseñado para desafíos complejos de programación.

Diciembre de 2024: Finalmente se lanza DeepSeek-V3 y utiliza una arquitectura de Mezcla de Expertos que le permite manejar una variedad de tareas. El modelo tenía 671 mil millones de parámetros con una longitud de contexto de 128,000.

Enero de 2025: DeepSeek-V3 supera sin esfuerzo a ChatGPT para convertirse en la aplicación gratis mejor valorada disponible en la AppStore de Apple en Estados Unidos.

20 de Enero de 2025: DeepSeek-R1 toma el centro de la escena. Este modelo se basa en DeepSeek-V3 y se centra en tareas de razonamiento avanzado mientras compite directamente con el modelo o1 de OpenAI en términos de rendimiento. También cuesta significativamente menos. Al igual que DeepSeek-V3, este modelo tiene 671 mil millones de parámetros con una longitud de contexto de 128,000.

27 de Enero: La aplicación móvil de DeepSeek fue descargada 1.6 millones de veces y es la app número uno en las tiendas de iPhone en Australia, Canadá, China, Singapur, EE.UU. y el Reino Unido.

27 de Enero de 2025: DeepSeek provoca pánico en el mercado bursátil esa semana, con Microsoft cayendo un 3.7%, Tesla 1.3%, NVIDIA 15%, y Broadcom 16%. Impulsado por el éxito de DeepSeek, esto deja al NASDAQ, el índice tecnológico más importante, con una baja de 3.5%, camino a su tercer peor día en los últimos dos años.

27 de Enero 2025: Se lanza Janus-Pro-7B como un modelo de visión que puede comprender y generar imágenes.

9 de Febrero 2025: Los modelos DeepSeek R1 y V3 se clasifican como los dos mejores modelos de lenguaje en Chatbot Arena, una plataforma de rendimiento alojada por la Universidad de California, en Berkeley.

Marina Zhang, profesora asociada de la Universidad de Tecnología de Sydney, dijo a la BBC que los avances de DeepSeek se celebran como un testimonio de la creciente destreza tecnológica y la autosuficiencia de China. También afirma que el éxito de la empresa se ve como “una validación de la Innovación 2.0 de China, una nueva era de liderazgo tecnológico local impulsada por una generación de emprendedores más jóvenes.”

Para comprender mejor la importancia de que DeepSeek sea una plataforma de IA de código abierto, veamos más a fondo qué es la IA de código abierto.

¿Qué es una IA de Código Abierto?

La IA de Código Abierto tiene un código fuente de libre acceso que permite a los usuarios copiar, descargar y construir sobre el modelo. Este tipo de modelo fomenta un entorno colaborativo para que los desarrolladores utilicen, modifiquen y distribuyan tecnologías de IA. La inteligencia artificial de código abierto impulsa la innovación y la creación de diversas aplicaciones de la IA. El hecho de que DeepSeek use una IA de código abierto la hace más accesible y facilita las aplicaciones de IA en todas las comunidades, a diferencia de sus rivales de Silicon Valley.

Jim Fan, gerente senior de investigación en NVIDIA, escribió en X: “Estamos viviendo en una línea temporal donde una compañía no estadounidense mantiene viva la misión original de OpenAI, una investigación de frontera realmente abierta que empodera a todos.”

Según Clement Delangue en X, que DeepSeek sea de código abierto significa que las empresas de productos pueden cambiar entre diferentes proveedores y centrar sus esfuerzos en su producto y la experiencia del cliente. Sigue afirmando que desde su lanzamiento hace solo unos días, se habían creado más de 500 modelos derivados de DeepSeek y el modelo de datos se había descargado más de 2.5 millones de veces.

Si bien la IA en todas sus formas puede ser útil para elevar el contenido y simplificar tareas en todos los sectores, existe un riesgo inherente que trae la rápida velocidad a la que crece la tecnología.

Preocupaciones de Ciberseguridad de DeepSeek

Desde el principio, la IA ha enfrentado duras críticas por su capacidad de ser utilizada para generar malware y facilitar las ciber amenazas existentes, al mismo tiempo que crea un conjunto completamente nuevo de riesgos. ChatGPT recibió muchas críticas luego de su lanzamiento al mercado, y DeepSeek ha sufrido lo mismo. Sin embargo, es importante tener en cuenta que estas plataformas tienen medidas de seguridad implementadas para tratar de prevenir el uso indebido de sus plataformas.

Debido al rápido éxito de la plataforma, DeepSeek ha tenido que sortear varias acusaciones de que su plataforma no es segura. Un informe reciente de investigadores mostró que tras rigurosas pruebas en una versión de DeepSeek-R1, el modelo falló en múltiples áreas críticas, incluyendo sucumbir al jailbreaking, inyección de prompts, generación de malware, cadena de suministro y toxicidad. Las pruebas convencieron a DeepSeek para crear malware el 98.8% de las veces.

Se ha informado que el Jailbreaking se ha utilizado en DeepSeek antes y se refiere a la manipulación de modelos de IA para generar contenido sin censura o sin restricciones. Esto permite a los hackers eludir las medidas de seguridad implementadas por las plataformas para evitar que se utilicen para producir contenido ilegal. Los hackers pueden aprovechar esto para evolucionar sus técnicas y habilidades y cometer actos mayores de ciberdelitos. La accesibilidad de estas plataformas también significa que los novatos pueden introducirse en el campo sin ninguna habilidad y orquestar fácilmente ciberataques guiados por la IA.

Mientras esos parecen ser resultados desalentadores, también es importante comprender que todas las plataformas de IA son inherentemente capaces de ser utilizadas con fines infames. También vale la pena señalar que una gran mayoría de las investigaciones e informes que desacreditan a DeepSeek pueden estar sesgados en contra de una empresa no occidental que inesperadamente ocupa espacio en el mercado.

Conclusión

Aunque todavía puede haber controversia en torno a DeepSeek, es importante señalar que la tecnología siempre está avanzando y mejorando. Si bien puede haber contratiempos en el camino, no debemos descartar ninguna innovación sin tener una causa. CNN informó que la noción de que se puedan lograr capacidades similares a las de los modelos de IA más potentes de EE.UU. por una fracción tan pequeña del costo, y con chips de menor capacidad, representa un cambio radical en la comprensión de la industria sobre cuánta inversión se necesita para las IA.

Si bien la IA sigue enfrentando críticas y reacciones negativas en todo el mundo, por muchas razones justificables, también puede ser usada como una herramienta para mejorar la vida. DeepSeek ha logrado crear una plataforma de IA de manera mucho más eficiente que antes y, en lugar de recibir este hecho con hostilidad, deberíamos estar abiertos a nuevas ideas que revolucionan la forma en que entendemos las tecnologías.

Qué es DeepSeek: Una Guía Sobre la IA de Código Abierto y Preocupaciones Sobre la Ciberseguridad

¿Qué es DeepSeek?

Características y Funciones Clave de DeepSeek

Eventos Clave e Hitos para DeepSeek

¿Qué es una IA de Código Abierto?

Preocupaciones de Ciberseguridad de DeepSeek

Conclusión

Search

Get in Touch

See Other Product

Meet the Author

Sangfor Technologies

Qué es DeepSeek: Una Guía Sobre la IA de Código Abierto y Preocupaciones Sobre la Ciberseguridad

¿Qué es DeepSeek?

Características y Funciones Clave de DeepSeek

Eventos Clave e Hitos para DeepSeek

¿Qué es una IA de Código Abierto?

Preocupaciones de Ciberseguridad de DeepSeek

Conclusión

Table Of Content

Search

Get in Touch

Related Articles

Building a Business Case for SASE: A Guide for IT Leaders on Presenting SASE to C-Level Executives

Turkish Cybersecurity Law: A New Dawn for Cybersecurity in Turkey

Kuala Lumpur Airport Cyberattack: Protecting KLIA from Future Threats

See Other Product

Meet the Author

Sangfor Technologies