DeepSeek R1 supera al modelo o1 de OpenAI en varias pruebas

Introducción a DeepSeek

DeepSeek es una startup china de inteligencia artificial que ha ganado fama recientemente gracias a su modelo de razonamiento abierto llamado R1. Este modelo ha demostrado ser capaz de superar al modelo o1 de OpenAI en varias pruebas de matemáticas, codificación y razonamiento. La empresa, fundada por Liang Wenfeng en mayo de 2023, ha logrado crear modelos exitosos utilizando chips más antiguos, lo que es impresionante según los estándares de la industria.

¿Qué es DeepSeek R1?

R1 es el modelo de razonamiento insignia de DeepSeek, que se ejecuta en la versión completa y ha demostrado ser capaz de superar al modelo o1 de OpenAI en varias pruebas. Lo que hace que R1 sea interesante es que, a diferencia de la mayoría de los otros modelos principales de las empresas de tecnología, es de código abierto, lo que significa que cualquier persona puede descargarlo y utilizarlo. Sin embargo, DeepSeek no ha divulgado el conjunto de datos de entrenamiento de R1.

Características y ventajas de DeepSeek

DeepSeek es más barato que los modelos comparables de EE. UU. Por ejemplo, el acceso a la API de R1 comienza en $0,14 por un millón de tokens, una fracción de los $7,50 que cobra OpenAI por el nivel equivalente. La empresa afirma en un artículo de investigación que su modelo V3, que se puede comparar con un modelo de chatbot estándar como Claude, costó $5,6 millones para entrenar, una cifra que se ha circulado (y disputado) como el costo total de desarrollo del modelo.

Desventajas y preocupaciones

Una desventaja que podría afectar la competencia a largo plazo del modelo con o1 y alternativas fabricadas en EE. UU. es la censura. Los modelos chinos a menudo incluyen bloques sobre ciertos temas, lo que significa que, aunque funcionan de manera comparable a otros modelos, es posible que no respondan a algunas consultas. A medida que aumenta el uso de DeepSeek, algunos están preocupados por que los sesgos sistémicos y las barreras de censura del modelo puedan estar integrados en toda clase de infraestructura.

Problemas de seguridad y privacidad

Los problemas de seguridad y privacidad que han surgido en torno a DeepSeek incluyen la exposición de una base de datos interna que contenía historiales de chat, claves de API de usuario y otros datos sensibles. La política de privacidad de la empresa también plantea algunas banderas rojas, ya que establece que la información personal se puede almacenar en servidores ubicados en la República Popular China.

Impacto en la industria de la IA

El éxito de R1 destaca un cambio en la IA que podría empoderar a los laboratorios y investigadores más pequeños para crear modelos competitivos y diversificar las opciones. Las organizaciones sin el presupuesto o el personal de OpenAI pueden descargar R1 y afinarlo para competir con modelos como o1. Esto podría hacer que la inversión en IA sea más asequible y accesible para una mayor cantidad de personas y organizaciones.

Conclusión

En resumen, DeepSeek es una startup china de inteligencia artificial que ha ganado fama recientemente gracias a su modelo de razonamiento abierto llamado R1. Aunque el modelo ha demostrado ser capaz de superar a otros modelos en varias pruebas, también plantea preocupaciones sobre la censura, la seguridad y la privacidad. A medida que la industria de la IA continúa evolucionando, es importante considerar estos factores y garantizar que los modelos de IA sean seguros, privados y éticos. La ascensión de DeepSeek puede ser un catalizador para el cambio en la industria de la IA, ya que los modelos de código abierto y más asequibles pueden hacer que la IA sea más accesible para una mayor cantidad de personas y organizaciones.

Прокрутить вверх