¿Qué es DeepSeek y cómo funciona? Todo lo que se necesita saber para usar esta inteligencia artificial

  • 02 Feb 2025 05:12 AM

Explorando esta nueva tecnología de inteligencia artificial. Qué modelos ofrece, que ha irrumpido tanto en este nuevo mercado. Pero diferenciándose de las ya dominantes, tanto en sus mejoras como en sus limitaciones por defecto.

DeepSeek es una Inteligencia Artificial de código abierto y de origen chino, que llegó para competir contra las inteligencias artificiales desarrolladas y comercializadas por empresas estadounidenses.

La empresa propietaria y desarrolladora de este modelo de inteligencia artificial también tiene el nombre de DeepSeek (no confundir), y desarrollo su propio modelo de inteligencia de código abierto.

Este modelo de inteligencia artificial, tomó gran interés entre los usuarios al ser de código abierto y superó a ChatGPT en los conteos de descargas dentro de la App Store y la Play Store.

El código abierto es una manera de garantizar la innovación y es un gran beneficio para la comunidad. haciendo que cualquier persona pueda accesar al código. De esta manera, es posible descargar el proyecto DeepSeek y comenzar a editar códigos, archivos y demás objetos para adaptarla a sus necesidades y/o una actividad en concreto.

En contraparte, las inteligencias artificiales comerciales son de código cerrado por sus propietarios, argumentando que la inversión privada y propietaria es la única manera de garantiza el desarrollo continuo y su alta calidad. Pero ahora vemos que no es así.

¿Qué es el modelo DeepSeek?

El modelo DeepSeek es una inteligencia artificial que destaca por contar con una arquitectura MoE (Mixture of Expert) que está revolucionando el campo de la inteligencia artificiale.

MoE es una gran novedad, puesto que implica diferentes modelos que se especializan en una tarea concreta. Esto hace que cada orden de entrada se asigne a un "experto" (learners) en concreto para ofrecer un resultado preciso.

También integra LLM (Large Language Model) para brindar resultados más naturales en sus respuestas.

Cuenta con diferentes modelos de inteligencia artificial, que se diferencian por la cantidad de parámetros permitidos, a mayor parámetros mayor capacidad de procesamiento e iteraciones, por la tanto, más avanzado.

Al ser de código abierto y gratuito, no hace falta pagar para acceder a alguno de sus modelos, se pueden descargar, instalar e iniciar los prompts para obtener resultados.

Los modelos disponibles en DeepSeek

En este momento DeepSeek cuenta con dos modelos diferentes:

DeepSeek V3

Este model se basa en procesar la información de bases de datos extensas para obtener resúmenes de artículo e información actualizada en tiempo real.

Este modelo se enfrenta directamente a GPT-4o o Llama 3.1 superándolos en pruebas de programación y se destaca por ser más económica y eficiente que sus competidores; dado que solo requiero 5.5 millones de dólares para entrenarse a diferencia con los 80 millones de dólares que requirió GPT-4.

DeepSeek R1

Este modelo es más reciente y es especializado en razonamiento para trabajar en prueba lógicas, problemas matemáticos y programación. El resultado también ha sido realmente bueno en los benchmarks (emular procesos para obtener mejores prácticas) que ha igualado en rendimiento a las inteligencias artificiales que ya estaban dominando el mercado.

También es mucho más eficiente que sus competidores como ChatGPT o1, con un 95% menos de coste y 671 mil millones de parámetros. Poniendo cifras, en pruebas matemáticas MATH-500 R1 ha conseguido acertar en un 97.3% de los casos, mientras que el modelo de OpenAI ha acertado el 96.4%.

¿Cómo trabaja?

DeepSeek se ha destacado por contar con un modelo de entrenamiento diferente, que se basa en utilizar datos que no estaban etiquetados, sino que se le dan los datos brutos para que aprenda por el método de prueba y error.

Así, si al inicio los resultados son erráticos, en cada iteración va aprendiendo a cómo debe actuar y perfeccionar las respuestas va generando y haciendola más eficiente la inteligencia artificial.

¿Cómo usar DeepSeek?

Para poder utilizar la inteligencia artificial de DeepSeek no hay que realizar nada extraño, Su interfaz es muy similar a la de OpenIA, en donde se encuentra una caja de texto (y botón) para poder introducir el prompt usando lenguaje natural si queremos evitar palabras técnicas, pero obviamente, mientras más detallada las instrucciones, mucho mejor va a ser el resultado.

¿Qué podemos hacer con DeepSeek?

Con DeepSeek vas a poder interactuar como cualquiera de las otras inteligencias artificiales en el mercado. Tiene la capacidad de responder a cualquier cosa que le preguntes.

Esta inteligencia puede ayudarte con las planificación, explicarte un concepto que no tengas claro, crear tablas, menús, formas de entrenamiento, etc. según tu creatividad.

También vas a poder estar actualizado con información reciente internet a las preguntas que le hagas, no limitándose a los conocimientos almacenados, que podrían estar desactualizados, pero se actualizan con los nuevos resultados.

Cuenta con un botón "DeepThink R1", que hará que piense en el prompt antes de generar la respuesta. Un pensamiento que se podrá leer en una fuente diferente, más discreta. Con esto podemos ayudarnos a generar instrucciones más detallas y por consiguiente obtener resultados más precisos.

Limitaciones de DeepSeek

DeepSeek está limitada a las imágenes al no integrar esta tecnología aún, no es posible la creación de imágenes o analizarlas. La subida de archivos es solo con el objetivo de extraer texto de ellas.

También está limitada en sus resultados por términos regulatorios de China, esto significa que no tratar temas en concreto. Por ejemplo: Sobre el conflicto entre Taiwan y China o Tinananmen son temas vetados, y aunque genera el resultado textual, termina por borrarlo por completo y muestra un mensaje en el que avisa que puede ayudarnos con nuestro tema.

Esa es la parte negativa por ser tecnología china, en donde debe alinearse a las normas del Gobierno Chino, bastante restrictivas en materia geopolítica.