Tres razones por las que el nuevo modelo de DeepSeek es importante

En términos de rendimiento, V4 es, tal vez como era de esperar, un gran salto con respecto a R1 y parece ser una fuerte alternativa a casi todos los últimos grandes modelos de IA. En los principales puntos de referencia, según los resultados compartidos por la empresa, DeepSeek V4-Pro compite con los principales modelos de código cerrado, igualando el rendimiento de Claude-Opus-4.6 de Anthropic, GPT-5.4 de OpenAI y Gemini-3.1 de Google. Y en comparación con otros modelos de código abierto, como Qwen-3.5 de Alibaba o GLM-5.1 de Z.ai, DeepSeek V4 los supera a todos en codificación, matemáticas y problemas STEM, lo que lo convierte en uno de los modelos de código abierto más potentes jamás lanzados.

DeepSeek también dice que V4-Pro ahora se encuentra entre los modelos de código abierto más sólidos en los puntos de referencia para tareas de codificación agente y funciona bien en otras pruebas que miden la capacidad para llevar a cabo problemas de varios pasos. Su capacidad de escritura y su conocimiento mundial también lideran el campo, según los resultados de las evaluaciones comparativas compartidas por la empresa.

En un informe técnico publicado junto con el modelo, DeepSeek compartió los resultados de una encuesta interna de 85 desarrolladores experimentados: más del 90% incluyó V4-Pro entre sus mejores opciones de modelo para tareas de codificación.

DeepSeek dice que ha optimizado específicamente V4 para marcos de agentes populares como Claude Code, OpenClaw y CodeBuddy.

2. Ofrece un nuevo enfoque para la eficiencia de la memoria.

Una de las innovaciones clave de V4 es su larga ventana de contexto: la cantidad de texto que el modelo puede procesar a la vez. Ambas versiones pueden manejar 1 millón de tokens, que es lo suficientemente grande como para caber en los tres volúmenes de El señor de los anillos y El hobbit conjunto. La compañía dice que este tamaño de ventana de contexto es ahora el predeterminado en todos los servicios de DeepSeek y coincide con lo que ofrecen las versiones de vanguardia de modelos como Gemini y Claude.

Pero es importante saber no sólo que DeepSeek ha dado este salto, sino cómo así lo hizo. V4 realiza cambios arquitectónicos significativos en los modelos anteriores de la compañía, especialmente en el mecanismo de atención, que es la característica de los modelos de IA que les ayuda a comprender cada parte de un mensaje en relación con el resto. A medida que el texto inicial se hace más largo, estas comparaciones se vuelven mucho más costosas, lo que convierte la atención en uno de los principales obstáculos para los modelos de contexto largo.

La Calientes

Las más vistas del miércoles

Saquemos a los bancoloteros del Congreso

El calor extremo en Europa está provocando el cierre de centrales eléctricas

2. Ofrece un nuevo enfoque para la eficiencia de la memoria.

Las más vistas del miércoles

El calor extremo en Europa está provocando el cierre de centrales eléctricas

Sigue búsqueda de prófugo por muerte de conductor en Santiago

La corrupción de la República Dominicana.

El Accidente de la Corrupción: El Impuesto de Sangre que Paga el Dominicano

Corrupción en el Sector Salud: La Travesía de Escándalos en la República Dominicana y el Caso SENASA

Diego Maradona, die WM-Legende: Die Hand Gottes im Portrait

What Does an Accountant Do?

Курсы форекс онлайн

Más Vistas

La corrupción de la República Dominicana.

El Accidente de la Corrupción: El Impuesto de Sangre que Paga el Dominicano

Corrupción en el Sector Salud: La Travesía de Escándalos en la República Dominicana y el Caso SENASA

Nuestra Selección

Las más vistas del miércoles

Saquemos a los bancoloteros del Congreso

El calor extremo en Europa está provocando el cierre de centrales eléctricas

La Calientes

Tres razones por las que el nuevo modelo de DeepSeek es importante

2. Ofrece un nuevo enfoque para la eficiencia de la memoria.

Relacionadas Publicaciones

Subscribete para Actualizaciones