En términos de rendimiento, V4 es, tal vez como era de esperar, un gran salto con respecto a R1 y parece ser una fuerte alternativa a casi todos los últimos grandes modelos de IA. En los principales puntos de referencia, según los resultados compartidos por la empresa, DeepSeek V4-Pro compite con los principales modelos de código cerrado, igualando el rendimiento de Claude-Opus-4.6 de Anthropic, GPT-5.4 de OpenAI y Gemini-3.1 de Google. Y en comparación con otros modelos de código abierto, como Qwen-3.5 de Alibaba o GLM-5.1 de Z.ai, DeepSeek V4 los supera a todos en codificación, matemáticas y problemas STEM, lo que lo convierte en uno de los modelos de código abierto más potentes jamás lanzados.
DeepSeek también dice que V4-Pro ahora se encuentra entre los modelos de código abierto más sólidos en los puntos de referencia para tareas de codificación agente y funciona bien en otras pruebas que miden la capacidad para llevar a cabo problemas de varios pasos. Su capacidad de escritura y su conocimiento mundial también lideran el campo, según los resultados de las evaluaciones comparativas compartidas por la empresa.
En un informe técnico publicado junto con el modelo, DeepSeek compartió los resultados de una encuesta interna de 85 desarrolladores experimentados: más del 90% incluyó V4-Pro entre sus mejores opciones de modelo para tareas de codificación.
DeepSeek dice que ha optimizado específicamente V4 para marcos de agentes populares como Claude Code, OpenClaw y CodeBuddy.
2. Ofrece un nuevo enfoque para la eficiencia de la memoria.
Una de las innovaciones clave de V4 es su larga ventana de contexto: la cantidad de texto que el modelo puede procesar a la vez. Ambas versiones pueden manejar 1 millón de tokens, que es lo suficientemente grande como para caber en los tres volúmenes de El señor de los anillos y El hobbit conjunto. La compañía dice que este tamaño de ventana de contexto es ahora el predeterminado en todos los servicios de DeepSeek y coincide con lo que ofrecen las versiones de vanguardia de modelos como Gemini y Claude.
Pero es importante saber no sólo que DeepSeek ha dado este salto, sino cómo así lo hizo. V4 realiza cambios arquitectónicos significativos en los modelos anteriores de la compañía, especialmente en el mecanismo de atención, que es la característica de los modelos de IA que les ayuda a comprender cada parte de un mensaje en relación con el resto. A medida que el texto inicial se hace más largo, estas comparaciones se vuelven mucho más costosas, lo que convierte la atención en uno de los principales obstáculos para los modelos de contexto largo.

