Modelos open-weight de código que retan a Claude y GPT-5.5: DeepSeek V4 y Kimi K2.7
Durante un tiempo, elegir un modelo open-weight para programar era aceptar un peaje en calidad a cambio de ahorro o privacidad. En 2026 esa ecuación ha cambiado. Dos lanzamientos recientes, DeepSeek V4 y Kimi K2.7-Code, dejan claro que los modelos abiertos de código ya juegan en la liga de los frontera cerrados, y por una fracción del precio.
Y hay un argumento extra que esta misma semana se ha vuelto muy concreto: un modelo de pesos abiertos no lo puede retirar nadie por decreto. Si esto te suena, es porque acabamos de ver cómo el gobierno de EE. UU. obligó a Anthropic a apagar Claude Fable 5 de un día para otro. Con pesos abiertos descargados, eso no pasa.
DeepSeek V4: el open-weight que lidera en coding
El 24 de abril de 2026, DeepSeek publicó dos modelos open-weight bajo licencia MIT: V4-Pro (1,6 billones de parámetros totales, 49.000 millones activos por token) y V4-Flash (284.000 millones, 13.000 millones activos). Ambos exponen una ventana de contexto de 1 millón de tokens.
El dato que importa para programar: la variante tope, DeepSeek V4 Pro, alcanza un 80,6 % en SWE-bench Verified, la mejor marca entre modelos de pesos abiertos y a la altura de Gemini 3.1 Pro. Y lo hace siendo, según los datos publicados, del orden de 28 veces más barato por token de salida que Claude Opus 4.8. Incluso el instituto NIST publicó una evaluación de V4 Pro, señal de que el modelo se toma en serio.
Kimi K2.7-Code: lo más fresco de Moonshot
El 12 de junio de 2026, Moonshot AI publicó Kimi K2.7-Code en Hugging Face bajo una licencia MIT modificada. Es un modelo Mixture-of-Experts de 1 billón de parámetros (32.000 millones activos, 384 expertos), con 256.000 tokens de contexto y especializado en ingeniería de software agentica.
Moonshot reporta un +21,8 % sobre su propio Kimi Code Bench v2 frente a K2.6, además de usar alrededor de un 30 % menos de tokens de razonamiento. El precio de API es de 0,95 dólares de entrada y 4,00 de salida por millón de tokens. Una advertencia importante de honestidad: a fecha de su lanzamiento, todos los benchmarks publicados son los propios de Moonshot, sin números independientes de terceros todavía. Conviene esperar a evaluaciones externas antes de dar las cifras por definitivas.
Comparativa rápida
| DeepSeek V4 Pro | Kimi K2.7-Code | |
|---|---|---|
| Lanzamiento | 24 de abril de 2026 | 12 de junio de 2026 |
| Arquitectura | MoE 1,6 B totales / 49 B activos | MoE 1 B totales / 32 B activos |
| Contexto | 1 millón de tokens | 256.000 tokens |
| Licencia | MIT | MIT modificada |
| Precio API (entrada/salida) | Muy bajo (~28x más barato que Opus 4.8 en salida) | 0,95 / 4,00 USD por millón |
| SWE-bench Verified | 80,6 % (top open-weight) | Solo benchmarks propios por ahora |
| Pesos descargables | Sí | Sí (Hugging Face) |
Por qué te importan como desarrollador
Más allá del benchmark, hay tres razones prácticas para tenerlos en el radar:
- Coste: para cargas de trabajo intensas (agentes que mueven muchos tokens), la diferencia de precio frente a un modelo frontera cerrado es de uno o dos órdenes de magnitud. En un equipo, eso es presupuesto real.
- Control y privacidad: con pesos descargables puedes ejecutarlos en tu propia infraestructura, hacer fine-tuning y mantener el código sensible sin salir de tu red.
- Independencia: no hay vendor lock-in ni riesgo de que el modelo desaparezca por una decisión comercial o regulatoria. Lo que descargaste, es tuyo.
Cómo probarlos sin montar un clúster
No necesitas GPUs propias para empezar. Ambos están disponibles vía API (la de cada proveedor o agregadores como OpenRouter), así que puedes enchufarlos a tu flujo habitual igual que harías con Claude o GPT. Como hablan el formato de API estándar, encajan en herramientas como Cursor o en clientes que aceptan endpoints compatibles. Si te interesa montar un flujo multimodelo, te vendrá bien nuestra comparativa de Claude Code y Cursor y la guía de Cursor, que es de las que mejor soporta cambiar de modelo según la tarea.
Si más adelante quieres ejecutarlos en local, ten en cuenta que un modelo de 1 billón de parámetros pide hardware serio aunque solo active una fracción por token. Para la mayoría, empezar por API y reservar el despliegue local para casos concretos es lo más sensato.
La conclusión
Los modelos open-weight de código han dejado de ser la opción de consolación. DeepSeek V4 demuestra que un modelo abierto puede liderar en SWE-bench, y Kimi K2.7 que la cadencia de lanzamientos es altísima. Para un desarrollador, esto significa más opciones, más baratas y bajo tu control. Y en una semana en la que hemos visto desaparecer un modelo cerrado por orden gubernamental, el argumento de los pesos abiertos nunca había sido tan tangible.
📬 ¿Quieres estar al día de las herramientas de IA para developers?
Cada semana resumo las novedades más importantes en un email de 5 minutos.
Suscribirme gratis →