Qwen3-Coder
Modelo abierto para coding agéntico: 256K de contexto nativo (hasta 1M por extrapolación) + tool‑use
Qwen3-Coder es una opción muy sólida si buscas un modelo abierto para coding agéntico con contexto muy largo y una historia de tooling práctica (Qwen Code CLI, endpoints OpenAI‑compatible). Valida latencia/coste en el tier de contexto que realmente usarás.
Por qué nos encanta
- Familia abierta con fuerte enfoque agéntico y tool‑use
- 256K nativo y 1M por extrapolación para razonamiento a escala de repos
- Integración clara con CLI y APIs OpenAI‑compatible
Lo que debes saber
- Las variantes gigantes son pesadas de ejecutar; importa el proveedor/hosting
- Precios escalonados por contexto pueden encarecer prompts ultra‑largos
- Tool-calling requiere tokenizer/parser actualizados
Acerca de
Qwen3-Coder es una familia de modelos abiertos de Qwen especializada en programación agéntica: está pensada para comprensión de repos con contexto largo, tool‑use/function calling y flujos de coding multi‑paso. Variante flagship: Qwen3-Coder-480B-A35B-Instruct es un MoE (480B totales, 35B activos) orientado a tareas exigentes de coding y agentes. Ventaja de contexto largo: soporta 256K tokens de forma nativa y puede ampliarse hasta 1M con métodos de extrapolación (p. ej., YaRN), útil para razonamiento a escala de repositorio. Ecosistema de agentes: junto al modelo, Qwen publica Qwen Code (CLI adaptado de Gemini CLI) y guías oficiales para usar Qwen3‑Coder desde Claude Code y Cline vía endpoints compatibles con OpenAI. Funciones prácticas: el repositorio referencia FIM (fill‑in‑the‑middle) y un parser específico para tool/function calling. Precio: en la API hospedada de Alibaba Cloud Model Studio, qwen3-coder-plus se factura por tokens con precios escalonados por longitud de contexto; en el tier 0–32K empieza en $1 por 1M tokens de entrada y $5 por 1M tokens de salida, subiendo en tiers de contexto mayores.
Características Clave
- ✓256K de contexto nativo (hasta 1M con extrapolación) para comprensión a escala de repos
- ✓Enfoque agéntico: tool use/function calling y flujos de largo recorrido
- ✓CLI open‑source Qwen Code para workflows de agentes
- ✓Compatible con interfaces de agentes (Claude Code, Cline) vía endpoints OpenAI‑compatible
- ✓Soporta inserción FIM (fill‑in‑the‑middle)
Preguntas frecuentes
Qwen3-Coder es una familia de modelos abiertos de Qwen para coding y programación agéntica, con contexto largo y tool‑use.
Soporta 256K tokens de forma nativa y hasta 1M mediante extrapolación (p. ej., YaRN).
Sí. El blog oficial describe una configuración con API key de Alibaba Cloud Model Studio y un endpoint proxy de DashScope para Claude Code.