Qwen3-Coder

Modelo abierto para coding agéntico: 256K de contexto nativo (hasta 1M por extrapolación) + tool‑use

#ModelosAbiertos#CodingAgéntico#ContextoLargo256K#ToolUse#QwenCodeCLI

43 vistas

85 usos

Veredicto de LinkStart

Qwen3-Coder es una opción muy sólida si buscas un modelo abierto para coding agéntico con contexto muy largo y una historia de tooling práctica (Qwen Code CLI, endpoints OpenAI‑compatible). Valida latencia/coste en el tier de contexto que realmente usarás.

Por qué nos encanta

Familia abierta con fuerte enfoque agéntico y tool‑use
256K nativo y 1M por extrapolación para razonamiento a escala de repos
Integración clara con CLI y APIs OpenAI‑compatible

Lo que debes saber

Las variantes gigantes son pesadas de ejecutar; importa el proveedor/hosting
Precios escalonados por contexto pueden encarecer prompts ultra‑largos
Tool-calling requiere tokenizer/parser actualizados

Acerca de

Qwen3-Coder es una familia de modelos abiertos de Qwen especializada en programación agéntica: está pensada para comprensión de repos con contexto largo, tool‑use/function calling y flujos de coding multi‑paso. Variante flagship: Qwen3-Coder-480B-A35B-Instruct es un MoE (480B totales, 35B activos) orientado a tareas exigentes de coding y agentes. Ventaja de contexto largo: soporta 256K tokens de forma nativa y puede ampliarse hasta 1M con métodos de extrapolación (p. ej., YaRN), útil para razonamiento a escala de repositorio. Ecosistema de agentes: junto al modelo, Qwen publica Qwen Code (CLI adaptado de Gemini CLI) y guías oficiales para usar Qwen3‑Coder desde Claude Code y Cline vía endpoints compatibles con OpenAI. Funciones prácticas: el repositorio referencia FIM (fill‑in‑the‑middle) y un parser específico para tool/function calling. Precio: en la API hospedada de Alibaba Cloud Model Studio, qwen3-coder-plus se factura por tokens con precios escalonados por longitud de contexto; en el tier 0–32K empieza en $1 por 1M tokens de entrada y $5 por 1M tokens de salida, subiendo en tiers de contexto mayores.

Características Clave

✓256K de contexto nativo (hasta 1M con extrapolación) para comprensión a escala de repos
✓Enfoque agéntico: tool use/function calling y flujos de largo recorrido
✓CLI open‑source Qwen Code para workflows de agentes
✓Compatible con interfaces de agentes (Claude Code, Cline) vía endpoints OpenAI‑compatible
✓Soporta inserción FIM (fill‑in‑the‑middle)

Preguntas frecuentes

Qwen3-Coder es una familia de modelos abiertos de Qwen para coding y programación agéntica, con contexto largo y tool‑use.

Soporta 256K tokens de forma nativa y hasta 1M mediante extrapolación (p. ej., YaRN).

Sí. El blog oficial describe una configuración con API key de Alibaba Cloud Model Studio y un endpoint proxy de DashScope para Claude Code.