Qwen es una familia de modelos de IA multifacética desarrollada por Alibaba Cloud, que abarca modelos de lenguaje de gran tamaño (LLM), modelos de lenguaje de visión (VL) y más.
Serie Qwen 2.5
- Qwen 2.5: LLM ajustados según las instrucciones en varios tamaños (por ejemplo, 72B).
- Codificador Qwen 2.5: Especializado para tareas de codificación.
- Qwen 2.5 - Matemáticas: Diseñado para el razonamiento matemático avanzado.
- QWEN 2.5-VL: Modelo de lenguaje visual capaz de comprender documentos y vídeos largos. Disponible en varios tamaños de hasta 72 GB.
- Qwen 2.5 Omni: Modelo multimodal que maneja texto, imagen, vídeo y audio.
QWQ-32b
- Un modelo optimizado para el razonamiento con 32 B parámetros. Integrado en Qwen Chat y diseñado para ofrecer sólidas capacidades de resolución de problemas.
Serie Qwen3
- El último buque insignia. Incluye arquitecturas densas y con una mezcla de expertos (MoE) que van desde Parámetros de 0.6B a 235B, con 22 B de parámetros activos en la variante más grande.
- Introduce modo de pensamiento (para un razonamiento profundo) y modo sin pensar (para mayor velocidad), junto con un presupuesto pensante mecanismo.