Qwen est une famille de modèles d'IA à multiples facettes développée par Alibaba Cloud, qui englobe de grands modèles de langage (LLM), des modèles de langage de vision (VL), etc.
Série Qwen2.5
- Qwen 2,5: LLM adaptés aux instructions de différentes tailles (par exemple, 72B).
- Codeur Qwen 2.5: Spécialisé pour les tâches de codage.
- Qwen 2.5 - Mathématiques: Conçu pour un raisonnement mathématique avancé.
- QWEN 2,5 VL: Modèle Vision-Language capable de comprendre des documents et de comprendre de longues vidéos. Disponible en plusieurs tailles jusqu'à 72B.
- Qwen 2.5 Omni: Modèle multimodal gérant le texte, l'image, la vidéo et l'audio.
QWQ-32b
- Un modèle optimisé pour le raisonnement avec 32B paramètres. Intégré à Qwen Chat et conçu pour offrir de solides capacités de résolution de problèmes.
Série Qwen3
- Dernier produit phare. Comprend des architectures denses et mixtes d'experts (MoE) allant de Paramètres de 0,6B à 235B, avec 22B paramètres actifs dans la plus grande variante.
- Présente mode de réflexion (pour un raisonnement approfondi) et mode non-penseur (pour la rapidité), ainsi qu'un budget réfléchi mécanisme.