Qwen ist eine facettenreiche KI-Modellfamilie, die von Alibaba Cloud entwickelt wurde und große Sprachmodelle (LLMs), Vision-Language Models (VL) und mehr umfasst.
Qwen2.5-Serie
- Qwen 2.5: Auf Anweisungen abgestimmte LLMs in verschiedenen Größen (z. B. 72B).
- Qwen2.5-Kodierer: Spezialisiert auf Programmieraufgaben.
- Qwen 2.5-Math: Maßgeschneidert für fortgeschrittenes mathematisches Denken.
- QWen 2,5-VL: Vision-Language-Modell, das in der Lage ist, Dokumente zu verstehen und lange Videos zu verstehen. Erhältlich in mehreren Größen bis zu 72B.
- Qwen 2.5-Omni: Multimodales Modell zur Verarbeitung von Text, Bild, Video und Audio.
QWQ-32 b
- Ein für das Denken optimiertes Modell mit 32B-Parametern. In Qwen Chat integriert und für starke Problemlösungsfunktionen konzipiert.
Qwen3-Serie
- Neuestes Flaggschiff. Beinhaltet Architekturen mit hoher Dichte und Mixture-of-Experts (MoE), die von Parameter 0,6 B bis 235 B, mit 22B aktiven Parametern in der größten Variante.
- Führt ein Denkmodus (für tiefgründige Überlegungen) und Modus ohne Denken (für Geschwindigkeit), zusammen mit einem überlegtes Budget Mechanismus.