
Devlere baş tutuyor
Qwen3 ailesi, parametre sayısı 600 milyondan 235 milyara kadar değişen çok sayıda modelden oluşuyor. Parametre sayısı, bir yapay zeka modelinin sorun çözme yeteneğini direkt etkileyen kıymetli bir metrik olarak kabul ediliyor. Alibaba’nın açıklamasına nazaran, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini belli kıyaslamalarda geride bırakmayı başardı. Qwen3 modellerinin hiçbiri OpenAI’nin o3 ve o4-mini üzere en üst seviye yeni modellerden daha üstün görünmüyor, fakat yeniden de güçlü performans sergiliyorlar.
Ancak bu en güçlü model şimdi kamuya açık değil. Bunun yerine Qwen3-32B üzere daha küçük ancak tekrar de etkileyici performans sergileyen modeller Hugging Face ve GitHub üzerinden indirilebiliyor. Qwen3 modelleri ayrıyeten Fireworks AI ve Hyperbolic üzere bulut servis sağlayıcılar üzerinden de erişime açık durumda.
Hibrit yaklaşımı benimsiyor

Buna ek olarak kimi Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts – MoE) mimarisiyle çalışıyor. Bu prosedür, süreçleri alt misyonlara ayırarak uzman alt modellerin her birine dağıtıyor; böylelikle karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerliyor.
119 lisan ve 36 trilyon token
Alibaba, Qwen3’ün 119 dili desteklediğini ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham bilgi bitleridir; 1 milyon token yaklaşık 750.000 söze eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim bilgileri ortasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş bilgi kümeleri yer alıyor. Bu geniş bilgi tabanı sayesinde Qwen3, sırf genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü sonuçlar veriyor. Örneğin LiveCodeBench üzere yazılım kıyaslamalarında OpenAI’ın o1 modelinin önüne geçmeyi başarıyor. Alibaba, Qwen3’ün araç çağırma yeteneklerinin yanı sıra talimatları takip etme ve muhakkak bilgi formatlarını kopyalama konusunda da “üstün” olduğunu söylüyor.