Alibaba, hibrit yapay zeka modeli ailesi Qwen3 yarışa dahil oldu

Alibaba’nın Yeni Hibrit Yapay Zeka Modeli Qwen3 Tanıtıldı




Çin’in teknoloji devi Alibaba, yapay zeka alanında ses getiren yeni modeli Qwen3’ü duyurdu. Şirketin “hibrit” yapısıyla öne çıkan bu yeni yapay zeka ailesi, hem Amerika merkezli dev rakipler OpenAI ve Google’ın modelleriyle yarışıyor hem de açık kaynak yaklaşımıyla dikkat çekiyor.

Devlere karşı güçlü performans

Qwen3 ailesi, 235 milyardan 600 milyon parametre sayısına kadar değişen çeşitli modellerden oluşuyor. Parametre sayısı, bir yapay zeka modelinin problem çözme yeteneğini etkileyen önemli bir ölçüttür. Alibaba’ya göre, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini bazı karşılaştırmalarda geride bırakıyor. Qwen3 modelleri, OpenAI’nin o3 ve o4-mini gibi en üst düzey yeni modellere üstün gelmiyor, ancak yine de güçlü bir performans sergiliyorlar.

Ancak en güçlü model henüz kamuya açık değil. Bunun yerine, Qwen3-32B gibi daha küçük ancak yine de etkileyici performans gösteren modeller Hugging Face ve GitHub üzerinden indirilebilir durumda. Qwen3 modellerine ayrıca Fireworks AI ve Hyperbolic gibi bulut servis sağlayıcıları aracılığıyla da erişilebilmektedir.

Hibrit yaklaşım benimseniyor




Qwen3 modellerinin en dikkat çekici özelliklerinden biri olan “hibrit” yapısı, modelin karmaşık sorunlara karşı düşünme süreci uygulamasını ve basit sorulara hızlı cevap vermesini sağlar; yani model, gerektiğinde düşünür. Kullanıcılar, modelin ne kadar “düşüneceğine” karar verebilir. Alibaba mühendisleri bu esnekliği “düşünme bütçesinin kontrolü” olarak adlandırıyor. Bu tür çözümleri yakın zamanda görmeye başladık.

Ayrıca, bazı Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts – MoE) mimarisiyle çalışıyor. Bu yöntem, işlemleri alt görevlere ayırarak uzman alt modellere dağıtır, böylece karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerler.

119 dil ve 36 trilyon token

Alibaba, Qwen3’ün 119 dilde destek sağladığını ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham veri parçacıklarıdır; 1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim verileri arasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş veri kümeleri bulunmaktadır. Bu geniş veri havuzu sayesinde Qwen3, yalnızca genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü performans sergilemektedir. Örneğin, LiveCodeBench gibi yazılım karşılaştırmalarında OpenAI’ın o1 modelini geride bırakmayı başarmaktadır. Alibaba, Qwen3’ün araç çağırma yeteneğinin yanı sıra talimatları takip etme ve belirli veri formatlarını kopyalama konusunda da “üstün” olduğunu belirtiyor.

Related Posts

Bu elektrikli kamyon, 300 eve elektrik sağlayabiliyor

Çin merkezli Sunwoda Energy, 2 MWh enerji depolama kapasitesine sahip dünyanın ilk 10 metre sınıfı mobil enerji depolama aracı olan Sunwoda MESS 2000’i tanıttı.  10 metre uzunluğundaki kamyon, 2 MWh batarya kapasitesiyle 300 eve bir gün yetecek …

LG, yeni nesil taşınabilir monitörünü tanıttı!

LG, akıllı monitör serisini yeni Smart Monitor Swing modeliyle genişletiyor. Taşınabilir kullanım deneyimini merkeze alan yeni model, küçük tekerleklerle donatılmış özel bir stand üzerinde geliyor. Marka, bu tasarımda daha önce piyasaya sürdüğü …

1.020 TL’lik oyunlar kısa süreliğine ücretsiz oldu!

Oyun fiyatlarının artmasıyla birlikte platformların sunduğu kampanyalar ve indirimler oyuncuların daha çok ilgisini çekiyor. Bu alanda öne çıkan platformlardan biri de Xbox. Her hafta düzenlediği “Free Play Days” etkinliğiyle popüler oyunları kısa …

Snapdragon 8s Gen 4’lü Redmi Turbo 4 Pro tanıtıldı: 7550 mAh pil ile geliyor!

Xiaomi, Snapdragon 8s Gen 4 işlemcili ilk telefon olan Redmi Turbo 4 Pro’yu Çin’de piyasaya sürdü. 7550 mAh’lik dev batarya ile gelen telefon neler sunuyor bir göz atalım. Redmi Turbo 4 Pro, 6,83 inç büyüklüğe ve 120 Hz yenileme hızına sahip …

Amazon’un uydu internet projesi Kuiper, Starlink’in çok gerisinde

Amazon’un Starlink rakibi olarak lanse ettiği uydu internet hizmeti Project Kuiper, ciddi üretim ve takvim sorunları nedeniyle planlanan ilerlemenin gerisinde kaldı. Bloomberg’in yaptığı kapsamlı araştırmaya göre, dev teknoloji şirketi Kuiper …

Çin, Uzay İstasyonu’na yeni taykonot ekibini yolladı

Çin’in Shenzhou-20 mürettebatlı uzay aracının ‘Uzun Yürüyüş-2F’ roketiyle fırlatıldığı bildirildi.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir