Çinliler ChatGPT rakibi dil modeli geliştirdi!


Alibaba’nın Qwen araştırma ekibi, açık kaynaklı büyük dil modeli serisini Qwen3-Next ile genişletti. Ekip, bu yaz boyunca farklı modellerin duyurusunu yaptıktan sonra şimdi performans ve verimliliği bir araya getiren hibrit bir mimariyle sahneye çıktı. Qwen3-Next, sadece 3 milyar aktif parametre kullanmasına rağmen 80 milyar parametreli bir yapıya sahip. Bu sayede uzun bağlamlarda yüksek verimlilikle çalışıyor.

Qwen3-Next resmen duyuruldu

Alibaba, Qwen3-Next adlı tamamen ücretsiz yapay zekasını kullanıma sundu. Model, Instruct ve Thinking olmak üzere iki varyantla geliyor. Her iki varyant da Apache 2.0 lisansı altında dağıtılıyor ve Hugging Face, ModelScope, Kaggle ile Alibaba Cloud üzerinden erişilebiliyor.

Qwen3 Next 2

Ayrıca, doğrudan Qwen Chat platformunda da kullanılabiliyor. Yeni modelde Gated DeltaNet ve Gated Attention yaklaşımları bir arada uygulanıyor. DeltaNet katmanları uzun metinlerde hızlı okuma işlevi görürken, Gated Attention katmanları detaylı ve hassas kontrol sağlıyor. Bu hibrit yaklaşım, hem hız hem de doğruluk avantajını tek modelde birleştiriyor.

Teknik açıdan en dikkat çeken unsurlardan biri, modelin yalnızca 3 milyar aktif parametreyle çalışması. Bu sayede 15 trilyon token üzerinde eğitilen model, selefi Qwen3-32B’den çok daha düşük donanım maliyetiyle eğitildi ve çalıştırıldı.

Uzun bağlam testlerinde ise 32.000 token ve üzerinde 10 kata kadar daha yüksek hız sunuyor. Qwen3-Next, doğal olarak 256.000 token bağlam penceresini destekliyor ve RoPE ölçekleme yöntemleriyle 1 milyon token uzunluğa kadar doğrulandı.

Performans testlerinde Qwen3-32B’nin üzerinde sonuçlar elde edildi. Reasoning odaklı Thinking varyantı, Gemini-2.5-Flash-Thinking gibi kapalı kaynaklı modellere karşı üstünlük sağladı. Instruct modeli ise Qwen3’ün 235 milyar parametreli amiral gemisine yakın uzun bağlam performansı sundu.

Qwen ekibi, Qwen3-Next’in hem ölçeklenebilir hem de maliyet açısından uygun bir çözüm sunduğunu vurgularken, serinin bir sonraki adımı olan Qwen3.5 üzerinde çalıştıklarını da açıkladı.



Haber Kaynak Linki

Related Posts

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir