Search results for "QWEN"
23:03

Hugging Face Açık Kaynak üst düzey model

Jin10 verileri 9 Temmuz'da bildirdi, bu sabah erken saatlerde, dünya çapında ünlü büyük model açık platformu Hugging Face Açık Kaynak olarak üst düzey küçük parametreli model SmolLM3'ü duyurdu. SmolLM3 yalnızca 3 milyar parametreye sahip, ancak performansı Llama-3.2-3B, Qwen2.5-3B gibi benzer Açık Kaynak modelleri büyük ölçüde aşmaktadır. 128k bağlam penceresine sahip olup, İngilizce, Fransızca, İspanyolca, Almanca gibi 6 dili desteklemektedir. Derin düşünme ve düşünmeyen çift akıl yürütme modlarını destekler, kullanıcılar esnek bir şekilde geçiş yapabilir.
More
B6.4%
10:01

Ali Tongyi K sordu, yeni

QwQ-Max yakında Apache 2.0 lisansı Açık Kaynak QwQ-Max ve Qwen 2.5-Max altında resmi bir sürümde piyasaya sürülecek ve QwQ-32B gibi yerel cihazlara dağıtılabilen daha küçük sürümler mevcut. Aynı zamanda, resmi QwQ-Max piyasaya sürülecek ve Android ve iOS uygulamaları piyasaya sürülecek.
More
MAX-0.49%
APP-2.73%
09:02

Loongson: Loongson processor successfully runs DeepSeek large model

Loongson has successfully launched the DeepSeek R1 7B model with the Loongson 3 CPU, achieving localized deployment, outstanding performance, and excellent cost-effectiveness, providing users with a faster, stronger, and more efficient training and inference experience. Loongson is working with partners such as TaiChi Yuanqi, Cambricon Technologies, Tenstorrent, Alchemy Technology, and openEuler to build a versatile inference platform for the DeepSeek series models.
More
DEEPSEEK-5.47%
  • 1
13:10

Jingwei Hengrun: Şirket, DeepSeek ve Qwen'i devreye aldı

Jingwei Hengrun, akıllı yardım, tasarım, test, ürün optimizasyonu ve iş süreci zekası gibi birden fazla alanı kapsayan profesyonel yapay zeka uygulamaları geliştirmek için DeepSeek ve Qwen gibi büyük modelleri kullanır. Bu uygulamalar iş verimliliğini, kalitesini artırır ve maliyetleri düşürür.
More
DEEPSEEK-5.47%
  • 3
  • 1
04:19
Golden Ten Data, 29 Nisan'da Tongyi K Man'in ilk kez kning parametre modeli Qwen1.5-110B'yi piyasaya sürdüğünü ve MMLU, TheoremQA ve GPQA gibi en uzun kıyaslama değerlendirmelerinde mükemmel performans gösterdiğini bildirdi. Şu anda, Qwen 1.5 serisi 10 açık kaynaklı büyük model biriktirdi ve Tongyi K Açık Kaynak modellerinin indirme sayısı 7 milyonu aştı.
23:02
Altın Finans raporuna göre, Alibaba Qwen ekibi son araştırma sonuçlarını resmen duyurdu - QwQ-32B büyük dil modeli, yalnızca DeepSeek-R1'in yaklaşık 1/21 parametre sayısıyla, güçlendirme öğrenmesiyle performans açısından atılım elde etti.
DEEPSEEK-5.47%
  • 1
  • 1
12:16

Dördüncü Paradigma, büyük model çıkarım uç taraf çözümü ModelHub AIoT'u tanıttı

Altın On Veri 26 Şubat, Dörtinci Paradigma'dan öğrenildi, Dörtinci Paradigma, büyük model çıkarım uç taraf çözümü ModelHub AIoT'yu tanıttı, kullanıcılar uç tarafta DeepSeek R1, Qwen 2.5, Llama 2/3 serisi gibi küçük boyutlu distilasyon modellerini kolayca dağıtabilir ve çevrimdışı çalıştırabilir. Kullanıcılar esnek bir şekilde birden fazla model arasında geçiş yapabilir, model sıkıştırma, çıkarım performansını göz önünde bulundurarak dağıtım ve optimizasyonun karmaşıklığını çözer. Şirket, bu çözümün sadece kullanıcıların gizlilik ve gerçek zamanlılık taleplerini karşılamakla kalmayıp aynı zamanda AI büyük model çıkarım maliyetlerini önemli ölçüde düşüş.
More
DEEPSEEK-5.47%
09:58

Dördüncü Paradigma, büyük model çıkarsama cihazı çözümü SageOne IA'yı tanıttı.

Dörtüncü Paradigma, büyük model çıkarım maliyetlerini düşüşSageOneIA, büyük modellerin çıkarım maliyetlerini düşürmek için birleşik bir cihaz tanıttı. Akıllı Bilgi İşlem Gücü havuzu teknolojisi, çoklu önde gelen büyük modelleri destekleyen bir çözümde entegre edilmiştir, şirketler tam model ve distile model arasında geçiş yapabilir, GPU kullanım oranı %30'un üzerinde artar ve çıkarım performansı 5-10 kat artar.
More
11:29

Alibaba International Station integrates DeepSeek's large model

Altın on verileri 12 Şubat, Alibaba International AI DeepSeek gibi büyük modellere entegre edildi, dış ticaret işinin çeşitli temel alanlarında tamamen kullanılacak. Entegre olduktan sonra, AI, yabancı müşterileri otomatik olarak karşıladığında, alıcıların sorularını daha kapsamlı bir şekilde düşünebilecek ve ardından Alibaba International Station'daki pazar görüşleri, dış ticaret deneyimi, satıcıların ürünlerinin kendi durumlarıyla Derinlik çıkarımı yapacaktır. Ayrıca, Alibaba International Station'ın Qwen testinde genel k sormaktadır.
More
DEEPSEEK-5.47%
23:46

Microsoft Açık Kaynak inovasyon çerçevesi: DeepSeek'i AI Ajana dönüştürebilir

Microsoft has released the latest version V2.0 of OmniParser, improving the efficiency and accuracy of the AI Agent used on computers, especially in detecting small UI elements and improving inference speed. This version also significantly improved performance in high-resolution AgentBenchmark tests, achieving an astonishing 39.6% accuracy. In addition, Microsoft also open-sourced the key tool omnitool for converting large models into Agents.
More
DEEPSEEK-5.47%
AGENT9.06%
GPT-1.87%
  • 2
  • 4
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)