AI Büyük Model Yarışması: Mühendislik Sorunu mu Yoksa Bilimsel Zorluk mu?
Geçen ay, AI dünyasında bir "hayvan savaşı" patlak verdi.
Bir taraf, Meta'nın tanıttığı Llama( büyük modeli, açık kaynaklı özelliği nedeniyle geliştiriciler tarafından çok beğeniliyor. Diğer taraf ise Birleşik Arap Emirlikleri'ndeki Teknoloji İnovasyon Araştırma Merkezi tarafından geliştirilen Falcon) büyük modeli. Her iki model de açık kaynak LLM sıralamasında sırasıyla zirveye yerleşti.
İlginç bir şekilde, Birleşik Arap Emirlikleri hükümeti AI yarışmasına katılmalarının "ana oyuncuları alt üst etmek" amacıyla olduğunu belirtti. Artık, biraz mali gücü olan her ülke ve şirket, kendi büyük dil modelini oluşturmak için çalışıyor.
Bu tür "çoklu model savaşı" durumu, 2017 yılında Google'ın yayımladığı Transformer algoritması makalesinden kaynaklanmaktadır. Transformer, doğal dil işleme alanındaki birçok sorunu çözmüş ve büyük modellerin teorik araştırmadan saf mühendislik sorunu haline gelmesini sağlamıştır. Yeterli hesaplama gücü ve veri olduğu sürece, neredeyse herhangi bir ekip büyük bir model eğitebilir.
Ancak, büyük modeller geliştirmek, AI çağında başarılı olacağınız anlamına gelmez. Meta'nın Llama, Falcon'dan daha düşük bir sıralamaya sahip olmasına rağmen, aktif geliştirici topluluğu sayesinde hala açık kaynak LLM'lerin bir yön göstericisidir. Performans açısından, çoğu LLM'nin GPT-4 ile hala belirgin bir farkı vardır.
Büyük modellerin temel rekabet gücü, yalnızca parametre ölçeği değil, ekosistem inşası veya saf çıkarım yeteneğindedir. Ayrıca, yüksek hesaplama maliyetleri de sektörün gelişimi için bir engel haline gelmiştir. Tahminlere göre, küresel teknoloji şirketlerinin büyük model altyapısına yaptığı yatırımlar, elde ettikleri gelirleri çok aşmaktadır.
Şu anda, birkaç istisna dışında, çoğu AI şirketi henüz kârlılık modeli bulamadı. Microsoft, Adobe gibi yazılım devleri bile AI ürünlerinin fiyatlandırmasında zorluklarla karşı karşıya.
Artık homojen rekabetin artması ve açık kaynaklı modellerin çoğalması ile, sadece büyük model tedarikçileri daha büyük bir baskı ile karşılaşabilir. Gelecekte, AI'nın değeri muhtemelen daha çok belirli uygulama senaryolarında, modelin kendisinden ziyade ortaya çıkacaktır.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
18 Likes
Reward
18
6
Share
Comment
0/400
StablecoinEnjoyer
· 19h ago
Başkan Ma hala anlıyor Llama yyds
View OriginalReply0
ForeverBuyingDips
· 07-21 02:33
dipten satın al, AI alanına kadar gitti. Uğğ!
View OriginalReply0
MidnightTrader
· 07-21 02:32
Büyük modellerle oynamak yeter. Kim para harcıyorsa o kazanır.
View OriginalReply0
bridge_anxiety
· 07-21 02:24
Kılıçlarla dövüşmek sadece parayı almayı bırakmaktır.
View OriginalReply0
FlashLoanLarry
· 07-21 02:19
lol başka bir sermaye yakma yarışı... verimlilik metrikleri burada anahtar olacak, yalan söylemiyorum.
Yapay Zeka Büyük Model Rekabeti: Mühendislik Zorluğu mu Yoksa Ticari Sorun mu?
AI Büyük Model Yarışması: Mühendislik Sorunu mu Yoksa Bilimsel Zorluk mu?
Geçen ay, AI dünyasında bir "hayvan savaşı" patlak verdi.
Bir taraf, Meta'nın tanıttığı Llama( büyük modeli, açık kaynaklı özelliği nedeniyle geliştiriciler tarafından çok beğeniliyor. Diğer taraf ise Birleşik Arap Emirlikleri'ndeki Teknoloji İnovasyon Araştırma Merkezi tarafından geliştirilen Falcon) büyük modeli. Her iki model de açık kaynak LLM sıralamasında sırasıyla zirveye yerleşti.
İlginç bir şekilde, Birleşik Arap Emirlikleri hükümeti AI yarışmasına katılmalarının "ana oyuncuları alt üst etmek" amacıyla olduğunu belirtti. Artık, biraz mali gücü olan her ülke ve şirket, kendi büyük dil modelini oluşturmak için çalışıyor.
Bu tür "çoklu model savaşı" durumu, 2017 yılında Google'ın yayımladığı Transformer algoritması makalesinden kaynaklanmaktadır. Transformer, doğal dil işleme alanındaki birçok sorunu çözmüş ve büyük modellerin teorik araştırmadan saf mühendislik sorunu haline gelmesini sağlamıştır. Yeterli hesaplama gücü ve veri olduğu sürece, neredeyse herhangi bir ekip büyük bir model eğitebilir.
Ancak, büyük modeller geliştirmek, AI çağında başarılı olacağınız anlamına gelmez. Meta'nın Llama, Falcon'dan daha düşük bir sıralamaya sahip olmasına rağmen, aktif geliştirici topluluğu sayesinde hala açık kaynak LLM'lerin bir yön göstericisidir. Performans açısından, çoğu LLM'nin GPT-4 ile hala belirgin bir farkı vardır.
Büyük modellerin temel rekabet gücü, yalnızca parametre ölçeği değil, ekosistem inşası veya saf çıkarım yeteneğindedir. Ayrıca, yüksek hesaplama maliyetleri de sektörün gelişimi için bir engel haline gelmiştir. Tahminlere göre, küresel teknoloji şirketlerinin büyük model altyapısına yaptığı yatırımlar, elde ettikleri gelirleri çok aşmaktadır.
Şu anda, birkaç istisna dışında, çoğu AI şirketi henüz kârlılık modeli bulamadı. Microsoft, Adobe gibi yazılım devleri bile AI ürünlerinin fiyatlandırmasında zorluklarla karşı karşıya.
Artık homojen rekabetin artması ve açık kaynaklı modellerin çoğalması ile, sadece büyük model tedarikçileri daha büyük bir baskı ile karşılaşabilir. Gelecekte, AI'nın değeri muhtemelen daha çok belirli uygulama senaryolarında, modelin kendisinden ziyade ortaya çıkacaktır.