Daya Komputasi Layanan: Model Bisnis Baru di Era Model Besar
Permintaan daya komputasi untuk pelatihan model besar mendorong daya komputasi menjadi model bisnis baru. Meskipun tren "mendistilasi" model besar saat ini mungkin akan berlalu, penyedia layanan daya komputasi perlu bersiap-siap dan siap menghadapi perubahan permintaan pasar.
Baru-baru ini, sekelompok peneliti menggunakan data cuaca global selama 40 tahun, melakukan pra-pelatihan selama sekitar 2 bulan dengan 200 kartu GPU, dan akhirnya melatih model cuaca besar dengan jumlah parameter mencapai miliaran. Berdasarkan biaya penggunaan GPU sebesar 7,8 yuan per jam, biaya pelatihan model besar di bidang vertikal ini mungkin melebihi 2 juta yuan. Jika melatih model besar yang umum, biayanya mungkin meningkat seratus kali lipat.
Saat ini, China telah memiliki lebih dari seratus model besar dengan skala 10 miliar parameter. Namun, industri berbondong-bondong mengembangkan model besar menghadapi tantangan kekurangan GPU high-end. Biaya Daya Komputasi yang tinggi, kurangnya Daya Komputasi dan dana menjadi masalah paling langsung yang dihadapi industri.
Masalah kekurangan GPU kelas atas sulit untuk diselesaikan dalam jangka pendek. Ledakan model besar telah menyebabkan permintaan daya komputasi di pasar meningkat dengan cepat, tetapi laju peningkatan pasokan jauh tertinggal. Meskipun dalam jangka panjang pasokan daya komputasi pasti akan beralih dari pasar penjual ke pasar pembeli, tetapi berapa lama proses ini akan berlangsung masih merupakan tanda tanya.
Menghadapi situasi ini, di dalam industri secara umum diyakini bahwa, seiring dengan meningkatnya persaingan di pasar model besar, pasar juga akan secara bertahap kembali ke rasionalitas dari euforia, dan perusahaan akan mengendalikan biaya serta menyesuaikan strategi berdasarkan perubahan ekspektasi.
Untuk mengatasi kekurangan Daya Komputasi, perusahaan telah mengambil berbagai cara:
Menggunakan data berkualitas lebih tinggi untuk pelatihan, meningkatkan efisiensi pelatihan.
Meningkatkan kemampuan infrastruktur, mewujudkan operasi stabil dari kluster GPU berskala besar.
Mengoptimalkan penjadwalan sumber daya Daya Komputasi, meningkatkan tingkat pemanfaatan sumber daya.
Meningkatkan kinerja jaringan, meningkatkan efisiensi pelatihan terdistribusi skala besar.
Beralih dari arsitektur cloud computing ke arsitektur superkomputer, mengurangi biaya.
Menggunakan platform dalam negeri untuk pelatihan dan inferensi model besar, menggantikan GPU Nvidia.
Daya Komputasi sudah secara bertahap membentuk model layanan baru di tengah permintaan pasar dan iterasi teknologi. Layanan daya komputasi berbasis pada daya komputasi yang beragam, dihubungkan melalui jaringan daya komputasi, dengan tujuan menyediakan daya komputasi yang efektif. Ini tidak hanya mencakup daya komputasi, tetapi juga secara terintegrasi mengemas sumber daya seperti penyimpanan, jaringan, dll., dalam bentuk layanan ( seperti API ) untuk menyelesaikan pengiriman daya komputasi.
Dalam rantai industri daya komputasi, perusahaan hulu terutama menyediakan sumber daya daya komputasi dasar, perusahaan tengah bertanggung jawab untuk produksi dan pasokan daya komputasi, sedangkan perusahaan hilir mengandalkan layanan daya komputasi untuk menyediakan layanan nilai tambah. Model ini lebih unggul dalam hal biaya dan teknologi dibandingkan dengan lingkungan daya komputasi yang dibangun sendiri oleh perusahaan.
Seiring dengan normalisasi kebutuhan komputasi berkinerja tinggi dari model besar, layanan daya komputasi dengan cepat membentuk rantai industri dan model bisnis yang unik. Meskipun saat ini masih ada masalah seperti kekurangan GPU kelas atas dan tingginya biaya daya komputasi, namun dalam jangka panjang, tren daya komputasi sebagai layanan telah ditetapkan. Penyedia layanan daya komputasi perlu selalu siap untuk dapat menyesuaikan strategi mereka dengan cepat saat permintaan pasar berubah.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
11 Suka
Hadiah
11
9
Posting ulang
Bagikan
Komentar
0/400
TokenAlchemist
· 6jam yang lalu
efisiensi penambangan adalah alpha yang sebenarnya... kekurangan gpu hanyalah peluang arbitrase lain sejujurnya
Lihat AsliBalas0
WalletDetective
· 8jam yang lalu
Mereka yang segera menerapkan Daya Komputasi telah menjadi kaya.
Lihat AsliBalas0
ImpermanentPhilosopher
· 08-11 03:58
Biaya炼丹 begitu tinggi, lebih baik simpan koin dan santai saja.
Lihat AsliBalas0
FOMOSapien
· 08-10 20:03
Raja Pembakar Uang datang!
Lihat AsliBalas0
SignatureVerifier
· 08-10 19:58
*sigh* secara teknis, gelembung komputasi yang tidak berkelanjutan lainnya smh
Lihat AsliBalas0
GasFeeBarbecue
· 08-10 19:56
gpu sudah habis semua
Lihat AsliBalas0
PebbleHander
· 08-10 19:48
Uangnya hilang lagi?
Lihat AsliBalas0
StablecoinAnxiety
· 08-10 19:43
Bermain sebesar ini benar-benar tidak takut meledak?
Daya Komputasi layanan muncul Peluang dan tantangan baru di era model besar
Daya Komputasi Layanan: Model Bisnis Baru di Era Model Besar
Permintaan daya komputasi untuk pelatihan model besar mendorong daya komputasi menjadi model bisnis baru. Meskipun tren "mendistilasi" model besar saat ini mungkin akan berlalu, penyedia layanan daya komputasi perlu bersiap-siap dan siap menghadapi perubahan permintaan pasar.
Baru-baru ini, sekelompok peneliti menggunakan data cuaca global selama 40 tahun, melakukan pra-pelatihan selama sekitar 2 bulan dengan 200 kartu GPU, dan akhirnya melatih model cuaca besar dengan jumlah parameter mencapai miliaran. Berdasarkan biaya penggunaan GPU sebesar 7,8 yuan per jam, biaya pelatihan model besar di bidang vertikal ini mungkin melebihi 2 juta yuan. Jika melatih model besar yang umum, biayanya mungkin meningkat seratus kali lipat.
Saat ini, China telah memiliki lebih dari seratus model besar dengan skala 10 miliar parameter. Namun, industri berbondong-bondong mengembangkan model besar menghadapi tantangan kekurangan GPU high-end. Biaya Daya Komputasi yang tinggi, kurangnya Daya Komputasi dan dana menjadi masalah paling langsung yang dihadapi industri.
Masalah kekurangan GPU kelas atas sulit untuk diselesaikan dalam jangka pendek. Ledakan model besar telah menyebabkan permintaan daya komputasi di pasar meningkat dengan cepat, tetapi laju peningkatan pasokan jauh tertinggal. Meskipun dalam jangka panjang pasokan daya komputasi pasti akan beralih dari pasar penjual ke pasar pembeli, tetapi berapa lama proses ini akan berlangsung masih merupakan tanda tanya.
Menghadapi situasi ini, di dalam industri secara umum diyakini bahwa, seiring dengan meningkatnya persaingan di pasar model besar, pasar juga akan secara bertahap kembali ke rasionalitas dari euforia, dan perusahaan akan mengendalikan biaya serta menyesuaikan strategi berdasarkan perubahan ekspektasi.
Untuk mengatasi kekurangan Daya Komputasi, perusahaan telah mengambil berbagai cara:
Menggunakan data berkualitas lebih tinggi untuk pelatihan, meningkatkan efisiensi pelatihan.
Meningkatkan kemampuan infrastruktur, mewujudkan operasi stabil dari kluster GPU berskala besar.
Mengoptimalkan penjadwalan sumber daya Daya Komputasi, meningkatkan tingkat pemanfaatan sumber daya.
Meningkatkan kinerja jaringan, meningkatkan efisiensi pelatihan terdistribusi skala besar.
Beralih dari arsitektur cloud computing ke arsitektur superkomputer, mengurangi biaya.
Menggunakan platform dalam negeri untuk pelatihan dan inferensi model besar, menggantikan GPU Nvidia.
Daya Komputasi sudah secara bertahap membentuk model layanan baru di tengah permintaan pasar dan iterasi teknologi. Layanan daya komputasi berbasis pada daya komputasi yang beragam, dihubungkan melalui jaringan daya komputasi, dengan tujuan menyediakan daya komputasi yang efektif. Ini tidak hanya mencakup daya komputasi, tetapi juga secara terintegrasi mengemas sumber daya seperti penyimpanan, jaringan, dll., dalam bentuk layanan ( seperti API ) untuk menyelesaikan pengiriman daya komputasi.
Dalam rantai industri daya komputasi, perusahaan hulu terutama menyediakan sumber daya daya komputasi dasar, perusahaan tengah bertanggung jawab untuk produksi dan pasokan daya komputasi, sedangkan perusahaan hilir mengandalkan layanan daya komputasi untuk menyediakan layanan nilai tambah. Model ini lebih unggul dalam hal biaya dan teknologi dibandingkan dengan lingkungan daya komputasi yang dibangun sendiri oleh perusahaan.
Seiring dengan normalisasi kebutuhan komputasi berkinerja tinggi dari model besar, layanan daya komputasi dengan cepat membentuk rantai industri dan model bisnis yang unik. Meskipun saat ini masih ada masalah seperti kekurangan GPU kelas atas dan tingginya biaya daya komputasi, namun dalam jangka panjang, tren daya komputasi sebagai layanan telah ditetapkan. Penyedia layanan daya komputasi perlu selalu siap untuk dapat menyesuaikan strategi mereka dengan cepat saat permintaan pasar berubah.