Data sebagai Aset: DataFi Membuka Peluang Pasar Baru

Menengah7/25/2025, 11:25:51 AM
Seiring adopsi AI kian meluas, DataFi tampil sebagai peluang besar berikutnya di persimpangan Web3 dan AI. Analisis mendalam ini membahas bagaimana data berevolusi menjadi aset utama, sekaligus menelaah strategi inovatif serta model partisipasi pengguna yang dijalankan oleh proyek seperti Sahara, Vana, dan Yupp. Analisis ini juga memperlihatkan pemanfaatan smart contract dan insentif berbasis token oleh DataFi untuk menggerakkan kontributor secara global. Dengan langkah ini, DataFi mendefinisikan ulang dinamika pasar data AI.

“Saat ini kita hidup di era di mana negara-negara berlomba membangun model AI fundamental terbaik. Meski kekuatan komputasi dan rancangan arsitektur penting, keunggulan sesungguhnya terletak pada data pelatihan.”

—Sandeep Chinchali, Chief AI Officer, Story

Menelusuri Peluang Sektor Data AI: Perspektif dari Scale AI

Bulan ini, salah satu topik terbesar di ranah AI adalah langkah Meta yang menunjukkan kekuatan finansialnya. Mark Zuckerberg tengah gencar berburu talenta unggul untuk membangun tim Meta AI kelas dunia, dan banyak di antaranya berasal dari Tiongkok. Di balik kesuksesan itu, berdirilah Alexander Wang, pendiri Scale AI yang baru berusia 28 tahun. Wang membangun Scale AI dari awal—kini perusahaan tersebut telah bernilai USD 29 miliar dan melayani klien seperti militer AS dan juga pesaing utama industri, termasuk OpenAI, Anthropic, bahkan Meta sendiri. Semua raksasa AI itu mengandalkan Scale AI sebagai penyedia utama layanan data, dengan bisnis inti berupa suplai data berlabel dalam skala masif dan kualitas tinggi.

Mengapa Scale AI Jadi Unicorn yang Menonjol?

Kunci keberhasilannya adalah kesadaran awal akan peran sentral data dalam industri AI.

Komputasi, model, dan data merupakan tiga pilar utama dalam ekosistem AI. Bayangkan model sebagai tubuh, komputasi sebagai makanan, dan data sebagai pengetahuan serta pengalaman yang membentuk kualitasnya.

Sejak kemunculan large language model, fokus industri geser dari desain model ke infrastruktur komputasi. Sebagian besar model unggulan kini memakai arsitektur transformer, dengan inovasi seperti MoE atau MoRe hadir sesekali. Pemain besar membangun supercluster sendiri atau meneken kontrak jangka panjang dengan penyedia cloud skala besar seperti AWS. Setelah urusan komputasi beres, sorotan kini berpindah ke betapa pentingnya data.

Tak seperti perusahaan data enterprise mapan semacam Palantir, Scale AI berfokus membangun fondasi data yang kuat bagi AI. Bisnisnya melampaui sekadar menambang data yang ada—mereka berdedikasi untuk produksi data jangka panjang, membentuk tim trainer AI dari pakar dan praktisi untuk menghasilkan data pelatihan berkualitas lebih tinggi bagi model AI.

Belum Yakin dengan Bisnis Ini? Mari Lihat Cara Model Dilatih.

Pelatihan model AI berlangsung dalam dua tahap—pra-pelatihan dan fine-tuning.

Pada tahap pra-pelatihan, AI diibaratkan seperti bayi belajar berbicara: ia “mengkonsumsi” teks dan kode dalam jumlah sangat masif dari internet untuk memahami bahasa alami serta komunikasi dasar.

Sementara itu, fine-tuning serupa dengan pendidikan formal, dengan jawaban yang tegas benar atau salah. Sebagaimana sekolah membentuk karakter siswa sesuai kurikulum, kita menyiapkan dataset yang disesuaikan untuk melatih model dengan kemampuan spesifik.

Kedua jenis data tersebut diperlukan untuk pelatihan model AI:

· Data yang sedikit butuh pemrosesan—kuantitas menjadi kuncinya. Umumnya berupa hasil scraping dari platform konten pengguna besar seperti Reddit, Twitter, repositori literatur terbuka, atau dataset privat korporasi.

· Data yang dirancang khusus—serupa buku ajar spesialisasi—dirancang dan dikurasi untuk mentransfer keahlian atau kualitas tertentu. Jenis ini melalui proses pembersihan, seleksi, pelabelan, dan validasi manusia.

Kedua kategori inilah fondasi pasar data AI. Meski dari sisi teknologi dataset tampak sederhana, pandangan utama saat ini adalah begitu hukum penskalaan komputasi mencapai batas, data justru akan menjadi pembeda utama bagi vendor model AI besar.

Seiring kemajuan model AI, kebutuhan data pelatihan yang semakin detail dan spesialis bakal jadi faktor kunci penentu performa model AI. Jika analoginya diperluas, pelatihan model AI bagaikan membesarkan pendekar bela diri, data adalah pedoman pelatihan utama, komputasi adalah faktor penguat utama, sedangkan model AI adalah bakat bawaan.

Dari sudut vertikal, data AI adalah sektor yang menawarkan efek penggandaan nilai secara jangka panjang. Semakin awal aset data dibangun, nilainya akan terus bertambah dan menjadi lebih berharga seiring waktu.

Web3 DataFi: Ekosistem Terbaik untuk Perkembangan Data AI

Dibandingkan armada anotator jarak jauh Scale AI di Filipina dan Venezuela, Web3 menawarkan keunggulan unik di data AI—dengan memperkenalkan konsep DataFi.

Secara ideal, DataFi Web3 memiliki keunggulan utama sebagai berikut:

1. Kepemilikan Data, Keamanan, dan Privasi Berbasis Smart Contract

Ketika sumber data publik hampir habis, memperoleh data baru—bahkan data privat—menjadi sangat penting. Ini menciptakan dilema kepercayaan: Apakah Anda menyerahkan data sepenuhnya ke agregator terpusat, atau tetap mempertahankan hak kepemilikan di blockchain dan memakai smart contract untuk transparansi penggunaan data Anda?

Bagi data sensitif, solusi seperti zero-knowledge proof dan perangkat keras Trusted Execution Environment (TEE) menjamin data hanya bisa diakses mesin, menjaga kerahasiaan dan mencegah kebocoran.

2. Arbitrase Geografis Otomatis: Partisipasi Terdesentralisasi Menarik Talenta Terbaik Dunia

Saatnya mengubah cara berpikir mengenai tenaga kerja. Alih-alih pencarian tenaga kerja murah secara terpusat seperti Scale AI, Web3 memungkinkan tenaga kerja global terdistribusi berkontribusi data dan mendapat bayaran setara berkat desain insentif smart contract yang transparan.

Untuk tugas seperti pelabelan data atau validasi model, pendekatan terdesentralisasi yang terbuka mendukung keragaman dan mengurangi bias—keunggulan signifikan bagi kualitas data.

3. Insentif dan Distribusi Imbalan yang Transparan Berbasis Blockchain

Ingin menghindari operasional manual yang tidak transparan? Smart contract blockchain menghadirkan insentif terbuka, dieksekusi otomatis melalui kode, dan lebih unggul dari sistem manual konvensional.

Di tengah menurunnya globalisasi, arbitrase geografis dengan membuka kantor cabang di berbagai negara makin sulit. Dengan penyelesaian on-chain, partisipasi dan pembayaran lintas negara jadi lebih efisien tanpa hambatan regulatoris tradisional.

4. Marketplace Data End-to-End yang Efisien dan Terbuka

Dipangkasnya margin oleh perantara adalah masalah klasik. Dengan marketplace data on-chain yang transparan, platform dapat langsung mempertemukan penjual dan pembeli layaknya model Taobao, sehingga efisiensi dan nilai ekonomi bisa dimaksimalkan.

Permintaan data AI berbasis on-chain akan terus bertambah detail dan kompleks, dan hanya marketplace terdesentralisasi yang sanggup memenuhi kebutuhan itu secara efisien dalam skala besar.

DataFi: Pintu Masuk Termudah ke AI Terdesentralisasi bagi Pengguna Retail

Meskipun alat AI mempermudah akses dan AI terdesentralisasi menantang para pemain lama, fakta di lapangan: banyak proyek belum ramah bagi pengguna non-teknis. Jaringan komputasi desentralisasi kerap memerlukan perangkat mahal, dan marketplace model kerap terasa rumit.

Sebaliknya, Web3 justru membuka peluang bagi pengguna biasa di tengah revolusi AI. Tidak perlu kontrak kerja data yang memberatkan; cukup sambungkan wallet untuk ambil bagian. Anda bisa menyumbangkan data, memberi label hasil model secara intuitif, menguji model, atau memakai alat AI sederhana untuk karya kreatif dan transaksi data—semuanya seringkali tanpa hambatan teknis, apalagi jika Anda sudah familiar dengan airdrop.

Proyek DataFi Web3 Paling Prospektif

Modal menentukan arah tren. Investasi USD 14,3 miliar dari Scale AI untuk Meta dan kenaikan saham Palantir hingga lima kali lipat membuktikan potensi DataFi di Web2; di Web3, DataFi juga menjadi primadona pendanaan. Berikut beberapa inisiatif yang patut diperhatikan:


Sahara AI, @SaharaLabsAI, mengantongi pendanaan USD 49 juta

Sahara AI bercita-cita membangun infrastruktur AI dan marketplace data terdesentralisasi berskala super. Platform Data Services Platform (DSP) versi beta dirilis 22 Juli, memberikan hadiah bagi para kontributor data dan pelabel.

Link: app.saharaai.com

Yupp, @yupp_ai, meraih pendanaan USD 33 juta

Yupp merupakan platform penilaian output AI, di mana pengguna membandingkan respons model terhadap satu prompt dan memilih jawaban terbaik. Poin Yupp yang diperoleh dapat dikonversi ke stablecoin seperti USDC.

Link: https://yupp.ai/

Vana, @vana, mendapatkan pendanaan USD 23 juta

Vana memungkinkan pengguna mengubah data pribadi, seperti aktivitas browsing dan sosial, menjadi aset digital. Data dikumpulkan dalam DataDAO dan Data Liquidity Pool untuk pelatihan AI, dengan token imbalan bagi kontributor.

Link: https://www.vana.org/collectives

Chainbase, @ChainbaseHQ, memperoleh modal USD 16,5 juta

Chainbase fokus pada data on-chain, mengolah aktivitas di lebih dari 200 blockchain menjadi aset bernilai ekonomi untuk pengembang DApp. Data diindeks dan diproses dengan sistem Manuscript dan Theia AI. Saat ini partisipasi retail masih terbatas.

Sapien, @JoinSapien, memperoleh pendanaan USD 15,5 juta

Sapien mengubah pengetahuan manusia dalam skala besar menjadi data pelatihan AI berkualitas tinggi. Siapa saja bisa melabeli data di platform ini, dengan pengawasan kualitas berbasis peer review. Reputasi jangka panjang dan staking (mengunci aset) meningkatkan reward.

Link: https://earn.sapien.io/#hiw

Prisma X, @PrismaXai, meraih pendanaan USD 11 juta

Prisma X menargetkan menjadi layer koordinasi terbuka untuk robot, dengan pengumpulan data fisik sebagai pilar utama. Masih tahap awal, pengguna dapat berpartisipasi dengan mendukung pengumpulan data robot, operasi jarak jauh, atau mengikuti kuis untuk mendapatkan poin.

Link: https://app.prismax.ai/whitepaper

Masa, @getmasafi, mendapat pendanaan USD 8,9 juta

Masa memimpin di ekosistem Bittensor dengan subnet data dan agent. Subnet data menyediakan akses real-time melalui perangkat TEE yang mengumpulkan data X/Twitter. Untuk retail, skema partisipasi saat ini masih mahal dan kompleks.

Irys, @irys_xyz, mengamankan dana USD 8,7 juta

Irys mengutamakan penyimpanan data dan komputasi terprogram yang efisien dan murah untuk AI dan DApp kaya data. Kesempatan kontribusi data dari pengguna masih sedikit, namun fase testnet saat ini menyediakan berbagai aktivitas partisipasi.

Link: https://bitomokx.irys.xyz/

ORO, @getoro_xyz, mendapatkan pendanaan USD 6 juta

ORO membuka peluang semua orang untuk berkontribusi ke AI—dengan mengaitkan akun pribadi (media sosial, kesehatan, fintech) atau menyelesaikan tugas data. Testnet kini terbuka untuk partisipasi.

Link: app.getoro.xyz

Gata, @Gata_xyz, memperoleh pendanaan USD 4 juta

Sebagai data layer terdesentralisasi, Gata menawarkan tiga produk inti: Data Agent (AI agent aktif di browser), All-in-one Chat (reward evaluasi model ala Yupp), dan GPT-to-Earn (ekstensi browser untuk mengumpulkan data ChatGPT).

Link: https://app.gata.xyz/dataAgent

https://chromewebstore.google.com/detail/hhibbomloleicghkgmldapmghagagfao?utm_source=item-share-cb

Bagaimana Cara Menilai Proyek-proyek DataFi?

Saat ini hambatan teknis proyek-proyek DataFi cenderung rendah, namun daya tarik pengguna dan ekosistemnya tumbuh cepat. Investasi awal pada insentif dan pengalaman pengguna sangat penting; hanya platform yang mampu menarik massa pengguna yang akan berjaya di bidang data.

Sebagai bisnis padat karya, platform data harus mengelola tenaga kerja dan memastikan kualitas data. Banyak proyek Web3 menghadapi masalah umum: mayoritas pengguna hanya mengejar keuntungan jangka pendek—sering disebut “petani”—yang akhirnya menurunkan mutu data. Jika ini dibiarkan, kontributor berkualitas akan tersingkir, integritas data terganggu, pembeli pun menurun. Sahara, Sapien, dan yang lain kini sudah mengutamakan mutu data dan membangun relasi jangka panjang yang sehat dengan kontributor mereka.

Masalah lain adalah kurangnya transparansi. Paradoks “trinitas mustahil” di blockchain membuat banyak proyek pada awalnya sangat terpusat, sehingga masih menyerupai proyek Web2 meski berbasis Web3—minim data on-chain dan komitmen keterbukaan tidak jelas. Hal ini menjadi racun bagi keberlanjutan DataFi. Semoga makin banyak tim berpegang teguh pada misi mereka dan mempercepat langkah menuju transparansi serta keterbukaan penuh.

Pada akhirnya, adopsi massal DataFi membutuhkan dua hal: menarik cukup banyak pengguna retail untuk menggerakkan mesin data dan membentuk ekonomi AI yang solid, serta memenangkan pasar korporasi yang masih menjadi sumber pendapatan utama jangka pendek. Dalam hal ini, Sahara AI, Vana, dan sejumlah proyek lain telah menunjukkan kemajuan berarti.

Penutup

DataFi merupakan upaya berkelanjutan untuk mengembangkan kecerdasan mesin dengan memanfaatkan kecerdasan manusia—memastikan melalui smart contract bahwa kontribusi manusia mendapatkan kompensasi yang layak dan memungkinkan masyarakat memperoleh manfaat dari pertumbuhan kecerdasan AI.

Bagi pihak yang menghadapi ketidakpastian di era AI, atau tetap berkeyakinan terhadap teknologi blockchain di tengah fluktuasi pasar kripto, partisipasi dalam DataFi dapat menjadi langkah yang tepat dan relevan.

Disclaimer:

  1. Artikel ini adalah hasil terjemahan dari [BLOCKBEATS], hak cipta milik penulis asli [anci_hu49074, kontributor inti Biteye]. Untuk urusan hak cipta ulang, silakan hubungi Tim Gate Learn sesuai prosedur yang berlaku.
  2. Penafian: Tanggapan dan opini dalam artikel ini sepenuhnya milik penulis, tidak mewakili saran atau rekomendasi investasi.
  3. Terjemahan bahasa lain dilakukan oleh Tim Gate Learn. Tanpa penegasan eksplisit terkait Gate, seluruh terjemahan dilarang digunakan ulang, didistribusikan, atau dipalsukan.
Mulai Sekarang
Daftar dan dapatkan Voucher
$100
!