Évolution de la technologie d'indexation des données de Blockchain : des Nœuds aux services de chaîne complète habilités par l'IA

Évolution de la technologie d'indexation des données Blockchain : des Nœuds aux services de données de chaîne complète alimentés par l'IA

1 Introduction

Depuis la naissance des premiers dApp en 2017, les applications Blockchain ont connu un essor considérable, couvrant divers domaines tels que la finance, les jeux et les réseaux sociaux. En discutant des applications décentralisées, avons-nous déjà réfléchi aux sources de données utilisées par ces dApp ?

En 2024, l'IA et le Web3 deviennent des sujets d'actualité. Dans le domaine de l'intelligence artificielle, les données sont comme la source de la vie, cruciales pour la croissance et l'évolution des systèmes d'IA. Tout comme les plantes ont besoin de soleil et d'eau pour prospérer, les systèmes d'IA dépendent également d'un volume massif de données pour "apprendre" et "penser" en continu. Sans le soutien des données, même les algorithmes d'IA les plus raffinés peinent à exprimer leur intelligence et leur efficacité.

Cet article analysera en profondeur l'évolution de l'indexation des données blockchain dans le processus de développement de l'industrie, du point de vue de l'accessibilité des données blockchain. Nous comparerons également les anciens protocoles d'indexation des données avec les nouveaux protocoles de services de données blockchain, en mettant particulièrement l'accent sur les similitudes et les différences des nouveaux protocoles intégrant la technologie AI en termes de services de données et de caractéristiques d'architecture produit.

Lire, indexer pour analyser, un aperçu de la piste d'indexation des données Web3

2 Complexité et simplicité de l'indexation des données : du nœud de blockchain à la base de données complète

2.1 Source de données : Nœud Blockchain

La blockchain est souvent décrite comme un livre de comptes décentralisé. Les nœuds de la blockchain sont la base de tout le réseau, responsables de l'enregistrement, du stockage et de la diffusion de toutes les données de transaction sur la chaîne. Chaque nœud conserve une copie complète des données de la blockchain, garantissant ainsi la caractéristique décentralisée du réseau. Cependant, pour les utilisateurs ordinaires, construire et maintenir un nœud n'est pas une tâche facile, car cela nécessite des compétences professionnelles et implique des coûts matériels et de bande passante élevés. La capacité de requête des nœuds ordinaires est également limitée, ce qui rend difficile la satisfaction des besoins des développeurs. Ainsi, même si théoriquement tout le monde peut faire fonctionner un nœud, en réalité, les utilisateurs ont tendance à dépendre des services tiers.

Pour résoudre ce problème, les fournisseurs de nœuds RPC ont vu le jour. Ces fournisseurs sont responsables des coûts et de la gestion des nœuds, et fournissent des services de données via des points de terminaison RPC. Les utilisateurs peuvent facilement accéder aux données de la blockchain sans avoir à créer leurs propres nœuds. Les points de terminaison RPC publics sont gratuits mais soumis à des limites de taux, ce qui peut affecter l'expérience utilisateur des dApp. Les points de terminaison RPC privés offrent de meilleures performances, mais leur efficacité est faible pour des requêtes complexes, et ils sont difficiles à étendre et à rendre compatibles entre réseaux. Néanmoins, l'interface API standardisée des fournisseurs de nœuds a réduit le seuil d'accès des utilisateurs aux données on-chain, posant ainsi les bases pour la suite de l'analyse des données et des applications.

2.2 Analyse des données : des données prototypes aux données exploitables

Les données obtenues à partir des nœuds de la blockchain sont généralement des données brutes qui ont été cryptées et codées. Bien que ces données garantissent l'intégrité et la sécurité de la blockchain, elles compliquent également l'analyse des données. Pour les utilisateurs ordinaires ou les développeurs, traiter directement ces données brutes nécessite une grande quantité de connaissances techniques et de ressources informatiques.

Le processus d'analyse des données apparaît comme particulièrement important dans ce contexte. En transformant des données prototypes complexes en un format plus compréhensible et exploitable, les utilisateurs peuvent mieux comprendre et utiliser ces données de manière intuitive. L'efficacité de l'analyse des données influence directement l'efficacité et l'efficacité des applications de données Blockchain, constituant un maillon clé de l'ensemble du processus d'indexation des données.

Lecture, indexation à l'analyse, aperçu du secteur de l'indexation des données Web3

2.3 L'évolution des indexeurs de données

Avec l'augmentation du volume de données sur la blockchain, la demande pour des indexeurs de données est en constante augmentation. Les indexeurs jouent un rôle important dans l'organisation des données sur la chaîne et leur envoi vers une base de données pour les requêtes. Les indexeurs rendent les données disponibles à tout moment en indexant les données de la blockchain et en fournissant un langage de requête similaire à SQL (comme l'API GraphQL). En fournissant une interface de requête unifiée, les indexeurs permettent aux développeurs de récupérer rapidement et avec précision les informations nécessaires en utilisant un langage de requête standardisé, simplifiant considérablement le processus.

Différents types d'indexeurs optimisent la récupération des données de différentes manières :

  1. Indexeur de nœud complet : extrait directement les données des nœuds complets de la blockchain, garantissant l'exactitude et l'intégrité des données, mais nécessitant une grande capacité de stockage et de traitement.
  2. Indexeur léger : S'appuie sur des nœuds complets pour obtenir des données spécifiques selon les besoins, réduisant les exigences de stockage mais pouvant augmenter le temps de requête.
  3. Indexeur dédié : optimisé pour des types de données spécifiques ou des blockchains spécifiques, comme les données NFT ou les transactions DeFi.
  4. Agrégateur d'index : extrait des données de plusieurs blockchains et sources, y compris des informations hors chaîne, et fournit une interface de requête unifiée, particulièrement adaptée aux dApps multi-chaînes.

Actuellement, les nœuds d'archive Ethereum occupent environ 13,5 To d'espace de stockage dans le client Geth, tandis que dans le client Erigon, ils occupent environ 3 To. Avec la croissance de la blockchain, la quantité de données stockées par les nœuds d'archive continuera d'augmenter. Face à un tel volume de données, les protocoles d'indexation majeurs prennent en charge non seulement l'indexation multi-chaînes, mais ont également personnalisé des cadres d'analyse des données en fonction des besoins en données des différentes applications.

L'apparition des indexeurs a considérablement amélioré l'efficacité de l'indexation et de la requête des données. Par rapport aux points de terminaison RPC traditionnels, les indexeurs peuvent indexer efficacement de grandes quantités de données et prendre en charge des requêtes à grande vitesse. Les utilisateurs peuvent effectuer des requêtes complexes, filtrer facilement les données et procéder à des analyses après extraction. Certains indexeurs prennent également en charge l'agrégation de plusieurs sources de données de Blockchain, évitant ainsi aux applications décentralisées multi-chaînes de devoir déployer plusieurs API. Grâce à un fonctionnement distribué, les indexeurs offrent une sécurité et des performances renforcées, réduisant ainsi les risques d'interruption potentiels liés aux fournisseurs RPC centralisés.

En revanche, l'indexeur permet aux utilisateurs d'accéder directement aux informations nécessaires sans avoir à traiter les données sous-jacentes complexes grâce à un langage de requête prédéfini. Ce mécanisme améliore considérablement l'efficacité et la fiabilité de la récupération des données, représentant une innovation importante dans l'accès aux données de la Blockchain.

2.4 Base de données de chaîne complète : alignement prioritaire sur le flux

Utiliser un nœud d'index pour interroger des données signifie généralement que l'API devient le seul point d'entrée pour traiter les données sur la blockchain. Cependant, lorsque le projet entre dans une phase d'expansion, il est souvent nécessaire d'avoir des sources de données plus flexibles, et les API standardisées peinent à répondre à ce besoin. Avec la complexification des besoins des applications, les indexeurs de données de base et leurs formats d'indexation standardisés deviennent progressivement insuffisants pour répondre aux demandes de requêtes de plus en plus diversifiées, telles que la recherche, l'accès inter-chaînes ou la cartographie des données hors chaîne.

Dans l'architecture moderne des pipelines de données, l'approche "priorité au flux" est devenue une solution pour surmonter les limitations du traitement par lots traditionnel, permettant l'ingestion, le traitement et l'analyse des données en temps réel. Ce changement de paradigme permet aux organisations de répondre immédiatement aux données entrantes, d'obtenir des insights presque en temps réel et de prendre des décisions. De même, les fournisseurs de services de données de Blockchain évoluent également vers la construction de flux de données de Blockchain, les fournisseurs de services d'indexation traditionnels lançant successivement des produits pour obtenir des données de Blockchain en temps réel sous forme de flux de données.

Ces services visent à répondre à la demande d'analyse en temps réel des transactions sur la Blockchain et à fournir des capacités de requête plus complètes. Tout comme l'architecture "priorité au flux" a révolutionné la manière de traiter les données dans les pipelines de données traditionnels en réduisant la latence et en améliorant la réactivité, ces fournisseurs de flux de données Blockchain espèrent également soutenir le développement de plus d'applications et aider à l'analyse des données on-chain grâce à des sources de données plus avancées et matures.

En redéfinissant les défis des données on-chain à travers le prisme des pipelines de données modernes, nous pouvons envisager le potentiel de gestion, de stockage et de fourniture des données on-chain sous un nouvel angle. Lorsque nous commençons à considérer des indexeurs tels que Subgraph et Ethereum ETL comme des flux de données dans un pipeline de données plutôt que comme des sorties finales, nous pouvons imaginer un monde où des ensembles de données haute performance sont sur mesure pour tout cas d'utilisation.

Lecture, indexation à l'analyse, aperçu de la piste d'indexation des données Web3

3 Comparaison approfondie entre The Graph, Chainbase et Space and Time

3.1 The Graph

Le réseau The Graph réalise des services d'indexation et de requête de données multi-chaînes grâce à un réseau décentralisé de nœuds, facilitant ainsi l'indexation des données de blockchain par les développeurs et la construction d'applications décentralisées. Ses principaux modèles de produits incluent le marché d'exécution des requêtes de données et le marché de mise en cache des index de données, qui servent essentiellement les besoins de requête de produits des utilisateurs.

Un sous-graphe est une structure de données fondamentale dans le réseau The Graph, définissant comment extraire et transformer des données de la Blockchain en un format interrogeable. N'importe qui peut créer un sous-graphe, et plusieurs applications peuvent réutiliser ces sous-graphes, améliorant la réutilisabilité des données et l'efficacité d'utilisation.

Le réseau The Graph est composé de quatre rôles clés : les indexeurs, les curateurs, les délégataires et les développeurs, qui fournissent ensemble un support de données pour les applications Web3. Actuellement, The Graph a évolué vers un service d'hébergement de sous-graphiques entièrement décentralisé, avec des incitations économiques circulant entre les différentes parties prenantes pour garantir le bon fonctionnement du système.

Les produits de The Graph se développent rapidement dans la vague de l'IA. Les outils AutoAgora, Allocation Optimizer et AgentC développés par Semiotic Labs améliorent respectivement les performances de l'écosystème dans plusieurs domaines. L'application de ces outils permet à The Graph de combiner l'IA pour améliorer encore l'intelligence du système et la convivialité pour les utilisateurs.

Lire, indexer pour analyser, un aperçu du secteur de l'indexation des données Web3

3.2 Chainbase

Chainbase est un réseau de données de chaîne complète qui intègre toutes les données de Blockchain sur une plateforme, facilitant ainsi la construction et la maintenance d'applications pour les développeurs. Ses fonctionnalités uniques incluent :

  • Lac de données en temps réel : fournit un lac de données en temps réel spécialement conçu pour les flux de données Blockchain, permettant un accès instantané aux données dès leur génération.
  • Architecture à double chaîne : basée sur Eigenlayer AVS pour construire la couche d'exécution, formant une architecture à double chaîne parallèle avec l'algorithme de consensus CometBFT.
  • Norme de format de données innovante : introduction de la norme de format de données "manuscripts", optimisation de la structuration et de l'utilisation des données dans l'industrie de la cryptographie.
  • Modèle du monde cryptographique : en combinant la technologie des modèles d'IA, créer un modèle d'IA capable de comprendre efficacement, de prédire les transactions Blockchain et d'interagir avec elles.

Le modèle AI Theia de Chainbase est un point clé qui le distingue des autres protocoles de services de données. Theia est basé sur le modèle DORA développé par NVIDIA, combinant des données on-chain et off-chain ainsi que des activités spatio-temporelles, apprenant et analysant les modèles cryptographiques, réagissant par inférence causale, et explorant en profondeur la valeur potentielle et les règles des données on-chain, offrant aux utilisateurs des services de données plus intelligents.

Lire, indexer pour analyser, résumé de la piste d'indexation des données Web3

3.3 Espace et Temps

Space and Time (SxT) vise à créer une couche de calcul vérifiable, en étendant les preuves à divulgation nulle sur un entrepôt de données décentralisé, pour fournir un traitement de données fiable pour les contrats intelligents, les grands modèles de langage et les entreprises.

SxT a introduit la technologie Proof of SQL, qui est une technique innovante de preuve à divulgation nulle de connaissance, garantissant que les requêtes SQL exécutées sur un entrepôt de données décentralisé sont à l'abri des modifications et vérifiables. Proof of SQL génère des preuves cryptographiques, vérifiant l'intégrité et l'exactitude des résultats des requêtes, permettant à tout vérificateur de confirmer de manière indépendante que les données n'ont pas été altérées pendant le traitement.

SxT a toujours collaboré étroitement avec le laboratoire d'innovation AI de Microsoft pour accélérer le développement d'outils d'IA générative, facilitant ainsi aux utilisateurs le traitement des données Blockchain par le biais du traitement du langage naturel. Dans l'espace et le temps Studio, les utilisateurs peuvent expérimenter l'entrée de requêtes en langage naturel, l'IA les convertira automatiquement en SQL et exécutera les instructions de requête, présentant ainsi le résultat final dont l'utilisateur a besoin.

Lire, indexer pour analyser, résumé de la piste d'indexation des données Web3

Conclusion et perspectives

La technologie d'indexation des données de blockchain a évolué depuis les sources de données des nœuds, à travers le développement de l'analyse des données et des indexeurs, pour finalement aboutir à des services de données sur toute la chaîne habilités par l'IA, passant par un processus d'amélioration progressive. L'évolution continue de ces technologies a non seulement amélioré l'efficacité et la précision de l'accès aux données, mais a également offert aux utilisateurs une expérience d'intelligence sans précédent.

En regardant vers l'avenir, avec le développement continu de nouvelles technologies telles que l'IA et les preuves à divulgation nulle de connaissance, les services de données Blockchain deviendront encore plus intelligents et sécurisés. Les services de données Blockchain, en tant qu'infrastructure, continueront de jouer un rôle important en fournissant un soutien solide aux progrès et à l'innovation dans l'industrie.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 4
  • Partager
Commentaire
0/400
ContractExplorervip
· 07-24 18:06
On parle de la spéculation sur l'IA ici.
Voir l'originalRépondre0
EyeOfTheTokenStormvip
· 07-24 18:05
Les indicateurs montrent clairement que le marché de l'IA et du Web3 est presque à son niveau le plus bas ! Entrez dans une position sans hésiter, tout le monde !
Voir l'originalRépondre0
¯\_(ツ)_/¯vip
· 07-24 18:00
Qui se soucie des index ? Tout sera réglé par l'IA.
Voir l'originalRépondre0
HypotheticalLiquidatorvip
· 07-24 17:56
Les risques de liquidation en chaîne liés à la sécurité des données se sont manifestés, l'alerte des facteurs de santé continue de chuter ah
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)