Evolución de la indexación de datos en la cadena de bloques: de nodo a base de datos de AI de la cadena completa
1. Introducción
Desde que surgieron las primeras aplicaciones descentralizadas (dApp) en 2017, el ecosistema de la cadena de bloques ha crecido de manera exuberante, apareciendo numerosas dApp financieras, de juegos y sociales basadas en diferentes cadenas de bloques. Sin embargo, las diversas fuentes de datos de las que dependen estas aplicaciones durante el proceso de interacción merecen una reflexión profunda.
En 2024, la inteligencia artificial y Web3 se convirtieron en temas candentes. En el campo de la IA, los datos son como la fuente de vida, impulsando el aprendizaje y la evolución de los sistemas. Sin el respaldo de grandes volúmenes de datos, incluso los algoritmos de IA más sofisticados tienen dificultades para alcanzar su potencial.
Este artículo analizará en profundidad la evolución del índice de datos en el proceso de desarrollo de la industria desde la perspectiva de la accesibilidad de los datos de la cadena de bloques. También compararemos el protocolo de índice de datos tradicional The Graph con los nuevos protocolos de servicios de datos de cadena de bloques Chainbase y Space and Time, para explorar las similitudes y diferencias de estos nuevos protocolos que combinan la tecnología de IA en términos de servicios de datos y arquitectura de productos.
2. Evolución del índice de datos: de nodos de cadena de bloques a base de datos de cadena completa
2.1 Fuente de datos: Nodo de la cadena de bloques
La cadena de bloques se conoce como un libro de contabilidad descentralizado, y el nodo es la base de esta red. Cada nodo guarda una copia completa de los datos de la cadena de bloques, asegurando la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no solo tiene una alta barrera técnica, sino que también requiere asumir altos costos de hardware y ancho de banda.
Para resolver este problema, han surgido los proveedores de nodos RPC. Son responsables del mantenimiento de los nodos y proporcionan servicios de acceso a datos a los usuarios a través de puntos finales RPC. Aunque los puntos finales RPC públicos son gratuitos, tienen límites de velocidad que pueden afectar la experiencia del usuario de las dApp. Aunque los puntos finales RPC privados tienen un mejor rendimiento, la eficiencia para consultas complejas sigue siendo baja y es difícil escalar a través de redes. A pesar de esto, las interfaces API estandarizadas de los proveedores de nodos han reducido la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para el posterior análisis de datos y aplicaciones.
2.2 Análisis de datos: de datos en bruto a datos utilizables
Los datos originales proporcionados por los nodos de la cadena de bloques suelen estar encriptados y codificados, aunque esto garantiza la integridad y seguridad de los datos, también aumenta la dificultad de análisis. Para los usuarios comunes y los desarrolladores, manejar estos datos directamente requiere una gran cantidad de conocimientos especializados y recursos computacionales.
Por lo tanto, el proceso de análisis de datos se vuelve especialmente importante. Al convertir datos brutos complejos en un formato fácil de entender y manipular, los usuarios pueden aprovechar estos datos de manera más intuitiva. La calidad del análisis de datos afecta directamente la eficiencia y efectividad de las aplicaciones de datos de la cadena de bloques, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 La evolución del indexador de datos
Con el aumento explosivo de la cantidad de datos en la cadena de bloques, la demanda de indexadores de datos se vuelve cada vez más urgente. Los indexadores son responsables de organizar los datos en la cadena y almacenarlos en una base de datos para su consulta. Indexan los datos de la cadena de bloques y proporcionan un lenguaje de consulta similar a SQL (, como la interfaz GraphQL ), lo que hace que los datos estén disponibles en todo momento. Los indexadores proporcionan a los desarrolladores una interfaz de consulta unificada, simplificando enormemente el proceso de recuperación de datos.
Diferentes tipos de indexadores tienen sus ventajas:
Índice de nodo completo: extrae datos directamente de nodos completos, asegurando que los datos sean completos y precisos, pero requiere una gran capacidad de almacenamiento y procesamiento.
Indexador ligero: depende de nodos completos para obtener datos específicos bajo demanda, reduce la necesidad de almacenamiento pero puede aumentar el tiempo de consulta.
Indexador especializado: optimizado para tipos de datos específicos o cadena de bloques, como datos de NFT o transacciones de DeFi.
Agregador de índices: extrae datos de múltiples cadenas de bloques y fuentes, incluyendo información fuera de la cadena, y proporciona una interfaz de consulta unificada, adecuada para dApps de múltiples cadenas.
Actualmente, los requisitos de almacenamiento de los nodos de archivo de Ethereum varían entre 3TB y 13.5TB en diferentes clientes. Ante tal cantidad de datos, los protocolos de indexación más utilizados no solo admiten la indexación multichain, sino que también han personalizado marcos de análisis de datos según las diferentes necesidades de las aplicaciones, como el marco de "subgráficos" de The Graph (Subgraph).
La aparición de los indexadores ha mejorado significativamente la eficiencia de indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden manejar grandes volúmenes de datos de manera eficiente, soportando consultas complejas y filtrado de datos. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadena de bloques, evitando el problema de que las dApps multichain necesiten desplegar múltiples API. A través de la ejecución distribuida, los indexadores no solo proporcionan una mayor seguridad y rendimiento, sino que también reducen el riesgo de interrupciones que pueden causar los proveedores de RPC centralizados.
2.4 Base de datos de toda la cadena: transición al modo de prioridad de flujo
A medida que las demandas de las aplicaciones se vuelven cada vez más complejas, los indexadores de datos básicos y sus formatos de índice estandarizados se vuelven difíciles de satisfacer para las diversas necesidades de consulta, como el acceso entre cadenas o el mapeo de datos fuera de la cadena.
En la arquitectura moderna de tuberías de datos, el enfoque "prioritario en el flujo" se ha convertido en una solución para las limitaciones del procesamiento por lotes tradicional, permitiendo el procesamiento y análisis de datos en tiempo real. Los proveedores de servicios de datos de cadena de bloques también están avanzando hacia la construcción de flujos de datos, como Substreams de The Graph, Mirror de Goldsky, y los lagos de datos en tiempo real ofrecidos por Chainbase y SubSquid.
Estos servicios están diseñados para abordar la necesidad de análisis en tiempo real de transacciones en la cadena de bloques y capacidades de consulta exhaustiva. Al redefinir los desafíos de los datos en la cadena desde la perspectiva de modernos canales de datos, podemos observar el potencial de gestión, almacenamiento y provisión de datos desde una nueva perspectiva. Al considerar el indexador como un flujo de datos en lugar de una salida final, podemos imaginar la posibilidad de personalizar conjuntos de datos de alto rendimiento para cualquier caso de uso empresarial.
3. AI + Base de datos: comparación profunda entre The Graph, Chainbase y Space and Time
3.1 The Graph
La red The Graph ofrece servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados. Sus productos centrales incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, que atienden las necesidades de consulta de productos de los usuarios.
Subgráficos ( son la estructura de datos fundamental de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. La red está compuesta por cuatro roles clave: indexadores, curadores, delegadores y desarrolladores, que trabajan juntos para proporcionar soporte de datos para aplicaciones web3.
The Graph ha cambiado completamente a un servicio de alojamiento de subgráficos descentralizado, donde las partes involucradas aseguran el funcionamiento del sistema a través de incentivos económicos. Recientemente, el equipo de desarrollo central del ecosistema de The Graph, Semiotic Labs, ha utilizado tecnología de IA para optimizar la fijación de precios de índices y la experiencia de consulta del usuario, desarrollando herramientas como AutoAgora, Allocation Optimizer y AgentC, que mejoran aún más la inteligencia del sistema y la amigabilidad para el usuario.
![Lectura, indexación para análisis, descripción breve de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma. Sus funciones destacadas incluyen:
Lago de datos en tiempo real: proporciona un lago de datos en tiempo real especializado para el flujo de datos de la cadena de bloques.
Arquitectura de doble cadena: construida sobre la capa de ejecución de Eigenlayer AVS, formando una arquitectura de doble cadena paralela con el algoritmo de consenso CometBFT.
Estándar de formato de datos innovador: introducción del estándar de formato de datos "manuscripts".
Modelo del mundo cripto: combinando la tecnología de modelos de IA, se crea el modelo de IA Theia que puede entender y predecir las transacciones en la cadena de bloques.
El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, combinando el análisis de datos en cadena y fuera de cadena con un modo de encriptación, y respondiendo a través de la inferencia causal para proporcionar servicios de datos inteligentes a los usuarios.
![Lectura, índice a análisis, breve descripción de la pista de índice de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espacio y Tiempo
Space and Time ###SxT( se dedica a crear una capa de cálculo verificable, ampliando pruebas de conocimiento cero sobre un almacén de datos descentralizado. Su tecnología central Proof of SQL es una innovadora técnica de prueba de conocimiento cero que asegura que las consultas SQL ejecutadas en el almacén de datos descentralizado sean a prueba de manipulaciones y verificables.
SxT colabora con el Laboratorio de Innovación de IA de Microsoft para desarrollar herramientas de IA generativa que permiten a los usuarios procesar datos de la Cadena de bloques mediante el lenguaje natural. En Space and Time Studio, los usuarios pueden experimentar ingresando consultas en lenguaje natural, y la IA las convierte automáticamente en SQL y ejecuta la consulta.
![Leer, indexar para analizar, resumen de la carrera de indexación de datos de Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusión y perspectivas
La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde las fuentes de datos de los nodos iniciales, pasando por el desarrollo de la解析 de datos y los indexadores, hasta finalmente convertirse en un servicio de datos de toda la cadena potenciado por la IA, atravesando un proceso de mejora gradual. Esta evolución constante de las tecnologías no solo ha aumentado la eficiencia y la precisión del acceso a los datos, sino que también ha brindado a los usuarios una experiencia de inteligencia sin precedentes.
Mirando hacia el futuro, con el continuo desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de la cadena de bloques seguirán desempeñando un papel importante en el avance y la innovación de la industria.
![Lectura, indexación para análisis, breve descripción de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
12 me gusta
Recompensa
12
6
Republicar
Compartir
Comentar
0/400
BtcDailyResearcher
· hace22h
Toda la data de la cadena, por increíble que sea, no se compara con lo increíble que sube el precio de la moneda.
Ver originalesResponder0
ZKSherlock
· hace23h
en realidad... las implicaciones de privacidad de la indexación en blockchain impulsada por IA están severamente subexaminadas aquí. ¿dónde está la arquitectura de zkp?
Ver originalesResponder0
gas_guzzler
· hace23h
Escuchar es agotador, el Nodo no gira.
Ver originalesResponder0
DarkPoolWatcher
· hace23h
No tiene sentido abandonar la centralización.
Ver originalesResponder0
FlashLoanKing
· hace23h
Otra publicación sensacionalista sobre la IA
Ver originalesResponder0
DefiEngineerJack
· hace23h
*sigh* otra vez una visión ingenua sobre la indexación de datos... muéstrame los benchmarks reales ser
Historia de la evolución del índice de datos de la cadena de bloques: de nodo a base de datos de cadena completa habilitada por IA
Evolución de la indexación de datos en la cadena de bloques: de nodo a base de datos de AI de la cadena completa
1. Introducción
Desde que surgieron las primeras aplicaciones descentralizadas (dApp) en 2017, el ecosistema de la cadena de bloques ha crecido de manera exuberante, apareciendo numerosas dApp financieras, de juegos y sociales basadas en diferentes cadenas de bloques. Sin embargo, las diversas fuentes de datos de las que dependen estas aplicaciones durante el proceso de interacción merecen una reflexión profunda.
En 2024, la inteligencia artificial y Web3 se convirtieron en temas candentes. En el campo de la IA, los datos son como la fuente de vida, impulsando el aprendizaje y la evolución de los sistemas. Sin el respaldo de grandes volúmenes de datos, incluso los algoritmos de IA más sofisticados tienen dificultades para alcanzar su potencial.
Este artículo analizará en profundidad la evolución del índice de datos en el proceso de desarrollo de la industria desde la perspectiva de la accesibilidad de los datos de la cadena de bloques. También compararemos el protocolo de índice de datos tradicional The Graph con los nuevos protocolos de servicios de datos de cadena de bloques Chainbase y Space and Time, para explorar las similitudes y diferencias de estos nuevos protocolos que combinan la tecnología de IA en términos de servicios de datos y arquitectura de productos.
2. Evolución del índice de datos: de nodos de cadena de bloques a base de datos de cadena completa
2.1 Fuente de datos: Nodo de la cadena de bloques
La cadena de bloques se conoce como un libro de contabilidad descentralizado, y el nodo es la base de esta red. Cada nodo guarda una copia completa de los datos de la cadena de bloques, asegurando la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no solo tiene una alta barrera técnica, sino que también requiere asumir altos costos de hardware y ancho de banda.
Para resolver este problema, han surgido los proveedores de nodos RPC. Son responsables del mantenimiento de los nodos y proporcionan servicios de acceso a datos a los usuarios a través de puntos finales RPC. Aunque los puntos finales RPC públicos son gratuitos, tienen límites de velocidad que pueden afectar la experiencia del usuario de las dApp. Aunque los puntos finales RPC privados tienen un mejor rendimiento, la eficiencia para consultas complejas sigue siendo baja y es difícil escalar a través de redes. A pesar de esto, las interfaces API estandarizadas de los proveedores de nodos han reducido la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para el posterior análisis de datos y aplicaciones.
2.2 Análisis de datos: de datos en bruto a datos utilizables
Los datos originales proporcionados por los nodos de la cadena de bloques suelen estar encriptados y codificados, aunque esto garantiza la integridad y seguridad de los datos, también aumenta la dificultad de análisis. Para los usuarios comunes y los desarrolladores, manejar estos datos directamente requiere una gran cantidad de conocimientos especializados y recursos computacionales.
Por lo tanto, el proceso de análisis de datos se vuelve especialmente importante. Al convertir datos brutos complejos en un formato fácil de entender y manipular, los usuarios pueden aprovechar estos datos de manera más intuitiva. La calidad del análisis de datos afecta directamente la eficiencia y efectividad de las aplicaciones de datos de la cadena de bloques, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 La evolución del indexador de datos
Con el aumento explosivo de la cantidad de datos en la cadena de bloques, la demanda de indexadores de datos se vuelve cada vez más urgente. Los indexadores son responsables de organizar los datos en la cadena y almacenarlos en una base de datos para su consulta. Indexan los datos de la cadena de bloques y proporcionan un lenguaje de consulta similar a SQL (, como la interfaz GraphQL ), lo que hace que los datos estén disponibles en todo momento. Los indexadores proporcionan a los desarrolladores una interfaz de consulta unificada, simplificando enormemente el proceso de recuperación de datos.
Diferentes tipos de indexadores tienen sus ventajas:
Actualmente, los requisitos de almacenamiento de los nodos de archivo de Ethereum varían entre 3TB y 13.5TB en diferentes clientes. Ante tal cantidad de datos, los protocolos de indexación más utilizados no solo admiten la indexación multichain, sino que también han personalizado marcos de análisis de datos según las diferentes necesidades de las aplicaciones, como el marco de "subgráficos" de The Graph (Subgraph).
La aparición de los indexadores ha mejorado significativamente la eficiencia de indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden manejar grandes volúmenes de datos de manera eficiente, soportando consultas complejas y filtrado de datos. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadena de bloques, evitando el problema de que las dApps multichain necesiten desplegar múltiples API. A través de la ejecución distribuida, los indexadores no solo proporcionan una mayor seguridad y rendimiento, sino que también reducen el riesgo de interrupciones que pueden causar los proveedores de RPC centralizados.
2.4 Base de datos de toda la cadena: transición al modo de prioridad de flujo
A medida que las demandas de las aplicaciones se vuelven cada vez más complejas, los indexadores de datos básicos y sus formatos de índice estandarizados se vuelven difíciles de satisfacer para las diversas necesidades de consulta, como el acceso entre cadenas o el mapeo de datos fuera de la cadena.
En la arquitectura moderna de tuberías de datos, el enfoque "prioritario en el flujo" se ha convertido en una solución para las limitaciones del procesamiento por lotes tradicional, permitiendo el procesamiento y análisis de datos en tiempo real. Los proveedores de servicios de datos de cadena de bloques también están avanzando hacia la construcción de flujos de datos, como Substreams de The Graph, Mirror de Goldsky, y los lagos de datos en tiempo real ofrecidos por Chainbase y SubSquid.
Estos servicios están diseñados para abordar la necesidad de análisis en tiempo real de transacciones en la cadena de bloques y capacidades de consulta exhaustiva. Al redefinir los desafíos de los datos en la cadena desde la perspectiva de modernos canales de datos, podemos observar el potencial de gestión, almacenamiento y provisión de datos desde una nueva perspectiva. Al considerar el indexador como un flujo de datos en lugar de una salida final, podemos imaginar la posibilidad de personalizar conjuntos de datos de alto rendimiento para cualquier caso de uso empresarial.
3. AI + Base de datos: comparación profunda entre The Graph, Chainbase y Space and Time
3.1 The Graph
La red The Graph ofrece servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados. Sus productos centrales incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, que atienden las necesidades de consulta de productos de los usuarios.
Subgráficos ( son la estructura de datos fundamental de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. La red está compuesta por cuatro roles clave: indexadores, curadores, delegadores y desarrolladores, que trabajan juntos para proporcionar soporte de datos para aplicaciones web3.
The Graph ha cambiado completamente a un servicio de alojamiento de subgráficos descentralizado, donde las partes involucradas aseguran el funcionamiento del sistema a través de incentivos económicos. Recientemente, el equipo de desarrollo central del ecosistema de The Graph, Semiotic Labs, ha utilizado tecnología de IA para optimizar la fijación de precios de índices y la experiencia de consulta del usuario, desarrollando herramientas como AutoAgora, Allocation Optimizer y AgentC, que mejoran aún más la inteligencia del sistema y la amigabilidad para el usuario.
![Lectura, indexación para análisis, descripción breve de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma. Sus funciones destacadas incluyen:
El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, combinando el análisis de datos en cadena y fuera de cadena con un modo de encriptación, y respondiendo a través de la inferencia causal para proporcionar servicios de datos inteligentes a los usuarios.
![Lectura, índice a análisis, breve descripción de la pista de índice de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espacio y Tiempo
Space and Time ###SxT( se dedica a crear una capa de cálculo verificable, ampliando pruebas de conocimiento cero sobre un almacén de datos descentralizado. Su tecnología central Proof of SQL es una innovadora técnica de prueba de conocimiento cero que asegura que las consultas SQL ejecutadas en el almacén de datos descentralizado sean a prueba de manipulaciones y verificables.
SxT colabora con el Laboratorio de Innovación de IA de Microsoft para desarrollar herramientas de IA generativa que permiten a los usuarios procesar datos de la Cadena de bloques mediante el lenguaje natural. En Space and Time Studio, los usuarios pueden experimentar ingresando consultas en lenguaje natural, y la IA las convierte automáticamente en SQL y ejecuta la consulta.
![Leer, indexar para analizar, resumen de la carrera de indexación de datos de Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusión y perspectivas
La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde las fuentes de datos de los nodos iniciales, pasando por el desarrollo de la解析 de datos y los indexadores, hasta finalmente convertirse en un servicio de datos de toda la cadena potenciado por la IA, atravesando un proceso de mejora gradual. Esta evolución constante de las tecnologías no solo ha aumentado la eficiencia y la precisión del acceso a los datos, sino que también ha brindado a los usuarios una experiencia de inteligencia sin precedentes.
Mirando hacia el futuro, con el continuo desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de la cadena de bloques seguirán desempeñando un papel importante en el avance y la innovación de la industria.
![Lectura, indexación para análisis, breve descripción de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(