Servicios de potencia computacional en el entrenamiento de grandes modelos: nuevas oportunidades de negocio ante el desafío de la escasez.

robot
Generación de resúmenes en curso

Potencia computacional: Un nuevo modelo de negocio en la era de los grandes modelos

El entrenamiento de grandes modelos requiere un gran apoyo de potencia computacional, lo que ha impulsado el servicio de potencia computacional a convertirse en un nuevo modelo comercial emergente. Aunque actualmente hay escasez de GPU de alta gama, la industria está respondiendo activamente a este desafío.

Entrenar modelos de lenguaje a gran escala requiere enormes recursos computacionales. Tomando como ejemplo un gran modelo meteorológico, el costo de entrenar durante dos meses con 200 tarjetas GPU podría superar los 2 millones de yuanes. Además, el costo de entrenar modelos grandes generales podría ser cien veces mayor. Actualmente, en China ya hay más de 100 modelos grandes con un tamaño de parámetros que alcanza los 1.000 millones, pero la escasez de GPU de alta gama se ha convertido en el principal desafío que enfrenta la industria.

Para hacer frente a la escasez de Potencia computacional, las empresas han tomado diversas medidas:

  1. Utilizar datos de mayor calidad para mejorar la eficiencia del entrenamiento
  2. Optimizar la infraestructura para lograr un funcionamiento estable por encima de mil calorías.
  3. Mejorar la capacidad de programación de potencia computacional, aumentar la tasa de utilización de recursos
  4. Adoptar una arquitectura de supercomputación para reducir costos
  5. Explorar el uso de plataformas GPU nacionales

Al mismo tiempo, los proveedores de potencia computacional están explorando nuevos modelos comerciales. Actualmente, los métodos de facturación más comunes incluyen la facturación por uso y las tarifas anuales o mensuales. En el futuro, se promoverá la "integración de la potencia computacional y la red", logrando una programación flexible entre arquitecturas, regiones y proveedores de servicios.

Con la normalización de la demanda de modelos grandes, los servicios de potencia computacional están evolucionando rápidamente hacia una cadena industrial única. Aunque actualmente la escasez de GPU de alta gama ha causado un fenómeno de "competencia por los chips", a largo plazo, la serviciación de la potencia computacional es una tendencia segura. Los proveedores de servicios de potencia computacional deben anticiparse y prepararse para el desarrollo una vez que el mercado regrese a la racionalidad.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
OnchainSnipervip
· hace10h
Ahora falta de todo.
Ver originalesResponder0
BearMarketNoodlervip
· hace10h
El mercado persigue el precio hasta quedarse sin chips, cuando se llega a un nivel de locura es la señal de que se ha alcanzado el techo.
Ver originalesResponder0
EthSandwichHerovip
· hace10h
La tarjeta gráfica es un dios.
Ver originalesResponder0
LoneValidatorvip
· hace10h
Falta de todo menos de dinero.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)