Poder de computação: um novo modelo de negócios na era dos grandes modelos
O treinamento de grandes modelos requer um grande apoio de poder de computação, o que impulsionou os serviços de poder de computação a se tornarem um novo modelo de negócios emergente. Embora atualmente haja escassez de GPUs de alto desempenho, a indústria está respondendo ativamente a esse desafio.
Treinar modelos de linguagem em larga escala requer enormes recursos de computação. Tomando como exemplo um grande modelo meteorológico, usar 200 placas GPU para treinamento durante dois meses pode custar mais de 2 milhões de yuans. Já o custo para treinar um modelo grande e geral pode ser até cem vezes maior. Atualmente, na China, já existem mais de 100 grandes modelos com uma escala de parâmetros que chega a 1 bilhão, mas a escassez de GPUs de alta performance tornou-se o principal desafio enfrentado pelo setor.
Para enfrentar a falta de Poder de computação, as empresas tomaram várias medidas:
Utilizar dados de maior qualidade para aumentar a eficiência do treinamento
Otimizar a infraestrutura, garantindo funcionamento estável acima de mil calorias
Melhorar a capacidade de agendamento de poder de computação, aumentando a utilização de recursos
Adotar uma arquitetura de supercomputação para reduzir custos
Explorar o uso da plataforma GPU nacional
Ao mesmo tempo, os fornecedores de Poder de computação estão a explorar novos modelos de negócio. Os métodos de cobrança mais comuns atualmente incluem a cobrança por utilização e pacotes anuais ou mensais. No futuro, será promovida a "integração e fusão de Poder de computação e rede", para alcançar uma programação flexível entre arquiteturas, regiões e fornecedores.
Com a normalização da demanda por grandes modelos, o Poder de computação está rapidamente se desenvolvendo como uma cadeia industrial única. Embora atualmente a escassez de GPUs de alta gama esteja causando uma "corrida por chips", a longo prazo, a serviço de Poder de computação é uma tendência certa. Os provedores de serviços de Poder de computação precisam se preparar para o desenvolvimento após o retorno da racionalidade do mercado.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
12 gostos
Recompensa
12
4
Partilhar
Comentar
0/400
OnchainSniper
· 16h atrás
Agora falta tudo.
Ver originalResponder0
BearMarketNoodler
· 16h atrás
O mercado perseguiu o preço até a falta de chips, e quando a especulação chega ao ponto da loucura, é um sinal de pico.
Serviços de poder de computação na formação de grandes modelos: novas oportunidades sob o desafio da escassez
Poder de computação: um novo modelo de negócios na era dos grandes modelos
O treinamento de grandes modelos requer um grande apoio de poder de computação, o que impulsionou os serviços de poder de computação a se tornarem um novo modelo de negócios emergente. Embora atualmente haja escassez de GPUs de alto desempenho, a indústria está respondendo ativamente a esse desafio.
Treinar modelos de linguagem em larga escala requer enormes recursos de computação. Tomando como exemplo um grande modelo meteorológico, usar 200 placas GPU para treinamento durante dois meses pode custar mais de 2 milhões de yuans. Já o custo para treinar um modelo grande e geral pode ser até cem vezes maior. Atualmente, na China, já existem mais de 100 grandes modelos com uma escala de parâmetros que chega a 1 bilhão, mas a escassez de GPUs de alta performance tornou-se o principal desafio enfrentado pelo setor.
Para enfrentar a falta de Poder de computação, as empresas tomaram várias medidas:
Ao mesmo tempo, os fornecedores de Poder de computação estão a explorar novos modelos de negócio. Os métodos de cobrança mais comuns atualmente incluem a cobrança por utilização e pacotes anuais ou mensais. No futuro, será promovida a "integração e fusão de Poder de computação e rede", para alcançar uma programação flexível entre arquiteturas, regiões e fornecedores.
Com a normalização da demanda por grandes modelos, o Poder de computação está rapidamente se desenvolvendo como uma cadeia industrial única. Embora atualmente a escassez de GPUs de alta gama esteja causando uma "corrida por chips", a longo prazo, a serviço de Poder de computação é uma tendência certa. Os provedores de serviços de Poder de computação precisam se preparar para o desenvolvimento após o retorno da racionalidade do mercado.