Competição de Grandes Modelos de IA: Problema de Engenharia ou Desafio Científico?
No mês passado, houve uma "guerra dos animais" no mundo da IA.
De um lado está o modelo Llama( da Meta, que é muito popular entre os desenvolvedores devido à sua natureza de código aberto. Do outro lado, temos o modelo Falcon), desenvolvido pelo Instituto de Inovação Tecnológica dos Emirados Árabes Unidos. Ambos têm alternado no topo do ranking de LLMs de código aberto.
Curiosamente, o governo dos Emirados Árabes Unidos afirmou que participar da competição de IA é para "subverter os jogadores principais". Hoje em dia, qualquer país ou empresa com um pouco de recursos financeiros está a desenvolver o seu próprio modelo de linguagem de grande escala.
Esta situação de "guerra de modelos" origina-se do artigo sobre o algoritmo Transformer publicado pelo Google em 2017. O Transformer resolveu muitos problemas de processamento de linguagem natural, transformando grandes modelos de uma questão de pesquisa teórica em um problema puramente de engenharia. Desde que haja poder computacional e dados suficientes, quase qualquer equipe pode treinar um grande modelo.
No entanto, desenvolver grandes modelos não significa que se pode vencer na era da IA. O Llama da Meta, embora esteja classificado abaixo do Falcon, continua a ser um marco para LLMs de código aberto devido à sua comunidade de desenvolvedores ativa. E em termos de desempenho, a maioria dos LLMs ainda tem uma diferença clara em relação ao GPT-4.
A principal vantagem competitiva dos grandes modelos reside na construção de ecossistemas ou na pura capacidade de raciocínio, e não apenas na escala de parâmetros. Além disso, os altos custos de computação também se tornaram um obstáculo ao desenvolvimento da indústria. Estima-se que o investimento das empresas de tecnologia em infraestrutura de grandes modelos ultrapasse amplamente a receita que estes geram.
Atualmente, à exceção de alguns casos isolados, a maioria das empresas de IA ainda não encontrou um modelo de lucro. Mesmo gigantes de software como Microsoft e Adobe enfrentam dificuldades na precificação de produtos de IA.
Com o aumento da concorrência homogeneizada e o crescimento de modelos de código aberto, os fornecedores de grandes modelos podem enfrentar uma pressão maior. No futuro, o valor da IA pode estar mais relacionado a cenários de aplicação específicos, em vez do próprio modelo.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
18 Curtidas
Recompensa
18
6
Compartilhar
Comentário
0/400
StablecoinEnjoyer
· 19h atrás
O Sr. Ma ainda entende Llama yyds
Ver originalResponder0
ForeverBuyingDips
· 07-21 02:33
comprar na baixa都抄到AI圈了 呜呜
Ver originalResponder0
MidnightTrader
· 07-21 02:32
Brincar com grandes modelos é suficiente. Quem investir dinheiro, quem ganhará.
Ver originalResponder0
bridge_anxiety
· 07-21 02:24
Apenas uma discussão sobre espadas e dinheiro.
Ver originalResponder0
FlashLoanLarry
· 07-21 02:19
lol outra corrida de queima de capital... as métricas de eficiência vão ser fundamentais aqui ngl
Competição de grandes modelos de IA: desafio técnico ou problema comercial
Competição de Grandes Modelos de IA: Problema de Engenharia ou Desafio Científico?
No mês passado, houve uma "guerra dos animais" no mundo da IA.
De um lado está o modelo Llama( da Meta, que é muito popular entre os desenvolvedores devido à sua natureza de código aberto. Do outro lado, temos o modelo Falcon), desenvolvido pelo Instituto de Inovação Tecnológica dos Emirados Árabes Unidos. Ambos têm alternado no topo do ranking de LLMs de código aberto.
Curiosamente, o governo dos Emirados Árabes Unidos afirmou que participar da competição de IA é para "subverter os jogadores principais". Hoje em dia, qualquer país ou empresa com um pouco de recursos financeiros está a desenvolver o seu próprio modelo de linguagem de grande escala.
Esta situação de "guerra de modelos" origina-se do artigo sobre o algoritmo Transformer publicado pelo Google em 2017. O Transformer resolveu muitos problemas de processamento de linguagem natural, transformando grandes modelos de uma questão de pesquisa teórica em um problema puramente de engenharia. Desde que haja poder computacional e dados suficientes, quase qualquer equipe pode treinar um grande modelo.
No entanto, desenvolver grandes modelos não significa que se pode vencer na era da IA. O Llama da Meta, embora esteja classificado abaixo do Falcon, continua a ser um marco para LLMs de código aberto devido à sua comunidade de desenvolvedores ativa. E em termos de desempenho, a maioria dos LLMs ainda tem uma diferença clara em relação ao GPT-4.
A principal vantagem competitiva dos grandes modelos reside na construção de ecossistemas ou na pura capacidade de raciocínio, e não apenas na escala de parâmetros. Além disso, os altos custos de computação também se tornaram um obstáculo ao desenvolvimento da indústria. Estima-se que o investimento das empresas de tecnologia em infraestrutura de grandes modelos ultrapasse amplamente a receita que estes geram.
Atualmente, à exceção de alguns casos isolados, a maioria das empresas de IA ainda não encontrou um modelo de lucro. Mesmo gigantes de software como Microsoft e Adobe enfrentam dificuldades na precificação de produtos de IA.
Com o aumento da concorrência homogeneizada e o crescimento de modelos de código aberto, os fornecedores de grandes modelos podem enfrentar uma pressão maior. No futuro, o valor da IA pode estar mais relacionado a cenários de aplicação específicos, em vez do próprio modelo.