3. Aplicações funcionais: a latência de interação por voz é reduzida pela metade, com nova voz natural; após a abertura da API, será amplamente aplicada em áreas como simulação comercial, pesquisa científica e desenvolvimento de jogos, como aumentar o valor líquido dos negócios de máquinas de venda automática, acelerar a pesquisa científica e desenvolver jogos rapidamente. 4. Planos futuros: Lançamento do modelo de codificação em algumas semanas, melhorando a capacidade multimodal; início do treinamento de geração de vídeo nas próximas 3 a 4 semanas, com o objetivo de criar modelos mais rápidos e inteligentes, impulsionando a evolução da civilização humana.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Abaixo está o resumo do conteúdo da conferência👇
3. Aplicações funcionais: a latência de interação por voz é reduzida pela metade, com nova voz natural; após a abertura da API, será amplamente aplicada em áreas como simulação comercial, pesquisa científica e desenvolvimento de jogos, como aumentar o valor líquido dos negócios de máquinas de venda automática, acelerar a pesquisa científica e desenvolver jogos rapidamente.
4. Planos futuros: Lançamento do modelo de codificação em algumas semanas, melhorando a capacidade multimodal; início do treinamento de geração de vídeo nas próximas 3 a 4 semanas, com o objetivo de criar modelos mais rápidos e inteligentes, impulsionando a evolução da civilização humana.