não é uma verdadeira latência de otimização de qualquer maneira.



ou está a passar alguns tokens de texto adicionais para a sua carga útil do pedido POST e a passar isso para o seu pedido de API de forma dinâmica (negligível)

ou você está apenas codificando isso estaticamente no prompt diretamente em seu pedido de API (ainda
NOT-7.31%
REQ0.35%
JST1.21%
PROMPT-2.5%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 6
  • Compartilhar
Comentário
0/400
GweiTooHighvip
· 06-22 12:46
Isso ainda precisa ser discutido? Não é apenas a capacidade de cálculo p.
Ver originalResponder0
LuckyBearDrawervip
· 06-22 12:37
Desempenho é apenas uma decoração.
Ver originalResponder0
SchrödingersNodevip
· 06-22 12:36
Calcular o consumo não é importante.
Ver originalResponder0
GateUser-74b10196vip
· 06-22 12:29
Ainda é melhor codificá-lo diretamente.
Ver originalResponder0
NestedFoxvip
· 06-22 12:25
Remover o payload não faz muita diferença, certo?
Ver originalResponder0
GhostWalletSleuthvip
· 06-22 12:25
Hmm, a sensação não é diferente.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)