【jeton界】Tether a récemment présenté son nouveau système QVAC, réussissant à exécuter le modèle LLAMA 3.2 (10 milliards de paramètres) sur des appareils mobiles avec llama.cpp, permettant une inférence locale efficace. QVAC est un runtime général d'inférence et de fine-tuning, conçu pour s'adapter à une variété de dispositifs, y compris les smartphones, les ordinateurs portables et les serveurs. Actuellement, plusieurs modèles sont pris en charge, et l'assistance à davantage de modèles sera étendue à l'avenir.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
8 J'aime
Récompense
8
6
Partager
Commentaire
0/400
screenshot_gains
· Il y a 12h
Le bull est arrivé avec fracas.
Voir l'originalRépondre0
SandwichDetector
· 07-19 00:04
Enfin, l'ouverture des Bots a été localisée.
Voir l'originalRépondre0
SchroedingerAirdrop
· 07-19 00:02
Un téléphone peut faire tourner llama ? Bull !
Voir l'originalRépondre0
SchrodingersPaper
· 07-18 23:56
Ah, prendre les gens pour des idiots, j'ai pris l'argent pour faire de l'IA.
Voir l'originalRépondre0
GamefiHarvester
· 07-18 23:51
Ce projet est vraiment intéressant, j'ai l'impression qu'on peut prendre les gens pour des idiots.
Voir l'originalRépondre0
CryptoCross-TalkClub
· 07-18 23:46
Le prochain bull run, c'est avec l'IA qu'on va se faire prendre pour des cons, même le prendre les gens pour des idiots a été emporté par l'intelligence artificielle.
Tether lance le système QVAC : les téléphones peuvent exécuter le modèle LLAMA 3.2 pour réaliser une inférence locale
【jeton界】Tether a récemment présenté son nouveau système QVAC, réussissant à exécuter le modèle LLAMA 3.2 (10 milliards de paramètres) sur des appareils mobiles avec llama.cpp, permettant une inférence locale efficace. QVAC est un runtime général d'inférence et de fine-tuning, conçu pour s'adapter à une variété de dispositifs, y compris les smartphones, les ordinateurs portables et les serveurs. Actuellement, plusieurs modèles sont pris en charge, et l'assistance à davantage de modèles sera étendue à l'avenir.