Compétition des grands modèles d'IA : problème d'ingénierie ou défi scientifique ?
Le mois dernier, une "bataille des animaux" a éclaté dans le domaine de l'IA.
D'un côté, le modèle Llama( d'Meta, connu sous le nom de "lamas d'Amérique" et apprécié des développeurs pour sa nature open source. De l'autre côté, il y a le modèle Falcon), développé par l'Institut de recherche sur l'innovation technologique des Émirats. Les deux modèles se sont successivement classés en tête du classement des LLM open source.
Il est intéressant de noter que le gouvernement des Émirats arabes unis a déclaré que sa participation à la compétition d'IA vise à "défaire les acteurs clés". Aujourd'hui, tous les pays et entreprises ayant un certain pouvoir financier développent leurs propres modèles de langage.
Cette situation de "bataille des cent modèles" découle du papier sur l'algorithme Transformer publié par Google en 2017. Le Transformer a résolu de nombreux problèmes de traitement du langage naturel, transformant les grands modèles d'une recherche théorique en un pur problème d'ingénierie. Tant qu'il y a suffisamment de puissance de calcul et de données, presque n'importe quelle équipe peut entraîner un grand modèle.
Cependant, développer de grands modèles ne signifie pas nécessairement pouvoir réussir à l'ère de l'IA. Bien que Llama de Meta ne soit pas aussi bien classé que Falcon, sa communauté de développeurs active en fait toujours un indicateur pour les LLM open source. En termes de performance, la plupart des LLM présentent encore un écart significatif par rapport à GPT-4.
La principale force concurrentielle des grands modèles réside dans la construction d'écosystèmes ou dans des capacités de raisonnement pures, et pas seulement dans la taille des paramètres. De plus, le coût élevé de la puissance de calcul constitue également un obstacle au développement de l'industrie. Selon les estimations, les investissements des entreprises technologiques mondiales dans l'infrastructure des grands modèles dépassent largement leurs revenus.
Actuellement, à part quelques exceptions, la plupart des entreprises d'IA n'ont pas encore trouvé de modèle de rentabilité. Même des géants du logiciel comme Microsoft et Adobe sont confrontés à des difficultés en matière de tarification de leurs produits d'IA.
Avec l'intensification de la concurrence homogène et l'augmentation des modèles open source, les fournisseurs de grands modèles pourraient faire face à une pression plus forte. À l'avenir, la valeur de l'IA pourrait se manifester davantage dans des cas d'utilisation spécifiques, plutôt que dans le modèle lui-même.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
15 J'aime
Récompense
15
5
Partager
Commentaire
0/400
ForeverBuyingDips
· Il y a 11h
buy the dip, on est même dans le cercle de l'IA, ouin ouin
Voir l'originalRépondre0
MidnightTrader
· Il y a 11h
Jouer avec de grands modèles suffit. Celui qui dépense de l'argent gagne.
Voir l'originalRépondre0
bridge_anxiety
· Il y a 11h
C'est juste une question de jongler avec l'argent.
Voir l'originalRépondre0
FlashLoanLarry
· Il y a 11h
mdr une autre course de destruction de capital... les métriques d'efficacité vont être essentielles ici pas de mensonge
Voir l'originalRépondre0
VirtualRichDream
· Il y a 12h
L'argent gagné avec le trading de l'IA est vraiment facile à gagner.
Compétition des grands modèles d'IA : défi d'ingénierie ou problème commercial
Compétition des grands modèles d'IA : problème d'ingénierie ou défi scientifique ?
Le mois dernier, une "bataille des animaux" a éclaté dans le domaine de l'IA.
D'un côté, le modèle Llama( d'Meta, connu sous le nom de "lamas d'Amérique" et apprécié des développeurs pour sa nature open source. De l'autre côté, il y a le modèle Falcon), développé par l'Institut de recherche sur l'innovation technologique des Émirats. Les deux modèles se sont successivement classés en tête du classement des LLM open source.
Il est intéressant de noter que le gouvernement des Émirats arabes unis a déclaré que sa participation à la compétition d'IA vise à "défaire les acteurs clés". Aujourd'hui, tous les pays et entreprises ayant un certain pouvoir financier développent leurs propres modèles de langage.
Cette situation de "bataille des cent modèles" découle du papier sur l'algorithme Transformer publié par Google en 2017. Le Transformer a résolu de nombreux problèmes de traitement du langage naturel, transformant les grands modèles d'une recherche théorique en un pur problème d'ingénierie. Tant qu'il y a suffisamment de puissance de calcul et de données, presque n'importe quelle équipe peut entraîner un grand modèle.
Cependant, développer de grands modèles ne signifie pas nécessairement pouvoir réussir à l'ère de l'IA. Bien que Llama de Meta ne soit pas aussi bien classé que Falcon, sa communauté de développeurs active en fait toujours un indicateur pour les LLM open source. En termes de performance, la plupart des LLM présentent encore un écart significatif par rapport à GPT-4.
La principale force concurrentielle des grands modèles réside dans la construction d'écosystèmes ou dans des capacités de raisonnement pures, et pas seulement dans la taille des paramètres. De plus, le coût élevé de la puissance de calcul constitue également un obstacle au développement de l'industrie. Selon les estimations, les investissements des entreprises technologiques mondiales dans l'infrastructure des grands modèles dépassent largement leurs revenus.
Actuellement, à part quelques exceptions, la plupart des entreprises d'IA n'ont pas encore trouvé de modèle de rentabilité. Même des géants du logiciel comme Microsoft et Adobe sont confrontés à des difficultés en matière de tarification de leurs produits d'IA.
Avec l'intensification de la concurrence homogène et l'augmentation des modèles open source, les fournisseurs de grands modèles pourraient faire face à une pression plus forte. À l'avenir, la valeur de l'IA pourrait se manifester davantage dans des cas d'utilisation spécifiques, plutôt que dans le modèle lui-même.