كيف يتعايش النماذج الذكية الكبيرة و Web3؟ |All Creation Camp AI+Crypto Studio

متوسط1/31/2024, 3:56:39 PM
يشرح هذا المقال كيف يمكن لتكنولوجيا البلوكشين حل العقبات الحالية في تدريب النماذج الذكية الكبيرة، بما في ذلك: توازن كمية البيانات والخصوصية، التكلفة والطاقة الحسابية، ومن ثم يستكشف العلاقة التفاعلية بين الذكاء الاصطناعي والاجتماعي.

باعتبارها التكنولوجيا الفائقة الأسرع نموا في تاريخ البشرية ، جذبت النماذج الكبيرة انتباه الجميع. Web3 ، الذي كان مجرد شيء من الأمس ، يتم تحديه قانونيا بشكل متزايد. ولكن كتقنيات مختلفة تماما ، لا يوجد بديل بين الاثنين. سيناقش الشخص المسؤول عن "الذكاء الاصطناعي + Crypto Studio" في جزيرة كل الأشياء - السيد Tian Hongfei ، معك المشكلات التي تواجهها في تطوير النماذج الكبيرة وكيف تلتزم الشركات في مجال web3 بحل هذه المشكلات.

مشاكل صناعة النموذج الكبير وكيفية دمج Web3 لحلها

كما نعلم جميعًا، دخلت صناعة الإنترنت مرحلة الاحتكار بعد عام 2015، وقامت الدول حول العالم بإجراء استعراضات مكافحة الاحتكار لشركات البلاطفورم. ظهور النماذج الكبيرة يزيد من موقف الاحتكار للأوليغوبوليات. تتضمن النماذج الكبيرة الخوارزميات والطاقة الحسابية والبيانات:

  • في مجال الخوارزميات، على الرغم من وجود درجة من الاحتكار، يمكن أن تظل الخوارزميات مفتوحة إلى حد كبير بسبب قوى المصدر المفتوح والتنافس بين الجامعات البحثية، فضلاً عن عدم ثقة الناس في الأوليجاركية؛
  • من حيث قوة الحوسبة، بسبب التكلفة العالية لتدريب النماذج الكبيرة، يمكن تحمل قوة الحوسبة فقط من قبل الشركات الكبيرة، لذلك يؤدي هذا في الأساس إلى أن يكون إنتاج الخوارزميات تحت سيطرة تامة من الشركات الكبيرة؛
  • من حيث البيانات، بينما يعتمد تدريب النماذج الكبيرة على البيانات العامة، ستنفد البيانات العامة قريبًا بناءً على نمو معلمات النماذج الكبيرة، وبالتالي يعتمد النمو المستمر للنماذج الكبيرة على البيانات الخاصة. بينما تكون الكمية المطلقة للبيانات التي تمتلكها عدد كبير من الشركات الصغيرة هائلة، فإن استخدامها بمعزل يعتبر صعبًا، لذا لا تزال الشركات الكبيرة تحتفظ بحصة سوقية في البيانات.

نتيجة لذلك، تكون عصر النموذج الكبير أكثر تحكماً مركزياً من أي وقت مضى، ومن المحتمل أن يتم التحكم في عالم المستقبل بواسطة مجموعة صغيرة أو حتى جهاز كمبيوتر واحد. (حتى في عالم الويب3 اللامركزي، سيتم تشغيل نهاية اللعبة المقترحة لإيثريوم من قبل جهاز ضخم خارج الكتلة.)

بالإضافة إلى ذلك، فإن شركة OpenAI التي طورت ChatGPT لديها فقط أكثر من 20 موظفًا أساسيًا. بسبب أسباب مختلفة، لم يتم توفير خوارزمية ChatGPT حتى الآن. لقد تم تغيير الطبيعة الأصلية للمؤسسة غير الربحية إلى ربح محدود. مع تغير التطبيقات المختلفة التي تعتمد على ChatGPT حياة الإنسان، ستكون بعض التعديلات على نموذج ChatGPT لها تأثير كبير على البشر. بالمقارنة مع مبدأ جوجل عدم فعل الشر، فإن ChatGPT له تأثير أعمق على الناس.

لذلك، ستصبح مصداقية الحوسبة للنموذج مسألة مهمة. على الرغم من أن OpenAI يمكن أن تعمل كمؤسسة غير ربحية، إلا أن السيطرة على السلطة من قبل عدد قليل من الأشخاص ستكون لها العديد من العواقب السلبية. (بالمقابل، على الرغم من أن نهاية إثريوم المقترحة من قبل فيتاليك يتم إنتاجها بواسطة آلة، إلا أنها ستحتفظ بالشفافية من خلال التحقق السهل جدًا من قبل الجمهور.)

في الوقت نفسه، لا تزال هناك مشاكل في صناعة النماذج الكبيرة: نقص في الطاقة الحسابية، وتقريباً انتهاء البيانات التدريبية المتاحة، ومشاركة النماذج. ووفقًا للإحصاءات، قبل عام 2021، كانت المشكلة في صناعة الذكاء الاصطناعي هي نقص البيانات، وجميع شركات التعلم العميق تبحث عن بيانات في الصناعات الرأسية؛ وبعد النماذج الكبيرة، يصبح نقص القدرة الحسابية عائقًا.

يتم تقسيم تطوير النموذج الكبير إلى عدة مراحل: جمع البيانات، معالجة البيانات، تدريب النموذج، ضبط النموذج، واستعلام نشر النموذج. من هذه المراحل، دعونا نصف بإيجاز مساهمة التكنولوجيا المجال العملات الرقمية في النماذج الكبيرة وكيفية مكافحة الضرر الناجم عن التركيز الزائد في النماذج الكبيرة.

  • من حيث البيانات، نظرًا لأن البيانات العامة ستنفد بعد عام 2030، فإنه من الضروري استخدام كميات أكبر وأكثر قيمة من البيانات الخاصة مع حماية الخصوصية من خلال تكنولوجيا البلوكشين؛
  • من حيث تعليق البيانات ، يمكن استخدام الرموز لتحفيز التعليق والتحقق على نطاق أوسع للبيانات؛
  • في مرحلة تدريب النموذج، يتم تحقيق مشاركة قوة الحساب من خلال مشاركة النموذج والتدريب التعاوني؛
  • أثناء مرحلة ضبط النموذج، يمكن تحفيز مشاركة المجتمع من خلال الرموز المميزة؛
  • في مرحلة استعلام المستخدم وحساب التفكير، يمكن للبلوكشين حماية خصوصية بيانات المستخدم.

على وجه الخصوص:

1) القدرة الحاسوبية النادرة

قوة الحوسبة هي عامل إنتاج ضروري للنماذج الكبيرة، وهي العامل الأكثر تكلفة اليوم، بحيث أن الشركات الناشئة التي رفعت للتو الأموال يجب أن تحول 80% من أموالها إلى NVIDIA لشراء وحدات GPU. الشركات التي تنتج نماذجها الكبيرة الخاصة يجب أن تنفق ما لا يقل عن 50 مليون دولار لبناء مراكز بيانات خاصة بها، في حين يجب على الشركات الناشئة الصغيرة شراء خدمات الحوسبة السحابية المكلفة.

ومع ذلك، فإن شعبية النماذج الكبيرة على المدى القصير والاستهلاك الهائل لموارد الحوسبة من قبل النماذج الكبيرة نفسها قد تجاوز بشكل كبير قدرة توريد NVIDIA. وفقًا للإحصاءات، فإن الطلب على قدرة الحوسبة للنماذج الكبيرة يتضاعف كل بضعة أشهر. بين عامي 2012 و 2018، زاد الطلب على قدرة الحوسبة بمعدل 300،000 مرة، وزادت تكلفة حسابات النماذج الكبيرة بمعدل 31 مرة كل عام.

بالنسبة لشركات الإنترنت الصينية، عليها أيضًا مواجهة الحظر التجاري الأمريكي على وحدات معالجة الرسومات عالية المستوى. يمكن القول أن تكلفة التدريب الضخمة هي السبب الأساسي الذي يجعل تقنية النماذج الكبيرة تكون تحت سيطرة قليل من الأشخاص.

إذا كيف يمكن حل مشكلة قوة الحوسبة للنماذج الكبيرة من خلال تقنية البلوكشين؟

بالنظر إلى إنتاج النماذج الكبيرة، يتم تقسيمها بشكل رئيسي إلى تدريب النموذج الكبير، وضبط الدقة، وحساب استعلام المستخدم. على الرغم من أن النماذج الكبيرة تعتبر مكلفة للتدريب، إلا أن إصداراً من النموذج الكبير يحتاج إلى إنشاء مرة واحدة فقط. في معظم الأحيان، لمستخدمي خدمة النموذج الكبير، يتطلب فقط الحساب الاستنتاجي. وفقًا لإحصاءات AWS، يتم تأكيد ذلك أيضًا، حيث يتم استهلاك 80% من قوة الحساب في حسابات الاستنتاج.

على الرغم من أن تدريب النماذج الكبيرة يتطلب قدرات اتصال عالية السرعة بين وحدات المعالجة الرسومية، إلا أنه لا يمكن إتمامه على الشبكة (ما لم تختر تبادل تمديد الوقت مقابل تكلفة منخفضة). ومع ذلك، يمكن إجراء حسابات الاستنتاج على وحدة معالجة رسومية واحدة. يعتمد ضبط الدقة على النموذج الكبير الذي تم إنشاؤه وإعطاء بيانات مهنية، لذا يتطلب موارد حسابية أقل بكثير من تدريب النموذج الكبير.

عندما يتعلق الأمر بعرض الرسومات ، فمن الواضح أن وحدات معالجة الرسومات الاستهلاكية تعمل بشكل أفضل من وحدات معالجة الرسومات للمؤسسات وتكون خاملة في معظم الأوقات. منذ أن أطلقت جامعة كاليفورنيا ، بيركلي SETI للبحث عن الأجانب في عام 1999 ، وأصبحت الحوسبة الشبكية شائعة في عام 2000 ، كانت هناك بعض البنى التقنية التي تستخدم موارد الحوسبة الخاملة للتعاون لإكمال بعض مهام الحوسبة الضخمة. قبل ظهور blockchain ، كان هذا التعاون يركز عادة على المهام العلمية ويعتمد على الحماس ومشاركة الرفاهية العامة للمشاركين ، مما يحد من نطاق التأثير. الآن باستخدام تقنية blockchain ، يمكن تحفيز مجموعة واسعة من التطبيقات من خلال الرموز المميزة.

مثل مشروع الحوسبة السحابية المركزية Akash، تم إنشاء شبكة عامة للحوسبة، ويمكن للمستخدمين نشر نماذج التعلم الآلي لحسابات الاستدلال وتقديم الصور. هناك أيضًا مشاريع ذكاء اصطناعي معتمدة على التقنية السلسلة مثل Bittensor، Modulus Lab، Giza، و ChainML، والتي تهدف جميعها إلى حسابات استدلال الاستعلام.

بروتوكول الحوسبة الذكية في سلسلة الكتل جينسين ومنصة الذكاء الاصطناعي الإبداعي مفتوحة المصدر تعملان على بناء شبكة حوسبة لامركزية تخدم تدريب النماذج الكبيرة.

التحدي: بالنسبة لشبكات الحوسبة اللامركزية، تكمن الصعوبة ليس فقط في الشبكات الضعيفة وغير الموثوقة، وعدم القدرة على مزامنة الحالات الحسابية، التعامل مع أنواع متعددة من بيئات الحوسبة من نوع GPU، ولكن أيضًا التعامل مع الحوافز الاقتصادية، وغش المشارك، وإثبات عبء العمل، والأمان، وحماية الخصوصية، ومكافحة هجمات البريد المزعج.

2) بيانات نادرة وتصحيح البيانات

تتطلب الخوارزمية الأساسية للنموذج الكبير، تعلم التعزيز من تغذية ردود الفعل البشرية (RLHF)، مشاركة البشر في ضبط التدريب لتصحيح الأخطاء والقضاء على التحيز والمعلومات الضارة. استخدمت OpenAI RLHF لضبط GPT3 لإنشاء ChatGPT. خلال هذه العملية، وجدت OpenAI خبراء من مجموعة Facebook ودفعت لعمال كينيين 2 دولار في الساعة. يتطلب التدريب على الأمثلية في كثير من الأحيان مشاركة خبراء بشر على البيانات من المجالات المتخصصة، ويمكن دمج تنفيذه بشكل كامل مع طرق لتحفيز مشاركة المجتمع من خلال الرموز.

تستخدم صناعة شبكات البنية التحتية المادية اللامركزية (DePINs) الرموز المميزة لتشجيع الأشخاص على مشاركة البيانات الحقيقية في الوقت الفعلي من العالم المادي وفقا لأجهزة الاستشعار لتدريب النماذج المختلفة. بما في ذلك: يجمع React بيانات استخدام الطاقة ، ويجمع DIMO بيانات قيادة السيارة ، ويجمع WeatherXM بيانات الطقس ، ويجمع Hivemapper بيانات الخرائط من خلال حوافز رمزية لتشجيع الأشخاص على تمييز إشارات المرور ومساعدة خوارزمية التعلم الآلي RLHF على تحسين الدقة.

في الوقت نفسه، مع زيادة معلمات النماذج الكبيرة، ستنفد البيانات العامة الحالية بحلول عام 2030، وسيتعين الاعتماد المستمر للنماذج الكبيرة على البيانات الخاصة. كمية البيانات الخاصة 10 مرات أكثر من البيانات العامة، لكنها متناثرة في أيدي الشركات والأفراد، وتتمتع بطبيعة خاصة وسرية، مما يجعل استغلالها صعبًا. ينشأ مأزق مزدوج. من جهة، تحتاج النموذج الكبير إلى البيانات، ولكن على الرغم من أن الطرف الذي يمتلك البيانات يحتاج إلى النموذج الكبير، إلا أنه لا يرغب في تسليم البيانات إلى النموذج الكبير. يمكن أيضًا حل هذه المشكلة المزدوجة من خلال التكنولوجيا في مجال البلوكشين.

بالنسبة لنماذج الاستدلال مفتوحة المصدر، لأنها تتطلب موارد حوسبة أقل، يمكن تنزيل النموذج إلى قطاع البيانات للتنفيذ؛ بالنسبة للنماذج غير العامة أو النماذج الكبيرة، يحتاج البيانات إلى أن تتعرض لعملية تجفيف ويرفع إلى نهاية النموذج. تشمل طرق التجفيف بيانات اصطناعية وبراهين المعرفة الصفرية.

سواء تم تنزيل النموذج إلى جانب البيانات أو تم تحميل البيانات إلى جانب النموذج، فإن مشكلة السلطة تحتاج إلى حل لمنع الغش في النموذج أو البيانات.

التحدي: على الرغم من أن حوافز الرموز في Web3 يمكن أن تساعد في حل هذه المشكلة، إلا أن مشكلة الغش تحتاج إلى حل.

3) التعاون النموذجي

في مجتمع Civitai، أكبر منصة لمشاركة نماذج الرسم الفني الذكي في العالم، يشارك الناس النماذج ويمكنهم نسخ نموذج بسهولة وتعديله لتوليد نموذج يلبي متطلباتهم الخاصة.

بيتنسور، مشروع سلسلة كتل ثنائي الاتفاق ومبتدئ في الذكاء الاصطناعي مفتوح المصدر، قام بتصميم مجموعة من النماذج اللامركزية المحفزة بالرموز. بناءً على آلية التعاون لمزيج من الخبراء، ينتج بشكل مشترك نموذجًا لحل المشكلات ويدعم التبخير المعرفي، الذي يمكن مشاركته بين النماذج. معلومات، تسريع التدريب، الذي يوفر للعديد من الشركات الناشئة الفرصة للمشاركة في النماذج الكبيرة.

كشبكة موحدة لخدمات خارج السلسلة مثل التشغيل التلقائي والمهتمون والذكاء الاصطناعي المشترك، صممت Autonolas إطار تعاوني للوكلاء للوصول إلى توافق من خلال Tendermint.

التحدي: تدريب العديد من النماذج ما زال يتطلب الكثير من التواصل، وموثوقية وكفاءة الوقت للتدريب الموزع ما زالت عقبات كبيرة؛

نماذج كبيرة وابتكار في الويب 3

بالتزامن مع المناقشة أعلاه حول كيف يمكن استخدام Web3 لحل بعض المشاكل في صناعة النمذجة الكبيرة. ستؤدي مزيج هذين القوتين المهمتين إلى بعض التطبيقات المبتكرة.

1) استخدام ChatGPT لكتابة العقود الذكية

مؤخرًا، قام فنان NFT باستخدام الإشارات لتشغيل ChatGPT بدون أي معرفة بالبرمجة لإصدار عقده الذكي الخاص وإصدار رمز Turboner. استخدم الفنان YouTube لتسجيل عملية إنشاءه لمدة أسبوع، ملهمًا الجميع لاستخدام ChatGPT. المشاركة في إنشاء العقود الذكية.

2) مجال العملات الرقمية يمكن أن يمنح الإدارة الذكية القوة

أدى تطوير النماذج الكبيرة إلى تحسين ذكاء المساعدين الأذكياء بشكل كبير ، وإلى جانب المدفوعات المشفرة ، سيتمكن المساعدون الأذكياء من تنسيق المزيد من الموارد والتعاون في المزيد من المهام في سوق المساعد الذكي. يوضح AutoGPT الاعتماد على بطاقة الائتمان التي يوفرها المستخدم ، ويمكنه مساعدة المستخدم على أتمتة شراء موارد الحوسبة السحابية وحجز الرحلات الجوية ، ولكنه مقيد بتسجيل الدخول الآلي أو مصادقة الأمان الأخرى ، وقدرات AutoGPT محدودة للغاية من خلال تسجيل الدخول التلقائي أو مصادقة الأمان الأخرى. يتضمن تصميم نظام Multi Agent System (MAS) ، بما في ذلك بروتوكول Contract Net ، تعاون العديد من المساعدين الأذكياء في سوق مفتوح ، وإذا كان مدعوما بالرموز المميزة ، فإن هذا التعاون سوف يخترق التعاون المحدود القائم على الثقة ويصبح تعاونا واسع النطاق يعتمد على اقتصاد السوق ، تماما كما ينتقل المجتمع البشري من مجتمع بدائي إلى مجتمع نقدي.

3) zkML (تعلم الآلة بدون معرفة (Zero Knowledge Machine Learning

ينقسم تطبيق تقنية zkp (دليل المعرفة الصفرية) في blockchain إلى فئتين. الأول هو حل أداء blockchain عن طريق نقل متطلبات الحوسبة إلى خارج السلسلة ، ثم إلى شهادة على السلسلة من خلال zkp ؛ الفئة الثانية تستخدم لحماية خصوصية المعاملات. تشمل تطبيقات zkp في النماذج الكبيرة حسابات النموذج الجديرة بالثقة (لإثبات اتساق وأصالة حسابات النموذج) وحسابات الخصوصية لبيانات التدريب. في بيئة لامركزية ، يحتاج مزود خدمة النموذج إلى أن يثبت للعملاء أن النموذج المباع هو النموذج الموعود للعميل ، دون قطع الزوايا ؛ بالنسبة لشركاء بيانات التدريب ، يحتاجون إلى المشاركة في التدريب أو استخدام النموذج على أساس حماية خصوصيتهم. . على الرغم من أن zkp يقدم بعض الاحتمالات ، إلا أنه لا يزال هناك العديد من التحديات ، ولا تزال الحلول مثل الحوسبة المتجانسة وحوسبة الخصوصية الموحدة غير ناضجة.

الحل مبني على تقنية BEC (Blockchain Edge Client)

بالإضافة إلى المدارس المذكورة أعلاه، هناك مدرسة أخرى لم تحظَ بالاهتمام الواسع نظرًا لعدم وجود حوافز رمزية واستخدام تطبيقات سلسلة الكتل الحدية.

يحتوي التركيب المعتمد على BEC على العديد من التشابهات مع مفاهيم Web5 المذكورة من قبل جاك دورسي وSolid من قبل تيم بيرنرز لي في العديد من الجوانب.

يعتقدون جميعًا:

  • لكل شخص جهاز تحكم حافة مقابل؛
  • يجب معالجة الحوسبة والتخزين في معظم سيناريوهات التطبيق عند الحواف؛
  • يتم إكمال التعاون بين العقد الفردية من خلال التسلسل الزمني للكتل؛
  • يتم الاتصال بين العقد من خلال P2P؛
  • يمكن للأفراد السيطرة الكاملة على عقدة الشبكة الخاصة بهم بمفردهم أو الوثوق بالأشخاص الموثوق بهم لإدارة العقد (المعروفة أيضًا باسم خوادم الإرسال في بعض السيناريوهات)؛
  • تحقيق أقصى درجات اللامركزية؛

عندما تقوم هذه العقدة المقابلة لكل شخص ويتم التحكم فيها بواسطة الفرد بتخزين البيانات الشخصية وتحميل النموذج الكبير ، يمكن تدريب وكيل ذكي شخصي مخصص بالكامل ومحمي بالخصوصية بنسبة 100٪ (وكيل). قارن الشريك المؤسس الصيني لشركة SIG الدكتور Gong Ting بشكل رومانسي العقدة الشخصية المستقبلية بالسحابة الشخصية فوق رأس أولاف في "Frozen" التي تتبعه دائما.

بهذه الطريقة، لن يكون الأفاتار في الميتافيرس بعد الآن صورة تتحكم فيها لوحة المفاتيح، بل عميل له روح. يمكنه دراسة الأخبار عبر الإنترنت، ومعالجة الرسائل الإلكترونية، وحتى الرد تلقائيًا على رسائل الدردشة الاجتماعية الخاصة بك نيابة عنا على مدار 24 ساعة في اليوم. (انتباه، صديقات المزعجات، قد تحتاجن إلى طريقة لاكتشاف ما إذا كان صديقك يستخدم عميلًا للتعامل معك في المستقبل). عندما يحتاج عميلك إلى مهارات جديدة، تمامًا مثل تثبيت تطبيق على هاتف محمول، يمكنك تثبيت تطبيق جديد في عقدك.

ملخص

تاريخيًا، مع تطبيق المنصات بشكل مستمر على تطوير الإنترنت، على الرغم من أن الوقت اللازم لولادة شركات اليونيكورن أصبح أقصر وأقصر، إلا أنه أصبح يضر بشكل متزايد بتطوير الشركات الناشئة.

من خلال منصة توزيع المحتوى الفعالة التي توفرها غوغل وفيسبوك، تم الاستحواذ على يوتيوب، الذي وُلد في عام 2005، من قبل غوغل مقابل 1.6 مليار دولار أمريكي بعد عام واحد فقط.

بالإضافة إلى منصة توزيع التطبيقات الفعالة لمتجر تطبيقات Apple، تأسست Instagram في عام 2012 من قبل أكثر من 10 أشخاص فقط واستحوذت عليها Facebook مقابل مليار دولار أمريكي في عام 2012.

بفضل دعم النموذج الكبير ChatGPT، حققت شركة Midjourney التي تضم 11 شخصًا فقط 100 مليون دولار أمريكي سنويًا. وتقدر قيمة OpenAI، التي لا تزيد عن 100 شخص، بأكثر من 20 مليار دولار أمريكي.

شركات منصات الإنترنت تصبح أقوى وأقوى، وظهور النماذج الكبيرة لم يغير النمط الحالي لاحتكار الإنترنت من قبل الشركات الكبيرة. العناصر الثلاثة للنماذج الكبيرة، الخوارزميات والبيانات وقوة الحساب ما زالت تحت احتكار الشركات الكبيرة. الشركات الناشئة ليس لديها القدرة على الابتكار في النماذج الكبيرة وليس لديها القوة المالية لتدريب النماذج الكبيرة. يمكنهم فقط التركيز على تطبيق النماذج الكبيرة في المجالات العمودية. على الرغم من أن النماذج الكبيرة تبدو كما لو كانت تعزز انتشار المعرفة، إلا أن القوة الحقيقية تكون تحت سيطرة لا تزيد عن 100 شخص في العالم الذين لديهم القدرة على إنتاج النماذج.

إذا اخترقت النماذج الكبيرة جميع جوانب حياة الناس في المستقبل، وسألت ChatGPT عن نظامك الغذائي اليومي، وصحتك، ورسائل البريد الإلكتروني الخاصة بعملك، ورسائل محاميك، فإنه في النظرية، الذين يتقنون النماذج الكبيرة يحتاجون فقط إلى تغيير بعض المعلمات سراً. يمكن أن يؤثر ذلك بشكل كبير على حياة عدد لا يحصى من الناس. قد يتم حل بعض مشكلات البطالة الناتجة عن النموذج الكبير من خلال الدخل الأساسي العالمي أو العملة العالمية، ولكن عواقب الشر المحتملة الناجمة عن تحكم النموذج الكبير بواسطة عدد قليل من الأشخاص أكثر خطورة. هذا هو القصد الأصلي لـ OpenAI. على الرغم من أن OpenAI تحل مشكلات مدفوعة بالربح من خلال طرق غير ربحية، كيف تحل مشاكل مدفوعة بالسلطة؟ من الواضح أن النماذج الكبيرة تدرب سريعاً نماذج المعرفة باستخدام المعرفة المتراكمة عبر عقود من الزمن من قبل البشر والمشتركة بحرية على الإنترنت، ولكن يتحكم في هذا النموذج عدد قليل جداً من الأشخاص.

  1. لذلك ، هناك تعارض كبير في القيم بين النماذج الكبيرة و blockchain. يحتاج ممارسو Blockchain إلى المشاركة في ريادة الأعمال ذات النماذج الكبيرة واستخدام تقنية blockchain لحل مشكلات النماذج الكبيرة. إذا كانت الكمية الهائلة من البيانات المتاحة مجانا على الإنترنت هي المعرفة العامة للبشرية ، فإن النماذج الكبيرة التي تم إنشاؤها بناء على هذه البيانات يجب أن تنتمي إلى البشرية جمعاء. تماما كما بدأت OpenAI مؤخرا في الدفع مقابل قواعد بيانات الأدبيات ، يحتاج OpenAI إلى الدفع مقابل المدونات الشخصية التي نكرس أنفسنا لها أنت وأنا.

تنصل:

  1. تم نقل هذه المقالة من [ ThreeDAO، جزيرة كل الأشياء]. جميع حقوق الطبع والنشر تنتمي إلى الكاتب الأصلي [36Cإذا كانت هناك اعتراضات على هذه الإعادة طبعًا، يرجى التواصل معبوابة تعلمالفريق، وسيتولون على التعامل معها على الفور.
  2. تنصل المسؤولية: الآراء والآراء المعبر عنها في هذه المقالة هي فقط تلك للكاتب ولا تشكل أي نصيحة استثمارية.
  3. يتم إجراء ترجمة المقال إلى لغات أخرى من قبل فريق Gate Learn. ما لم يرد غير ذلك، فإن نسخ أو توزيع أو نسخ المقالات المترجمة ممنوع.

كيف يتعايش النماذج الذكية الكبيرة و Web3؟ |All Creation Camp AI+Crypto Studio

متوسط1/31/2024, 3:56:39 PM
يشرح هذا المقال كيف يمكن لتكنولوجيا البلوكشين حل العقبات الحالية في تدريب النماذج الذكية الكبيرة، بما في ذلك: توازن كمية البيانات والخصوصية، التكلفة والطاقة الحسابية، ومن ثم يستكشف العلاقة التفاعلية بين الذكاء الاصطناعي والاجتماعي.

باعتبارها التكنولوجيا الفائقة الأسرع نموا في تاريخ البشرية ، جذبت النماذج الكبيرة انتباه الجميع. Web3 ، الذي كان مجرد شيء من الأمس ، يتم تحديه قانونيا بشكل متزايد. ولكن كتقنيات مختلفة تماما ، لا يوجد بديل بين الاثنين. سيناقش الشخص المسؤول عن "الذكاء الاصطناعي + Crypto Studio" في جزيرة كل الأشياء - السيد Tian Hongfei ، معك المشكلات التي تواجهها في تطوير النماذج الكبيرة وكيف تلتزم الشركات في مجال web3 بحل هذه المشكلات.

مشاكل صناعة النموذج الكبير وكيفية دمج Web3 لحلها

كما نعلم جميعًا، دخلت صناعة الإنترنت مرحلة الاحتكار بعد عام 2015، وقامت الدول حول العالم بإجراء استعراضات مكافحة الاحتكار لشركات البلاطفورم. ظهور النماذج الكبيرة يزيد من موقف الاحتكار للأوليغوبوليات. تتضمن النماذج الكبيرة الخوارزميات والطاقة الحسابية والبيانات:

  • في مجال الخوارزميات، على الرغم من وجود درجة من الاحتكار، يمكن أن تظل الخوارزميات مفتوحة إلى حد كبير بسبب قوى المصدر المفتوح والتنافس بين الجامعات البحثية، فضلاً عن عدم ثقة الناس في الأوليجاركية؛
  • من حيث قوة الحوسبة، بسبب التكلفة العالية لتدريب النماذج الكبيرة، يمكن تحمل قوة الحوسبة فقط من قبل الشركات الكبيرة، لذلك يؤدي هذا في الأساس إلى أن يكون إنتاج الخوارزميات تحت سيطرة تامة من الشركات الكبيرة؛
  • من حيث البيانات، بينما يعتمد تدريب النماذج الكبيرة على البيانات العامة، ستنفد البيانات العامة قريبًا بناءً على نمو معلمات النماذج الكبيرة، وبالتالي يعتمد النمو المستمر للنماذج الكبيرة على البيانات الخاصة. بينما تكون الكمية المطلقة للبيانات التي تمتلكها عدد كبير من الشركات الصغيرة هائلة، فإن استخدامها بمعزل يعتبر صعبًا، لذا لا تزال الشركات الكبيرة تحتفظ بحصة سوقية في البيانات.

نتيجة لذلك، تكون عصر النموذج الكبير أكثر تحكماً مركزياً من أي وقت مضى، ومن المحتمل أن يتم التحكم في عالم المستقبل بواسطة مجموعة صغيرة أو حتى جهاز كمبيوتر واحد. (حتى في عالم الويب3 اللامركزي، سيتم تشغيل نهاية اللعبة المقترحة لإيثريوم من قبل جهاز ضخم خارج الكتلة.)

بالإضافة إلى ذلك، فإن شركة OpenAI التي طورت ChatGPT لديها فقط أكثر من 20 موظفًا أساسيًا. بسبب أسباب مختلفة، لم يتم توفير خوارزمية ChatGPT حتى الآن. لقد تم تغيير الطبيعة الأصلية للمؤسسة غير الربحية إلى ربح محدود. مع تغير التطبيقات المختلفة التي تعتمد على ChatGPT حياة الإنسان، ستكون بعض التعديلات على نموذج ChatGPT لها تأثير كبير على البشر. بالمقارنة مع مبدأ جوجل عدم فعل الشر، فإن ChatGPT له تأثير أعمق على الناس.

لذلك، ستصبح مصداقية الحوسبة للنموذج مسألة مهمة. على الرغم من أن OpenAI يمكن أن تعمل كمؤسسة غير ربحية، إلا أن السيطرة على السلطة من قبل عدد قليل من الأشخاص ستكون لها العديد من العواقب السلبية. (بالمقابل، على الرغم من أن نهاية إثريوم المقترحة من قبل فيتاليك يتم إنتاجها بواسطة آلة، إلا أنها ستحتفظ بالشفافية من خلال التحقق السهل جدًا من قبل الجمهور.)

في الوقت نفسه، لا تزال هناك مشاكل في صناعة النماذج الكبيرة: نقص في الطاقة الحسابية، وتقريباً انتهاء البيانات التدريبية المتاحة، ومشاركة النماذج. ووفقًا للإحصاءات، قبل عام 2021، كانت المشكلة في صناعة الذكاء الاصطناعي هي نقص البيانات، وجميع شركات التعلم العميق تبحث عن بيانات في الصناعات الرأسية؛ وبعد النماذج الكبيرة، يصبح نقص القدرة الحسابية عائقًا.

يتم تقسيم تطوير النموذج الكبير إلى عدة مراحل: جمع البيانات، معالجة البيانات، تدريب النموذج، ضبط النموذج، واستعلام نشر النموذج. من هذه المراحل، دعونا نصف بإيجاز مساهمة التكنولوجيا المجال العملات الرقمية في النماذج الكبيرة وكيفية مكافحة الضرر الناجم عن التركيز الزائد في النماذج الكبيرة.

  • من حيث البيانات، نظرًا لأن البيانات العامة ستنفد بعد عام 2030، فإنه من الضروري استخدام كميات أكبر وأكثر قيمة من البيانات الخاصة مع حماية الخصوصية من خلال تكنولوجيا البلوكشين؛
  • من حيث تعليق البيانات ، يمكن استخدام الرموز لتحفيز التعليق والتحقق على نطاق أوسع للبيانات؛
  • في مرحلة تدريب النموذج، يتم تحقيق مشاركة قوة الحساب من خلال مشاركة النموذج والتدريب التعاوني؛
  • أثناء مرحلة ضبط النموذج، يمكن تحفيز مشاركة المجتمع من خلال الرموز المميزة؛
  • في مرحلة استعلام المستخدم وحساب التفكير، يمكن للبلوكشين حماية خصوصية بيانات المستخدم.

على وجه الخصوص:

1) القدرة الحاسوبية النادرة

قوة الحوسبة هي عامل إنتاج ضروري للنماذج الكبيرة، وهي العامل الأكثر تكلفة اليوم، بحيث أن الشركات الناشئة التي رفعت للتو الأموال يجب أن تحول 80% من أموالها إلى NVIDIA لشراء وحدات GPU. الشركات التي تنتج نماذجها الكبيرة الخاصة يجب أن تنفق ما لا يقل عن 50 مليون دولار لبناء مراكز بيانات خاصة بها، في حين يجب على الشركات الناشئة الصغيرة شراء خدمات الحوسبة السحابية المكلفة.

ومع ذلك، فإن شعبية النماذج الكبيرة على المدى القصير والاستهلاك الهائل لموارد الحوسبة من قبل النماذج الكبيرة نفسها قد تجاوز بشكل كبير قدرة توريد NVIDIA. وفقًا للإحصاءات، فإن الطلب على قدرة الحوسبة للنماذج الكبيرة يتضاعف كل بضعة أشهر. بين عامي 2012 و 2018، زاد الطلب على قدرة الحوسبة بمعدل 300،000 مرة، وزادت تكلفة حسابات النماذج الكبيرة بمعدل 31 مرة كل عام.

بالنسبة لشركات الإنترنت الصينية، عليها أيضًا مواجهة الحظر التجاري الأمريكي على وحدات معالجة الرسومات عالية المستوى. يمكن القول أن تكلفة التدريب الضخمة هي السبب الأساسي الذي يجعل تقنية النماذج الكبيرة تكون تحت سيطرة قليل من الأشخاص.

إذا كيف يمكن حل مشكلة قوة الحوسبة للنماذج الكبيرة من خلال تقنية البلوكشين؟

بالنظر إلى إنتاج النماذج الكبيرة، يتم تقسيمها بشكل رئيسي إلى تدريب النموذج الكبير، وضبط الدقة، وحساب استعلام المستخدم. على الرغم من أن النماذج الكبيرة تعتبر مكلفة للتدريب، إلا أن إصداراً من النموذج الكبير يحتاج إلى إنشاء مرة واحدة فقط. في معظم الأحيان، لمستخدمي خدمة النموذج الكبير، يتطلب فقط الحساب الاستنتاجي. وفقًا لإحصاءات AWS، يتم تأكيد ذلك أيضًا، حيث يتم استهلاك 80% من قوة الحساب في حسابات الاستنتاج.

على الرغم من أن تدريب النماذج الكبيرة يتطلب قدرات اتصال عالية السرعة بين وحدات المعالجة الرسومية، إلا أنه لا يمكن إتمامه على الشبكة (ما لم تختر تبادل تمديد الوقت مقابل تكلفة منخفضة). ومع ذلك، يمكن إجراء حسابات الاستنتاج على وحدة معالجة رسومية واحدة. يعتمد ضبط الدقة على النموذج الكبير الذي تم إنشاؤه وإعطاء بيانات مهنية، لذا يتطلب موارد حسابية أقل بكثير من تدريب النموذج الكبير.

عندما يتعلق الأمر بعرض الرسومات ، فمن الواضح أن وحدات معالجة الرسومات الاستهلاكية تعمل بشكل أفضل من وحدات معالجة الرسومات للمؤسسات وتكون خاملة في معظم الأوقات. منذ أن أطلقت جامعة كاليفورنيا ، بيركلي SETI للبحث عن الأجانب في عام 1999 ، وأصبحت الحوسبة الشبكية شائعة في عام 2000 ، كانت هناك بعض البنى التقنية التي تستخدم موارد الحوسبة الخاملة للتعاون لإكمال بعض مهام الحوسبة الضخمة. قبل ظهور blockchain ، كان هذا التعاون يركز عادة على المهام العلمية ويعتمد على الحماس ومشاركة الرفاهية العامة للمشاركين ، مما يحد من نطاق التأثير. الآن باستخدام تقنية blockchain ، يمكن تحفيز مجموعة واسعة من التطبيقات من خلال الرموز المميزة.

مثل مشروع الحوسبة السحابية المركزية Akash، تم إنشاء شبكة عامة للحوسبة، ويمكن للمستخدمين نشر نماذج التعلم الآلي لحسابات الاستدلال وتقديم الصور. هناك أيضًا مشاريع ذكاء اصطناعي معتمدة على التقنية السلسلة مثل Bittensor، Modulus Lab، Giza، و ChainML، والتي تهدف جميعها إلى حسابات استدلال الاستعلام.

بروتوكول الحوسبة الذكية في سلسلة الكتل جينسين ومنصة الذكاء الاصطناعي الإبداعي مفتوحة المصدر تعملان على بناء شبكة حوسبة لامركزية تخدم تدريب النماذج الكبيرة.

التحدي: بالنسبة لشبكات الحوسبة اللامركزية، تكمن الصعوبة ليس فقط في الشبكات الضعيفة وغير الموثوقة، وعدم القدرة على مزامنة الحالات الحسابية، التعامل مع أنواع متعددة من بيئات الحوسبة من نوع GPU، ولكن أيضًا التعامل مع الحوافز الاقتصادية، وغش المشارك، وإثبات عبء العمل، والأمان، وحماية الخصوصية، ومكافحة هجمات البريد المزعج.

2) بيانات نادرة وتصحيح البيانات

تتطلب الخوارزمية الأساسية للنموذج الكبير، تعلم التعزيز من تغذية ردود الفعل البشرية (RLHF)، مشاركة البشر في ضبط التدريب لتصحيح الأخطاء والقضاء على التحيز والمعلومات الضارة. استخدمت OpenAI RLHF لضبط GPT3 لإنشاء ChatGPT. خلال هذه العملية، وجدت OpenAI خبراء من مجموعة Facebook ودفعت لعمال كينيين 2 دولار في الساعة. يتطلب التدريب على الأمثلية في كثير من الأحيان مشاركة خبراء بشر على البيانات من المجالات المتخصصة، ويمكن دمج تنفيذه بشكل كامل مع طرق لتحفيز مشاركة المجتمع من خلال الرموز.

تستخدم صناعة شبكات البنية التحتية المادية اللامركزية (DePINs) الرموز المميزة لتشجيع الأشخاص على مشاركة البيانات الحقيقية في الوقت الفعلي من العالم المادي وفقا لأجهزة الاستشعار لتدريب النماذج المختلفة. بما في ذلك: يجمع React بيانات استخدام الطاقة ، ويجمع DIMO بيانات قيادة السيارة ، ويجمع WeatherXM بيانات الطقس ، ويجمع Hivemapper بيانات الخرائط من خلال حوافز رمزية لتشجيع الأشخاص على تمييز إشارات المرور ومساعدة خوارزمية التعلم الآلي RLHF على تحسين الدقة.

في الوقت نفسه، مع زيادة معلمات النماذج الكبيرة، ستنفد البيانات العامة الحالية بحلول عام 2030، وسيتعين الاعتماد المستمر للنماذج الكبيرة على البيانات الخاصة. كمية البيانات الخاصة 10 مرات أكثر من البيانات العامة، لكنها متناثرة في أيدي الشركات والأفراد، وتتمتع بطبيعة خاصة وسرية، مما يجعل استغلالها صعبًا. ينشأ مأزق مزدوج. من جهة، تحتاج النموذج الكبير إلى البيانات، ولكن على الرغم من أن الطرف الذي يمتلك البيانات يحتاج إلى النموذج الكبير، إلا أنه لا يرغب في تسليم البيانات إلى النموذج الكبير. يمكن أيضًا حل هذه المشكلة المزدوجة من خلال التكنولوجيا في مجال البلوكشين.

بالنسبة لنماذج الاستدلال مفتوحة المصدر، لأنها تتطلب موارد حوسبة أقل، يمكن تنزيل النموذج إلى قطاع البيانات للتنفيذ؛ بالنسبة للنماذج غير العامة أو النماذج الكبيرة، يحتاج البيانات إلى أن تتعرض لعملية تجفيف ويرفع إلى نهاية النموذج. تشمل طرق التجفيف بيانات اصطناعية وبراهين المعرفة الصفرية.

سواء تم تنزيل النموذج إلى جانب البيانات أو تم تحميل البيانات إلى جانب النموذج، فإن مشكلة السلطة تحتاج إلى حل لمنع الغش في النموذج أو البيانات.

التحدي: على الرغم من أن حوافز الرموز في Web3 يمكن أن تساعد في حل هذه المشكلة، إلا أن مشكلة الغش تحتاج إلى حل.

3) التعاون النموذجي

في مجتمع Civitai، أكبر منصة لمشاركة نماذج الرسم الفني الذكي في العالم، يشارك الناس النماذج ويمكنهم نسخ نموذج بسهولة وتعديله لتوليد نموذج يلبي متطلباتهم الخاصة.

بيتنسور، مشروع سلسلة كتل ثنائي الاتفاق ومبتدئ في الذكاء الاصطناعي مفتوح المصدر، قام بتصميم مجموعة من النماذج اللامركزية المحفزة بالرموز. بناءً على آلية التعاون لمزيج من الخبراء، ينتج بشكل مشترك نموذجًا لحل المشكلات ويدعم التبخير المعرفي، الذي يمكن مشاركته بين النماذج. معلومات، تسريع التدريب، الذي يوفر للعديد من الشركات الناشئة الفرصة للمشاركة في النماذج الكبيرة.

كشبكة موحدة لخدمات خارج السلسلة مثل التشغيل التلقائي والمهتمون والذكاء الاصطناعي المشترك، صممت Autonolas إطار تعاوني للوكلاء للوصول إلى توافق من خلال Tendermint.

التحدي: تدريب العديد من النماذج ما زال يتطلب الكثير من التواصل، وموثوقية وكفاءة الوقت للتدريب الموزع ما زالت عقبات كبيرة؛

نماذج كبيرة وابتكار في الويب 3

بالتزامن مع المناقشة أعلاه حول كيف يمكن استخدام Web3 لحل بعض المشاكل في صناعة النمذجة الكبيرة. ستؤدي مزيج هذين القوتين المهمتين إلى بعض التطبيقات المبتكرة.

1) استخدام ChatGPT لكتابة العقود الذكية

مؤخرًا، قام فنان NFT باستخدام الإشارات لتشغيل ChatGPT بدون أي معرفة بالبرمجة لإصدار عقده الذكي الخاص وإصدار رمز Turboner. استخدم الفنان YouTube لتسجيل عملية إنشاءه لمدة أسبوع، ملهمًا الجميع لاستخدام ChatGPT. المشاركة في إنشاء العقود الذكية.

2) مجال العملات الرقمية يمكن أن يمنح الإدارة الذكية القوة

أدى تطوير النماذج الكبيرة إلى تحسين ذكاء المساعدين الأذكياء بشكل كبير ، وإلى جانب المدفوعات المشفرة ، سيتمكن المساعدون الأذكياء من تنسيق المزيد من الموارد والتعاون في المزيد من المهام في سوق المساعد الذكي. يوضح AutoGPT الاعتماد على بطاقة الائتمان التي يوفرها المستخدم ، ويمكنه مساعدة المستخدم على أتمتة شراء موارد الحوسبة السحابية وحجز الرحلات الجوية ، ولكنه مقيد بتسجيل الدخول الآلي أو مصادقة الأمان الأخرى ، وقدرات AutoGPT محدودة للغاية من خلال تسجيل الدخول التلقائي أو مصادقة الأمان الأخرى. يتضمن تصميم نظام Multi Agent System (MAS) ، بما في ذلك بروتوكول Contract Net ، تعاون العديد من المساعدين الأذكياء في سوق مفتوح ، وإذا كان مدعوما بالرموز المميزة ، فإن هذا التعاون سوف يخترق التعاون المحدود القائم على الثقة ويصبح تعاونا واسع النطاق يعتمد على اقتصاد السوق ، تماما كما ينتقل المجتمع البشري من مجتمع بدائي إلى مجتمع نقدي.

3) zkML (تعلم الآلة بدون معرفة (Zero Knowledge Machine Learning

ينقسم تطبيق تقنية zkp (دليل المعرفة الصفرية) في blockchain إلى فئتين. الأول هو حل أداء blockchain عن طريق نقل متطلبات الحوسبة إلى خارج السلسلة ، ثم إلى شهادة على السلسلة من خلال zkp ؛ الفئة الثانية تستخدم لحماية خصوصية المعاملات. تشمل تطبيقات zkp في النماذج الكبيرة حسابات النموذج الجديرة بالثقة (لإثبات اتساق وأصالة حسابات النموذج) وحسابات الخصوصية لبيانات التدريب. في بيئة لامركزية ، يحتاج مزود خدمة النموذج إلى أن يثبت للعملاء أن النموذج المباع هو النموذج الموعود للعميل ، دون قطع الزوايا ؛ بالنسبة لشركاء بيانات التدريب ، يحتاجون إلى المشاركة في التدريب أو استخدام النموذج على أساس حماية خصوصيتهم. . على الرغم من أن zkp يقدم بعض الاحتمالات ، إلا أنه لا يزال هناك العديد من التحديات ، ولا تزال الحلول مثل الحوسبة المتجانسة وحوسبة الخصوصية الموحدة غير ناضجة.

الحل مبني على تقنية BEC (Blockchain Edge Client)

بالإضافة إلى المدارس المذكورة أعلاه، هناك مدرسة أخرى لم تحظَ بالاهتمام الواسع نظرًا لعدم وجود حوافز رمزية واستخدام تطبيقات سلسلة الكتل الحدية.

يحتوي التركيب المعتمد على BEC على العديد من التشابهات مع مفاهيم Web5 المذكورة من قبل جاك دورسي وSolid من قبل تيم بيرنرز لي في العديد من الجوانب.

يعتقدون جميعًا:

  • لكل شخص جهاز تحكم حافة مقابل؛
  • يجب معالجة الحوسبة والتخزين في معظم سيناريوهات التطبيق عند الحواف؛
  • يتم إكمال التعاون بين العقد الفردية من خلال التسلسل الزمني للكتل؛
  • يتم الاتصال بين العقد من خلال P2P؛
  • يمكن للأفراد السيطرة الكاملة على عقدة الشبكة الخاصة بهم بمفردهم أو الوثوق بالأشخاص الموثوق بهم لإدارة العقد (المعروفة أيضًا باسم خوادم الإرسال في بعض السيناريوهات)؛
  • تحقيق أقصى درجات اللامركزية؛

عندما تقوم هذه العقدة المقابلة لكل شخص ويتم التحكم فيها بواسطة الفرد بتخزين البيانات الشخصية وتحميل النموذج الكبير ، يمكن تدريب وكيل ذكي شخصي مخصص بالكامل ومحمي بالخصوصية بنسبة 100٪ (وكيل). قارن الشريك المؤسس الصيني لشركة SIG الدكتور Gong Ting بشكل رومانسي العقدة الشخصية المستقبلية بالسحابة الشخصية فوق رأس أولاف في "Frozen" التي تتبعه دائما.

بهذه الطريقة، لن يكون الأفاتار في الميتافيرس بعد الآن صورة تتحكم فيها لوحة المفاتيح، بل عميل له روح. يمكنه دراسة الأخبار عبر الإنترنت، ومعالجة الرسائل الإلكترونية، وحتى الرد تلقائيًا على رسائل الدردشة الاجتماعية الخاصة بك نيابة عنا على مدار 24 ساعة في اليوم. (انتباه، صديقات المزعجات، قد تحتاجن إلى طريقة لاكتشاف ما إذا كان صديقك يستخدم عميلًا للتعامل معك في المستقبل). عندما يحتاج عميلك إلى مهارات جديدة، تمامًا مثل تثبيت تطبيق على هاتف محمول، يمكنك تثبيت تطبيق جديد في عقدك.

ملخص

تاريخيًا، مع تطبيق المنصات بشكل مستمر على تطوير الإنترنت، على الرغم من أن الوقت اللازم لولادة شركات اليونيكورن أصبح أقصر وأقصر، إلا أنه أصبح يضر بشكل متزايد بتطوير الشركات الناشئة.

من خلال منصة توزيع المحتوى الفعالة التي توفرها غوغل وفيسبوك، تم الاستحواذ على يوتيوب، الذي وُلد في عام 2005، من قبل غوغل مقابل 1.6 مليار دولار أمريكي بعد عام واحد فقط.

بالإضافة إلى منصة توزيع التطبيقات الفعالة لمتجر تطبيقات Apple، تأسست Instagram في عام 2012 من قبل أكثر من 10 أشخاص فقط واستحوذت عليها Facebook مقابل مليار دولار أمريكي في عام 2012.

بفضل دعم النموذج الكبير ChatGPT، حققت شركة Midjourney التي تضم 11 شخصًا فقط 100 مليون دولار أمريكي سنويًا. وتقدر قيمة OpenAI، التي لا تزيد عن 100 شخص، بأكثر من 20 مليار دولار أمريكي.

شركات منصات الإنترنت تصبح أقوى وأقوى، وظهور النماذج الكبيرة لم يغير النمط الحالي لاحتكار الإنترنت من قبل الشركات الكبيرة. العناصر الثلاثة للنماذج الكبيرة، الخوارزميات والبيانات وقوة الحساب ما زالت تحت احتكار الشركات الكبيرة. الشركات الناشئة ليس لديها القدرة على الابتكار في النماذج الكبيرة وليس لديها القوة المالية لتدريب النماذج الكبيرة. يمكنهم فقط التركيز على تطبيق النماذج الكبيرة في المجالات العمودية. على الرغم من أن النماذج الكبيرة تبدو كما لو كانت تعزز انتشار المعرفة، إلا أن القوة الحقيقية تكون تحت سيطرة لا تزيد عن 100 شخص في العالم الذين لديهم القدرة على إنتاج النماذج.

إذا اخترقت النماذج الكبيرة جميع جوانب حياة الناس في المستقبل، وسألت ChatGPT عن نظامك الغذائي اليومي، وصحتك، ورسائل البريد الإلكتروني الخاصة بعملك، ورسائل محاميك، فإنه في النظرية، الذين يتقنون النماذج الكبيرة يحتاجون فقط إلى تغيير بعض المعلمات سراً. يمكن أن يؤثر ذلك بشكل كبير على حياة عدد لا يحصى من الناس. قد يتم حل بعض مشكلات البطالة الناتجة عن النموذج الكبير من خلال الدخل الأساسي العالمي أو العملة العالمية، ولكن عواقب الشر المحتملة الناجمة عن تحكم النموذج الكبير بواسطة عدد قليل من الأشخاص أكثر خطورة. هذا هو القصد الأصلي لـ OpenAI. على الرغم من أن OpenAI تحل مشكلات مدفوعة بالربح من خلال طرق غير ربحية، كيف تحل مشاكل مدفوعة بالسلطة؟ من الواضح أن النماذج الكبيرة تدرب سريعاً نماذج المعرفة باستخدام المعرفة المتراكمة عبر عقود من الزمن من قبل البشر والمشتركة بحرية على الإنترنت، ولكن يتحكم في هذا النموذج عدد قليل جداً من الأشخاص.

  1. لذلك ، هناك تعارض كبير في القيم بين النماذج الكبيرة و blockchain. يحتاج ممارسو Blockchain إلى المشاركة في ريادة الأعمال ذات النماذج الكبيرة واستخدام تقنية blockchain لحل مشكلات النماذج الكبيرة. إذا كانت الكمية الهائلة من البيانات المتاحة مجانا على الإنترنت هي المعرفة العامة للبشرية ، فإن النماذج الكبيرة التي تم إنشاؤها بناء على هذه البيانات يجب أن تنتمي إلى البشرية جمعاء. تماما كما بدأت OpenAI مؤخرا في الدفع مقابل قواعد بيانات الأدبيات ، يحتاج OpenAI إلى الدفع مقابل المدونات الشخصية التي نكرس أنفسنا لها أنت وأنا.

تنصل:

  1. تم نقل هذه المقالة من [ ThreeDAO، جزيرة كل الأشياء]. جميع حقوق الطبع والنشر تنتمي إلى الكاتب الأصلي [36Cإذا كانت هناك اعتراضات على هذه الإعادة طبعًا، يرجى التواصل معبوابة تعلمالفريق، وسيتولون على التعامل معها على الفور.
  2. تنصل المسؤولية: الآراء والآراء المعبر عنها في هذه المقالة هي فقط تلك للكاتب ولا تشكل أي نصيحة استثمارية.
  3. يتم إجراء ترجمة المقال إلى لغات أخرى من قبل فريق Gate Learn. ما لم يرد غير ذلك، فإن نسخ أو توزيع أو نسخ المقالات المترجمة ممنوع.
即刻開始交易
註冊並交易即可獲得
$100
和價值
$5500
理財體驗金獎勵!