أطلقت جوجل وهارفارد مجموعة بيانات تضم مليون كتاب من الملكية العامة لتدريب الذكاء الاصطناعي

- ستعزز هذه المبادرة إمكانية وصول شركات الذكاء الاصطناعي إلى المزيد من المعلومات لتدريب نماذجها.
- قامت شركتا OpenAI ومايكروسوفت بتمويل مشروع جامعة هارفارد.
- تم مسح ما يقرب من مليون كتاب من مختلف الأنواع الأدبية كجزء من برنامج كتب جوجل.
أصدرت جامعة هارفارد، بالتعاون مع جوجل، مجموعة بيانات تضم مليون كتاب من الملكية العامة لتدريب الجيل القادم من الذكاء الاصطناعي.
تشمل هذه الكتب أنواعًا أدبية ولغات ومؤلفين مثل ديكنز ودانتي وشكسبير، وهي كتب لم تعد محمية بحقوق النشر نظرًا لقدمها. وتأتي هذه المبادرة الجديدة لمجموعة البيانات في وقتٍ تُعدّ فيه بيانات تدريب الذكاء الاصطناعي باهظة الثمن بطبيعتها، وهي الأنسب لشركات التكنولوجيا ذات الموارد المالية الضخمة.
حصلت جامعة هارفارد على دعم مالي من عمالقة التكنولوجيا
بحسب مقال نُشر على موقع TechCrunch، فإن هذه المبادرة تقودها مبادرة البيانات المؤسسية (IDI) التابعة لجامعة هارفارد. وتتضمن هذه المبادرة كتبًا مستمدة من مشروع جوجل لمسح الكتب ضوئيًا، وهو مشروع جوجل بوكس.
وتشمل الكتب الأخرى الموجودة في مجموعة البيانات كتب الرياضيات التشيكية وقواميس الجيب الويلزية.
أعلنت الجامعة عن مبادرة IDI في مارس الماضي، موضحة بوضوح خططها لإنشاء "قناة موثوقة للبيانات القانونية للذكاء الاصطناعي". ومنذ ذلك الحين، لم يُسمع الكثير عنها حتى الإطلاق الرسمي يوم الخميس، وقامت شركتا التكنولوجيا العملاقتان مايكروسوفت وOpenAI بتمويل المشروع.
لا تقتصر مجموعة البيانات على وادي السيليكون وحده، بل فتحها معهد IDI لأي شخص، بدءًا من مختبرات الأبحاث وحتى الشركات الناشئة في مجال الذكاء الاصطناعي التي ترغب في تدريب نماذجها اللغوية الكبيرة.
المدير التنفيذي لمعهد IDI، جريج ليبرت، إن فتح مجموعة البيانات لأي شخص قال يهدف إلى تحقيق تكافؤ الفرص، في وقت لا تزال فيه تكلفة تدريب الذكاء الاصطناعي مرتفعة ومكلفة للغاية بالنسبة للشركات الصغيرة، مما يجعلها حكرًا على أولئك الذين لديهم ميزانيات ضخمة.
وأضاف ليبرت أن مجموعة البيانات "خضعت لمراجعة دقيقة"، وهو ما يعني على الأرجح، وفقًا لفودزيلا، أن شخصًا ما تحقق للتأكد من أن بارد قد رحل بالفعل وابتعد عن الطريق.
ستحتاج مجموعة بيانات جامعة هارفارد إلى المزيد من الموارد
بحسب ليبرت، الذي شبّه إمكانات مجموعة البيانات بنظام لينكس، نظام التشغيل مفتوح المصدر، فإن نجاح مجموعة بيانات هارفارد سيتوقف على عدد من المتغيرات. وأضاف ليبرت أن نجاحها سيتطلب المزيد من الموارد والخبرات، و"لمسة سحرية" من تلك الشركات الكبرى التي صُممت المبادرة لتحديها.
تم مسح مليون كتاب من الكتب الموجودة في مجموعة البيانات كجزء من برنامج كتب جوجل. ويصف موقع Fudzilla هذه المبادرة بأنها كبسولة زمنية رقمية تعود إلى زمن بدت فيه طموحات جوجل في مسح كل كتاب غريبة الأطوار وليست كارثية.
ومع ذلك، فإن ليبرت متفائل بشأن الاستخدامات المحتملة للمشروع، ويشير كذلك إلى أنه يمكن أن يكون كنزًا ثمينًا يساعد في تدريب نماذج الذكاء الاصطناعي للجميع بدءًا من الشركات الناشئة الصغيرة وحتى التكتلات التجارية الكبرى.
بينما أشاد البعض بالمبادرة باعتبارها قفزة ثورية إلى الأمام في دمقرطة الذكاء الاصطناعي، يرى فودزيلا أن البعض قد ينظر إلى هذا على أنه وسيلة خفية لضمان أن أي شركة ناشئة طموحة لديها بضعة تيرابايت من مساحة الخادم يمكنها الآن المنافسة في سباق لتطوير ChatGPT التالي.
مع ذلك، سيحتاجون إلى المزيد من الموارد للمنافسة وإحداث dent في السوق. انطلقت منصة ChatGPT في نوفمبر 2022 وحققت نجاحًا فوريًا، مما حفز سباقًا محمومًا لتطوير نماذج الذكاء الاصطناعي التوليدية في جميع أنحاء العالم. إلا أن تطوير هذه النماذج قد خلق تعطشًا للبيانات لتحسينها، وقد أدى هذا التعطش إلى مشاكل تتعلق بكمية المعلومات التي يمكن الحصول عليها دون سرقتها.
حتى الآن، رفعت دور النشر مثل صحيفة وول ستريت جورنال ونيويورك تايمز دعاوى قضائية ضد OpenAI وPerplexity لاستخدامهم بياناتهم دون إذن.
أذكى العقول في عالم العملات الرقمية يتابعون نشرتنا الإخبارية بالفعل. هل ترغب بالانضمام إليهم؟ انضم إليهم.
إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtronبإجراء بحث مستقلdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.
إناسي ماباكامي
إناسي ماباكامي صحفية تتمتع بخبرة تزيد عن عشر سنوات في مجال الأخبار الاقتصادية والمالية. تغطي أسواق رأس المال والتقنيات الناشئة، مثل الميتافيرس والذكاء الاصطناعي والعملات المشفرة. تحمل إناسي شهادة بكالوريوس مع مرتبة الشرف في الإعلام ودراسات المجتمع.
دورة
- أي العملات المشفرة يمكن أن تدر عليك المال
- كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
- استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
- كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)














