هارفارد وجوجل تطلقان مليون كتاب للملكية العامة كمجموعة بيانات للتدريب على الذكاء الاصطناعي
اشراق العالم 24 متابعات تقنية:
نقدم لكم في اشراق العالم 24 خبر بعنوان “هارفارد وجوجل تطلقان مليون كتاب للملكية العامة كمجموعة بيانات للتدريب على الذكاء الاصطناعي
” نترككم مع محتوى الخبر
إن بيانات التدريب على الذكاء الاصطناعي لها ثمن باهظ، وهي الأنسب لشركات التكنولوجيا ذات الأموال الكبيرة. ولهذا السبب تخطط جامعة هارفارد لإصدار مجموعة بيانات تتضمن ما يقرب من مليون كتاب ذات ملكية عامة، تشمل الأنواع واللغات والمؤلفين، بما في ذلك ديكنز ودانتي وشكسبير، الذين لم يعودوا محميين بحقوق الطبع والنشر بسبب أعمارهم.
مجموعة البيانات الجديدة ليست متاحة بعد، وليس من الواضح متى أو كيف سيتم إصدارها. ومع ذلك، فهو يحتوي على كتب مستمدة من مشروع Google لمسح الكتب ضوئيًا، وهو مشروع Google Books، وبالتالي ستشارك Google في إطلاق “هذا الكنز الدفين على نطاق واسع”.
طرحت جامعة هارفارد لأول مرة مبادرة البيانات المؤسسية (IDI) في مارس الماضي، حيث حددت خططها لإنشاء “قناة موثوقة للبيانات القانونية للذكاء الاصطناعي”. ومع ذلك، لم يُسمع الكثير عنها حتى إطلاقها رسميًا اليوم، والذي جاء مع التأكيد على أن مبادرة تطوير التطوير (IDI) تتضمن دعمًا ماليًا من Microsoft وOpenAI.
يقول المدير التنفيذي لمعهد IDI، جريج ليبيرت، إن مجموعة البيانات مصممة “لتحقيق تكافؤ الفرص” من خلال فتح مجموعة البيانات الضخمة هذه لأي شخص – من مختبرات الأبحاث إلى شركات الذكاء الاصطناعي الناشئة – الذي يرغب في تدريب نماذجه اللغوية الكبيرة (LLMs).
نشكركم على قراءة الخبر على اشراق 24. اشترك معنا في النشرة الإخبارية لتلقي الجديد كل لحظة.
اقرأ على الموقع الرسمي
روابط قد تهمك
مؤسسة اشراق العالم خدمات المواقع والمتاجر باك لينكات باقات الباك لينك
اكتشاف المزيد من اشراق العالم 24
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.