منوعات

NVIDIA تستخرج مقاطع فيديو من YouTube وNetflix دون إذن



في أحدث مثال على نمط الصناعة المزعج، يبدو أن NVIDIA قد جمعت كميات هائلة من المحتوى المحمي بحقوق الطبع والنشر للتدريب على الذكاء الاصطناعي. في يوم الاثنين، ذكرت سامانثا كول من 404 Media أن الشركة التي تبلغ قيمتها 2.4 تريليون دولار طلبت من العمال تنزيل مقاطع فيديو من YouTube وNetflix ومجموعات بيانات أخرى لتطوير مشاريع الذكاء الاصطناعي التجارية. تعد شركة تصنيع بطاقات الرسومات من بين شركات التكنولوجيا التي يبدو أنها تبنت مبدأ “التحرك بسرعة وكسر الأشياء” حيث تتسابق لتأسيس الهيمنة في هذا الاندفاع الذهبي المحموم والمخزي في كثير من الأحيان للذكاء الاصطناعي.

وورد أن التدريب كان لتطوير نماذج لمنتجات مثل مولد العالم ثلاثي الأبعاد Omniverse وأنظمة السيارات ذاتية القيادة وجهود “الإنسان الرقمي”.

دافعت NVIDIA عن ممارستها في رسالة بريد إلكتروني إلى Engadget. قال متحدث باسم الشركة إن بحثها “يتوافق تمامًا مع حرف وروح قانون حقوق الطبع والنشر” بينما زعم أن قوانين الملكية الفكرية تحمي تعبيرات محددة “ولكن ليس الحقائق أو الأفكار أو البيانات أو المعلومات”. لقد شبهت الشركة هذه الممارسة بحق الشخص في “تعلم الحقائق أو الأفكار أو البيانات أو المعلومات من مصدر آخر واستخدامها للتعبير عن نفسه”. الإنسان، الكمبيوتر… ما الفرق؟

لا يبدو أن موقع يوتيوب يوافق على هذا الرأي. أشار المتحدث باسم الشركة جاك مالون إلى قصة نشرتها بلومبرج في شهر أبريل، نقلاً عن الرئيس التنفيذي نيل موهان قوله إن استخدام موقع يوتيوب لتدريب نماذج الذكاء الاصطناعي سيكون “انتهاكًا واضحًا” لشروطه. كتب مدير اتصالات سياسة موقع يوتيوب إلى إنجادجيت: “لا يزال تعليقنا السابق قائمًا”.

كان هذا الاقتباس من موهان في شهر أبريل ردًا على التقارير التي تفيد بأن شركة OpenAI دربت مولد تحويل النص إلى فيديو Sora على مقاطع فيديو YouTube دون إذن. في الشهر الماضي، أظهر تقرير أن شركة Runway AI الناشئة حذت حذوها.

أفادت التقارير أن موظفي NVIDIA الذين أثاروا مخاوف أخلاقية وقانونية بشأن هذه الممارسة أخبرهم مديروهم أن أعلى مستويات الشركة وافقت عليها بالفعل. أجاب مينج يو ليو، نائب رئيس الأبحاث في NVIDIA، “هذا قرار تنفيذي. لدينا موافقة شاملة على جميع البيانات”. وقد وصف آخرون في الشركة عملية التكسير بأنها “قضية قانونية مفتوحة” سيتعاملون معها في المستقبل.

يبدو الأمر كله مشابهًا لشعار فيسبوك القديم (Meta) “تحرك بسرعة واكسر الأشياء”، والذي نجح بشكل رائع في كسر العديد من الأشياء. وشمل ذلك خصوصية ملايين الأشخاص.

بالإضافة إلى مقاطع الفيديو على YouTube وNetflix، ورد أن NVIDIA أصدرت تعليمات للعاملين بالتدريب على قاعدة بيانات مقطورات الأفلام MovieNet، والمكتبات الداخلية لمقاطع فيديو ألعاب الفيديو ومجموعات بيانات الفيديو على Github WebVid (تم حذفها الآن بعد وقف وكف) وInternVid-10M. والأخيرة عبارة عن مجموعة بيانات تحتوي على 10 ملايين معرف فيديو على YouTube.

تم وضع علامة على بعض البيانات التي تدربت عليها NVIDIA على أنها مؤهلة للاستخدام الأكاديمي (أو غير التجاري). تتضمن HD-VG-130M، وهي مكتبة تحتوي على 130 مليون مقطع فيديو على YouTube، ترخيص استخدام يحدد أنها مخصصة للبحث الأكاديمي فقط. وبحسب ما ورد، تجاهلت شركة NVIDIA المخاوف بشأن المصطلحات الأكاديمية فقط، وأصرت على أن دفعاتها كانت لعبة عادلة لمنتجات الذكاء الاصطناعي التجارية الخاصة بها.

وللتهرب من الكشف من YouTube، ورد أن NVIDIA قامت بتنزيل المحتوى باستخدام آلات افتراضية (VMs) بعناوين IP دوارة لتجنب الحظر. وردًا على اقتراح أحد العاملين باستخدام أداة تدوير عناوين IP من جهة خارجية، ورد أن موظفًا آخر في NVIDIA كتب، “نحن على [Amazon Web Services](#) وإعادة تشغيل مثيل [الآلة الافتراضية](#) يعطي عنوان IP عامًا جديدًا[.](#) لذا، فهذه ليست مشكلة حتى الآن.”




اكتشاف المزيد من اشراق العالم 24

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من اشراق العالم 24

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading