يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك
اشراق العالم 24 متابعات تقنية:
نقدم لكم في اشراق العالم 24 خبر بعنوان “يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك
” نترككم مع محتوى الخبر
تحرك ، ديبسيك. هناك بطل جديد لمنظمة العفو الدولية في المدينة – وهم أمريكيون.
في يوم الخميس ، أصدر AI2 ، وهو معهد أبحاث منظمة العفو الدولية غير الربحية مقره في سياتل ، نموذجًا يزعم أنه يتفوق على Deepseek V3 ، أحد أنظمة Deepseek الصينية الرائدة في شركة AI.
نموذج AI2 ، المسمى Tulu3-405b ، يتفوق أيضًا على GPT-4O من Openai على معايير AI معينة ، وفقًا للاختبار الداخلي لـ AI2. علاوة على ذلك ، على عكس GPT-4O (وحتى Deepseek V3) ، فإن Tulu3-405B هو مفتوح المصدر ، مما يعني أن جميع المكونات اللازمة لتكرارها من نقطة الصفر متاحة مجانًا وترخيصًا.
وقال متحدث باسم AI2 لـ TechCrunch إن المختبر يعتقد أن Tulu3-405B “يؤكد على إمكانية قيادة التطوير العالمي لنماذج الذكاء الاصطناعي الأفضل في فئة الفئة”.
وقال المتحدث باسم المتحدث: “هذا المعلم هو لحظة رئيسية لمستقبل AI المفتوح ، مما يعزز موقف الولايات المتحدة كقائد في النماذج التنافسية المفتوحة المصدر”. “مع هذا الإطلاق ، تقدم AI2 بديلاً قويًا ومطورًا في الولايات المتحدة لنماذج Deepseek-مما يمثل لحظة محورية ليس فقط في تطوير الذكاء الاصطناعى ، ولكن في عرض أن الولايات المتحدة يمكن أن تقودها مع AI تنافسي ومفتوح المصدر مستقل عن العمالقة التكنولوجية. “
Tulu3-405b هو نموذج كبير إلى حد ما. تحتوي على 405 مليار معلمة ، وتتطلب 256 وحدات معالجة الرسومات التي تعمل بالتوازي للتدريب ، وفقا ل AI2. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل أفضل من تلك التي تحتوي على معلمات أقل.
وفقًا لـ AI2 ، كان أحد مفاتيح الوصول إلى الأداء التنافسي مع Tulu3-405B بمثابة تقنية تسمى التعلم التعزيز بمكافآت يمكن التحقق منها. التعلم التعزيز مع المكافآت التي يمكن التحقق منها ، أو RLVR ، تدرب نماذج على المهام مع نتائج “يمكن التحقق منها” ، مثل حل مشاكل الرياضيات والتعليمات التالية.
تدعي AI2 أنه في المعيار Popqa ، مجموعة من 14000 من أسئلة المعرفة المتخصصة التي يتم الحصول عليها من ويكيبيديا ، Tulu3-405B لا تغلب فقط على Deepseek V3 و GPT-4O ، ولكن أيضًا نموذج LLAMA’s LLAMA 3.1 405B. كان لدى Tulu3-405B أيضًا أعلى أداء لأي نموذج في فصله على GSM8K ، وهو اختبار يحتوي على مشاكل في كلمات الرياضيات على مستوى المدرسة.
يتوفر TULU3-405B للاختبار عبر تطبيق ChatBot الخاص بـ AI2 ، والرمز المطلوب تدريبه وضبطه على GitHub. احصل عليه بينما يكون الجو حارًا-قبل أن يأتي نموذج الذكاء الاصطناعي الرائد المرجعية.
نشكركم على قراءة الخبر على اشراق 24. اشترك معنا في النشرة الإخبارية لتلقي الجديد كل لحظة.
اقرأ على الموقع الرسمي
روابط قد تهمك
مؤسسة اشراق العالم خدمات المواقع والمتاجر باك لينكات باقات الباك لينك
اكتشاف المزيد من اشراق العالم 24
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.