علوم وتكنولوجيامنوعات التقنية

يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك

اشراق العالم 24 متابعات تقنية:
نقدم لكم في اشراق العالم 24 خبر بعنوان “يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك
” نترككم مع محتوى الخبر

تحرك ، ديبسيك. هناك بطل جديد لمنظمة العفو الدولية في المدينة – وهم أمريكيون.

في يوم الخميس ، أصدر AI2 ، وهو معهد أبحاث منظمة العفو الدولية غير الربحية مقره في سياتل ، نموذجًا يزعم أنه يتفوق على Deepseek V3 ، أحد أنظمة Deepseek الصينية الرائدة في شركة AI.

نموذج AI2 ، المسمى Tulu3-405b ، يتفوق أيضًا على GPT-4O من Openai على معايير AI معينة ، وفقًا للاختبار الداخلي لـ AI2. علاوة على ذلك ، على عكس GPT-4O (وحتى Deepseek V3) ، فإن Tulu3-405B هو مفتوح المصدر ، مما يعني أن جميع المكونات اللازمة لتكرارها من نقطة الصفر متاحة مجانًا وترخيصًا.

وقال متحدث باسم AI2 لـ TechCrunch إن المختبر يعتقد أن Tulu3-405B “يؤكد على إمكانية قيادة التطوير العالمي لنماذج الذكاء الاصطناعي الأفضل في فئة الفئة”.

وقال المتحدث باسم المتحدث: “هذا المعلم هو لحظة رئيسية لمستقبل AI المفتوح ، مما يعزز موقف الولايات المتحدة كقائد في النماذج التنافسية المفتوحة المصدر”. “مع هذا الإطلاق ، تقدم AI2 بديلاً قويًا ومطورًا في الولايات المتحدة لنماذج Deepseek-مما يمثل لحظة محورية ليس فقط في تطوير الذكاء الاصطناعى ، ولكن في عرض أن الولايات المتحدة يمكن أن تقودها مع AI تنافسي ومفتوح المصدر مستقل عن العمالقة التكنولوجية. “

Tulu3-405b هو نموذج كبير إلى حد ما. تحتوي على 405 مليار معلمة ، وتتطلب 256 وحدات معالجة الرسومات التي تعمل بالتوازي للتدريب ، وفقا ل AI2. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل أفضل من تلك التي تحتوي على معلمات أقل.

اختبرت AI2 TULU3-405B على عدد من المعايير ، بما في ذلك اختبارات الرياضيات والمعرفة العامة. ائتمانات الصورة:AI2

وفقًا لـ AI2 ، كان أحد مفاتيح الوصول إلى الأداء التنافسي مع Tulu3-405B بمثابة تقنية تسمى التعلم التعزيز بمكافآت يمكن التحقق منها. التعلم التعزيز مع المكافآت التي يمكن التحقق منها ، أو RLVR ، تدرب نماذج على المهام مع نتائج “يمكن التحقق منها” ، مثل حل مشاكل الرياضيات والتعليمات التالية.

تدعي AI2 أنه في المعيار Popqa ، مجموعة من 14000 من أسئلة المعرفة المتخصصة التي يتم الحصول عليها من ويكيبيديا ، Tulu3-405B لا تغلب فقط على Deepseek V3 و GPT-4O ، ولكن أيضًا نموذج LLAMA’s LLAMA 3.1 405B. كان لدى Tulu3-405B أيضًا أعلى أداء لأي نموذج في فصله على GSM8K ، وهو اختبار يحتوي على مشاكل في كلمات الرياضيات على مستوى المدرسة.

يتوفر TULU3-405B للاختبار عبر تطبيق ChatBot الخاص بـ AI2 ، والرمز المطلوب تدريبه وضبطه على GitHub. احصل عليه بينما يكون الجو حارًا-قبل أن يأتي نموذج الذكاء الاصطناعي الرائد المرجعية.


نشكركم على قراءة الخبر على اشراق 24. اشترك معنا في النشرة الإخبارية لتلقي الجديد كل لحظة.

اقرأ على الموقع الرسمي


اكتشاف المزيد من اشراق العالم 24

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من اشراق العالم 24

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading