يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك

0 5 2 دقائق

اشراق العالم 24 متابعات تقنية:
نقدم لكم في اشراق العالم 24 خبر بعنوان “يقول AI2 عن طراز الذكاء الاصطناعى الجديد يتفوق على أحد أفضل ما في ديبسيك
” نترككم مع محتوى الخبر

تحرك ، ديبسيك. هناك بطل جديد لمنظمة العفو الدولية في المدينة – وهم أمريكيون.

في يوم الخميس ، أصدر AI2 ، وهو معهد أبحاث منظمة العفو الدولية غير الربحية مقره في سياتل ، نموذجًا يزعم أنه يتفوق على Deepseek V3 ، أحد أنظمة Deepseek الصينية الرائدة في شركة AI.

نموذج AI2 ، المسمى Tulu3-405b ، يتفوق أيضًا على GPT-4O من Openai على معايير AI معينة ، وفقًا للاختبار الداخلي لـ AI2. علاوة على ذلك ، على عكس GPT-4O (وحتى Deepseek V3) ، فإن Tulu3-405B هو مفتوح المصدر ، مما يعني أن جميع المكونات اللازمة لتكرارها من نقطة الصفر متاحة مجانًا وترخيصًا.

وقال متحدث باسم AI2 لـ TechCrunch إن المختبر يعتقد أن Tulu3-405B “يؤكد على إمكانية قيادة التطوير العالمي لنماذج الذكاء الاصطناعي الأفضل في فئة الفئة”.

وقال المتحدث باسم المتحدث: “هذا المعلم هو لحظة رئيسية لمستقبل AI المفتوح ، مما يعزز موقف الولايات المتحدة كقائد في النماذج التنافسية المفتوحة المصدر”. “مع هذا الإطلاق ، تقدم AI2 بديلاً قويًا ومطورًا في الولايات المتحدة لنماذج Deepseek-مما يمثل لحظة محورية ليس فقط في تطوير الذكاء الاصطناعى ، ولكن في عرض أن الولايات المتحدة يمكن أن تقودها مع AI تنافسي ومفتوح المصدر مستقل عن العمالقة التكنولوجية. “

Tulu3-405b هو نموذج كبير إلى حد ما. تحتوي على 405 مليار معلمة ، وتتطلب 256 وحدات معالجة الرسومات التي تعمل بالتوازي للتدريب ، وفقا ل AI2. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل أفضل من تلك التي تحتوي على معلمات أقل.

اختبرت AI2 TULU3-405B على عدد من المعايير ، بما في ذلك اختبارات الرياضيات والمعرفة العامة. ائتمانات الصورة:AI2

وفقًا لـ AI2 ، كان أحد مفاتيح الوصول إلى الأداء التنافسي مع Tulu3-405B بمثابة تقنية تسمى التعلم التعزيز بمكافآت يمكن التحقق منها. التعلم التعزيز مع المكافآت التي يمكن التحقق منها ، أو RLVR ، تدرب نماذج على المهام مع نتائج “يمكن التحقق منها” ، مثل حل مشاكل الرياضيات والتعليمات التالية.

تدعي AI2 أنه في المعيار Popqa ، مجموعة من 14000 من أسئلة المعرفة المتخصصة التي يتم الحصول عليها من ويكيبيديا ، Tulu3-405B لا تغلب فقط على Deepseek V3 و GPT-4O ، ولكن أيضًا نموذج LLAMA’s LLAMA 3.1 405B. كان لدى Tulu3-405B أيضًا أعلى أداء لأي نموذج في فصله على GSM8K ، وهو اختبار يحتوي على مشاكل في كلمات الرياضيات على مستوى المدرسة.

يتوفر TULU3-405B للاختبار عبر تطبيق ChatBot الخاص بـ AI2 ، والرمز المطلوب تدريبه وضبطه على GitHub. احصل عليه بينما يكون الجو حارًا-قبل أن يأتي نموذج الذكاء الاصطناعي الرائد المرجعية.

نشكركم على قراءة الخبر على اشراق 24. اشترك معنا في النشرة الإخبارية لتلقي الجديد كل لحظة.

اقرأ على الموقع الرسمي