يشير o3 الخاص بـ OpenAI إلى أن نماذج الذكاء الاصطناعي تتوسع بطرق جديدة – لكن التكاليف كذلك أيضًا
اشراق العالم 24 متابعات تقنية:
نقدم لكم في اشراق العالم 24 خبر بعنوان “يشير o3 الخاص بـ OpenAI إلى أن نماذج الذكاء الاصطناعي تتوسع بطرق جديدة – لكن التكاليف كذلك أيضًا
” نترككم مع محتوى الخبر
في الشهر الماضي، أخبر مؤسسو ومستثمرو الذكاء الاصطناعي موقع TechCrunch أننا الآن في “العصر الثاني من قوانين التوسع”، مشيرين إلى كيف أن الأساليب الراسخة لتحسين نماذج الذكاء الاصطناعي كانت تظهر عوائد متناقصة. إحدى الطرق الجديدة الواعدة التي اقترحوها للحفاظ على المكاسب هي “قياس وقت الاختبار”، والذي يبدو أنه السبب وراء أداء نموذج O3 الخاص بـ OpenAI – ولكنه يأتي مع عيوب خاصة به.
اعتبر الكثير من عالم الذكاء الاصطناعي الإعلان عن نموذج o3 الخاص بشركة OpenAI كدليل على أن التقدم في توسيع نطاق الذكاء الاصطناعي لم “يصطدم بالحائط”. يعمل نموذج o3 بشكل جيد في المعايير، حيث يتفوق بشكل كبير على جميع النماذج الأخرى في اختبار القدرة العامة المسمى ARC-AGI، ويسجل 25% في اختبار رياضيات صعب لم يسجل أي نموذج ذكاء اصطناعي آخر أكثر من 2%.
بالطبع، نحن في TechCrunch نتعامل مع كل هذا بحذر حتى نتمكن من اختبار o3 بأنفسنا (قليل جدًا من جربه حتى الآن). ولكن حتى قبل إصدار o3، كان عالم الذكاء الاصطناعي مقتنعًا بالفعل بأن شيئًا كبيرًا قد تغير.
أشار Noam Brown، أحد مؤسسي سلسلة نماذج OpenAI، يوم الجمعة إلى أن الشركة الناشئة تعلن عن مكاسب o3 المثيرة للإعجاب بعد ثلاثة أشهر فقط من إعلان الشركة الناشئة عن o1 – وهو إطار زمني قصير نسبيًا لمثل هذه القفزة في الأداء.
وقال براون في تغريدة: “لدينا كل الأسباب للاعتقاد بأن هذا المسار سيستمر”.
قال جاك كلارك، المؤسس المشارك لشركة Anthropic، في تدوينة يوم الاثنين إن o3 دليل على أن التقدم في الذكاء الاصطناعي سيكون أسرع في عام 2025 منه في عام 2024. (ضع في اعتبارك أنه من المفيد لشركة أنثروبيك ــ وخاصة قدرتها على جمع رأس المال ــ الإشارة إلى أن قوانين توسيع نطاق الذكاء الاصطناعي مستمرة، حتى لو كان كلارك مكملاً لمنافس.)
في العام المقبل، يقول كلارك إن عالم الذكاء الاصطناعي سوف يجمع بين قياس وقت الاختبار وأساليب التوسع التقليدية قبل التدريب للحصول على المزيد من العائدات من نماذج الذكاء الاصطناعي. وربما يقترح أن شركة Anthropic وغيرها من موفري نماذج الذكاء الاصطناعي ستطلق نماذج استدلالية خاصة بهم في عام 2025، تمامًا كما فعلت Google في الأسبوع الماضي.
يعني قياس وقت الاختبار أن OpenAI يستخدم المزيد من الحوسبة أثناء مرحلة الاستدلال في ChatGPT، وهي الفترة الزمنية التي تلي الضغط على زر الإدخال في المطالبة. ليس من الواضح بالضبط ما يحدث خلف الكواليس: تستخدم OpenAI إما المزيد من شرائح الكمبيوتر للإجابة على سؤال المستخدم، أو تشغيل شرائح استدلال أكثر قوة، أو تشغيل تلك الشرائح لفترات زمنية أطول – من 10 إلى 15 دقيقة في بعض الحالات – قبل الذكاء الاصطناعي ينتج إجابة. لا نعرف كل التفاصيل المتعلقة بكيفية صنع o3، لكن هذه المعايير هي علامات مبكرة على أن قياس وقت الاختبار قد يعمل على تحسين أداء نماذج الذكاء الاصطناعي.
في حين أن o3 قد يعطي البعض إيمانًا متجددًا بتقدم قوانين توسيع نطاق الذكاء الاصطناعي، فإن أحدث نموذج لـ OpenAI يستخدم أيضًا مستوى حوسبة لم يسبق له مثيل، مما يعني سعرًا أعلى لكل إجابة.
“ربما يكون التحذير المهم الوحيد هنا هو فهم أن أحد الأسباب التي تجعل O3 أفضل بكثير هو أنه يكلف المزيد من المال لتشغيله في وقت الاستدلال – القدرة على استخدام حساب وقت الاختبار تعني أنه في بعض المشكلات يمكنك تحويل الحساب إلى إجابة أفضل “، كتب كلارك في مدونته. “هذا أمر مثير للاهتمام لأنه جعل تكاليف تشغيل أنظمة الذكاء الاصطناعي أقل قابلية للتنبؤ إلى حد ما – في السابق، كان بإمكانك معرفة تكلفة خدمة نموذج توليدي من خلال النظر فقط إلى النموذج وتكلفة توليد مخرجات معينة.”
وأشار كلارك وآخرون إلى أداء شركة o3 على معيار ARC-AGI ــ وهو اختبار صعب يستخدم لتقييم الاختراقات في الذكاء الاصطناعي العام ــ كمؤشر على تقدمها. ومن الجدير بالذكر أن اجتياز هذا الاختبار، بحسب صانعيه، لا يعني نموذج الذكاء الاصطناعي حققت الذكاء الاصطناعي العام، بل هو إحدى الطرق لقياس التقدم نحو الهدف الغامض. ومع ذلك، فقد تجاوز نموذج o3 نتائج جميع نماذج الذكاء الاصطناعي السابقة التي أجرت الاختبار، حيث سجل 88% في إحدى محاولاته. حصل نموذج الذكاء الاصطناعي التالي الأفضل في OpenAI، o1، على 32% فقط.
لكن المحور السيني اللوغاريتمي على هذا الرسم البياني قد يكون مثيرًا للقلق بالنسبة للبعض. استخدم الإصدار عالي الدرجات من o3 أكثر من 1000 دولار من الحوسبة لكل مهمة. استخدمت نماذج o1 حوالي 5 دولارات من الحوسبة لكل مهمة، واستخدمت نماذج o1-mini بضعة سنتات فقط.
كتب منشئ معيار ARC-AGI، فرانسوا شوليه، في إحدى المدونات أن OpenAI استخدمت حوسبة أكثر بنحو 170 مرة للحصول على نتيجة 88%، مقارنة بالإصدار عالي الكفاءة من o3 الذي سجل أقل بنسبة 12% فقط. استخدمت النسخة ذات الدرجات العالية من o3 أكثر من 10000 دولار من الموارد لإكمال الاختبار، مما يجعل المنافسة على جائزة ARC مكلفة للغاية – وهي منافسة لم تهزم لنماذج الذكاء الاصطناعي للتغلب على اختبار ARC.
ومع ذلك، يقول شوليه إن o3 كان لا يزال يمثل إنجازًا كبيرًا في نماذج الذكاء الاصطناعي.
وقال شوليه في المدونة: “إن o3 هو نظام قادر على التكيف مع المهام التي لم يواجهها من قبل، ويمكن القول إنها تقترب من الأداء على المستوى البشري في مجال ARC-AGI”. “بالطبع، تأتي مثل هذه العمومية بتكلفة باهظة، ولن تكون اقتصادية تمامًا بعد: يمكنك أن تدفع لإنسان لحل مهام ARC-AGI مقابل 5 دولارات تقريبًا لكل مهمة (نحن نعلم، لقد فعلنا ذلك)، بينما تستهلك مجرد سنتات”. في الطاقة.”
من السابق لأوانه الحديث عن التسعير الدقيق لكل هذا – فقد شهدنا انخفاض أسعار نماذج الذكاء الاصطناعي في العام الماضي، ولم تعلن OpenAI بعد عن التكلفة الفعلية لـ o3. ومع ذلك، تشير هذه الأسعار إلى مقدار الحوسبة المطلوبة لكسر حواجز الأداء، ولو بشكل طفيف، التي وضعتها نماذج الذكاء الاصطناعي الرائدة اليوم.
وهذا يثير بعض الأسئلة. ما هو O3 في الواقع؟ وما مقدار الحوسبة اللازمة لتحقيق المزيد من المكاسب حول الاستدلال باستخدام o4 أو o5 أو أي شيء آخر تسميه OpenAI نماذج الاستدلال التالية؟
لا يبدو أن o3، أو من يخلفه، سيكون “السائق اليومي” لأي شخص مثل GPT-4o أو بحث Google. تستخدم هذه النماذج الكثير من الحوسبة للإجابة على الأسئلة الصغيرة طوال يومك، مثل “كيف يمكن لفريق كليفلاند براونز الاستمرار في التصفيات المؤهلة لعام 2024؟”
بدلاً من ذلك، يبدو أن نماذج الذكاء الاصطناعي ذات الحوسبة المتدرجة في وقت الاختبار قد تكون مفيدة فقط لمطالبات الصورة الكبيرة مثل، “كيف يمكن أن يصبح فريق كليفلاند براونز أحد امتيازات Super Bowl في عام 2027؟” وحتى مع ذلك، ربما لا يستحق الأمر تكاليف الحوسبة المرتفعة إلا إذا كنت المدير العام لشركة Cleveland Browns، وكنت تستخدم هذه الأدوات لاتخاذ بعض القرارات الكبيرة.
قد تكون المؤسسات ذات الموارد المالية الكبيرة هي الوحيدة التي يمكنها تحمل تكاليف o3، على الأقل للبدء، كما لاحظ البروفيسور في وارتن إيثان موليك في تغريدة له.
لقد رأينا بالفعل إطلاق OpenAI لمستوى 200 دولار لاستخدام إصدار عالي الحوسبة من o1، ولكن يقال إن الشركة الناشئة قد فكرت في إنشاء خطط اشتراك بتكلفة تصل إلى 2000 دولار. عندما ترى مقدار استخدامات الحوسبة o3، يمكنك أن تفهم سبب تفكير OpenAI في ذلك.
ولكن هناك عيوب لاستخدام o3 للعمل عالي التأثير. كما لاحظ شوليه، فإن o3 ليس الذكاء الاصطناعي العام، ولا يزال يفشل في بعض المهام السهلة جدًا التي يمكن للإنسان القيام بها بسهولة تامة.
هذا ليس مفاجئًا بالضرورة، حيث أن النماذج اللغوية الكبيرة لا تزال تعاني من مشكلة الهلوسة الضخمة، والتي يبدو أن o3 وحساب وقت الاختبار لم يحلاها. ولهذا السبب يقوم ChatGPT وGemini بتضمين إخلاء المسؤولية أسفل كل إجابة يقدمونها، ويطلبون من المستخدمين عدم الثقة في الإجابات في ظاهرها. من المفترض أن الذكاء الاصطناعي العام، في حالة الوصول إليه، لن يحتاج إلى مثل هذا إخلاء المسؤولية.
إحدى الطرق لتحقيق المزيد من المكاسب في توسيع نطاق وقت الاختبار يمكن أن تكون رقائق استدلال أفضل للذكاء الاصطناعي. لا يوجد نقص في الشركات الناشئة التي تعالج هذا الأمر فقط، مثل Groq أو Cerebras، في حين تقوم شركات ناشئة أخرى بتصميم شرائح ذكاء اصطناعي أكثر فعالية من حيث التكلفة، مثل MatX. صرح أندريسن هورويتز، الشريك العام أنجني ميدها، لـ TechCrunch سابقًا أنه يتوقع أن تلعب هذه الشركات الناشئة دورًا أكبر في توسيع نطاق وقت الاختبار للمضي قدمًا.
على الرغم من أن o3 يعد تحسنًا ملحوظًا في أداء نماذج الذكاء الاصطناعي، إلا أنه يثير العديد من الأسئلة الجديدة حول الاستخدام والتكاليف. ومع ذلك، فإن أداء o3 يضيف مصداقية إلى الادعاء بأن حوسبة وقت الاختبار هي الطريقة الأفضل التالية لصناعة التكنولوجيا لتوسيع نطاق نماذج الذكاء الاصطناعي.
نشكركم على قراءة الخبر على اشراق 24. اشترك معنا في النشرة الإخبارية لتلقي الجديد كل لحظة.
اقرأ على الموقع الرسمي
روابط قد تهمك
مؤسسة اشراق العالم خدمات المواقع والمتاجر باك لينكات باقات الباك لينك
اكتشاف المزيد من اشراق العالم 24
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.