فشل GPT-5 في اختبار الضجيج.

في الأسبوع الماضي في يوم إطلاق GPT-5 AI Hype ، في جميع الأوقات.
في المؤتمر الصحفي السابق ، قال الرئيس التنفيذي لشركة Sam Altman Openai إن GPT-5 هو “ما لا أريد العودة من” حدث مهم يشبه أول جهاز iPhone مع شاشة شبكية العين. الليلة الماضية قبل الإعلان عن lvestream ، Altman بريد خلقت صورة نجم الموت المزيد من الضجيج على X ، مستخدم واحد. يكتب التوقعات “تشعر وكأنها عشية عيد الميلاد” ، كل عين في ChatGpt ، بينما ينتظر الأشخاص في الصناعة لمعرفة ما إذا كانت العلاقات العامة سترسل أم لا تخيب أم لا. ومع غالبية الحسابات ، ستكون الكشف الكبير أقصر
تم إنشاء Hype بالنسبة للنموذج الجديد القادم لـ Openai لسنوات عديدة منذ إطلاق GPT-4 في عام 2023 في Reddit AMA و Altman وموظفين في أكتوبر. يسأل المستخدمون باستمرار عن GPT-5. تبحث عن تفاصيل حول ميزاته والأشياء التي ستنفصل عن Redditor. أجاب Altman أن الحساب هو قيود و “كل هذه النماذج معقدة للغاية ولا يمكننا تقديم العديد من الأشياء كما نريد”.
ولكن عندما ظهر GPT-5 في ChatGPT ، لم يكن معظم المستخدمين معجبين. التقدم الكبير الذي يتوقعون أن يزيد معظمهم والأرباح المهمة للنموذج في المنطقة مثل التكاليف والسرعة. ومع ذلك ، على المدى الطويل ، قد يكون رهانًا ماليًا قويًا لـ Openai – حتى لو كان أقل براقة.
يتوقع الناس عالم GPT-5 (مستخدم واحد X بريد بعد نشر نجم الموت في Altman “الجميع غير توقعاتهم”) ولم يعلق Openai على تلك الآراء. استدعاء GPT-5 “أفضل نظام الذكاء الاصطناعى” و “القفز الكبير في الذكاء” له “كفاءة حديثة في التشفير الرياضي ، والكتابة الصحية ، وغيرها ،” قال التمان في مؤتمر صحفي إن الدردشة مع النموذج “تبدو وكأنها تتحدث إلى خبراء الدكتوراه”.
تم إنشاء الإعلان لفرق تمامًا مع الحقيقة. النماذج ذات مستويات ذكاء الدكتوراه ، على سبيل المثال يكرر هناك ثلاثة “B’s” في كلمة العنبية ، كما وجد بعض مستخدمي وسائل التواصل الاجتماعي؟ وسوف غير قادر على تحديد كم عدد أسماء الدولة “R”؟ هو – هي تسمية غير صحيحة خريطة الولايات المتحدة ، إلى جانب الدولة التي تم إنشاؤها ، بما في ذلك “New Jefst” “Micann” “New Nakamia” “Krizona” و “Mirinia” و The Label Nevada هو امتداد كاليفورنيا؟ وجد الأشخاص الذين يستخدمون الروبوتات للحصول على الدعم العاطفي أن النظام الجديد صارم وبعيد. الاحتجاج مشهور جدًا لدرجة أن Open قد أعاد الدعم للنموذج القديم إلى العديد – واحد. رسم GPT-4 و GPT-4O هي تنانين هائلة مع GPT-5. بجانبهم سهلة.
محكمة خبراء الرأي العام يغفرون أيضا. غاري ماركوس ، كبار الموسيقيين في الذكاء الاصطناعي والأساتذة النفسيين في جامعة نيويورك. يسمى النموذج “على المفرطة المفرطة وتغلب عليها.” بيتر وايلدفورد ، مؤسس سياسة واستراتيجية الذكاء الاصطناعي. يكتب في مراجعته. “هذا حادث كبير نبحث عنه أم لا. لسوء الحظ.” Zvi Mowshowitz ، المدون الصناعي من الذكاء الاصطناعي. نسميها “النموذج جيد ولكنه ليس جيدًا.” واحد Redditor رسميا في GPT-5 Reddit AMA. يكتب، “قال أحدهم أن سام 5 هو القمامة الساخنة”
في اليوم التالي ، بعد إطلاق GPT-5 ، فإن هجوم النقد غير المثير للإعجاب قد انزعج قليلاً. أنا إجماع شائع ، على الرغم من أن GPT-5 ليس بنفس أهمية الناس. لكن تقديم ترقيات بسعر وسرعة ، بما في ذلك الهلوسة أقل ونظام التبديل الذي يتم تقديمه إلى Altman تلقائيًا إلى تلك القصة. كتابة“GPT-5 هو أذكى إصدار قمنا به على الإطلاق. لكن الشيء المهم الذي ندفعه هو الأداة المساعدة في العالم الحقيقي والكثير من الوصول/القدرة على الدفع”
باحثين أوباي كريستينا كيم بريد مع GPT-5 ، “القصة الحقيقية هي الفائدة. إنها تساعد على ما يهتم به الناس رمز الكتابة الإبداعية وجلب المعلومات الصحية مع استقرار واحتكاك أقل ، ونحن نقوم أيضًا بقطع الهلوسة.
من المفهوم على نطاق واسع أنه من أجل أن تكون واضحة ، قام GPT-5 بمحادثة أقل. بعد وسائل التواصل الاجتماعي ، يشكو فيروس من أن الأسلوب الجديد يفتقر إلى الاختلافات وعمق كتابته في الروبوتات والبرد. حتى في وسائط التسويق GPT-5 ، المقارنة جنبًا إلى جنب مع GPT-4O و GPT-5 التي تم إنشاؤها بواسطة جانب Openai ، يبدو أنها لا تكون نصرًا للنموذج الجديد عند Altman. اسأل redditors إذا اعتقدوا أن GPT-5 أفضل في الكتابة ، فإنهم يجدون هجوم الآراء التي تحمي نماذج GPT-4O المتقاعدة بدلاً من ذلك ؛ في غضون يوم واحد ، سيقبل الضغط ويعود على الأقل إلى ChatGPT المؤقت.
ولكن هناك واجهة واحدة يبدو أن النموذج مضاءة: تشفير لمرة واحدة لـ GPT-5 قمم الحالية سيأتي القائد الأكثر شعبية من الذكاء الاصطناعي في فئة التشفير من قبل الأنثروبولوجيا كلود في ثوان. يُظهر ترويج انطلاق Openai لعبة AI (لعبة كرة صغيرة وسرعة طباعة مسابقة للطباعة) أدوات خلايا الخنازير ونماذج DRUM و LOFI Visualizer عندما أحاول أن أشعر بلعبة الغموض مع الكثير من العيوب. لكنني نجحت في مشاريع أسهل ، مثل دروس التطريز التفاعلية.
هذا انتصار كبير لـ Openai لأنه يتجه إلى حرب الذكاء الاصطناعي والمنافسين ، مثل الأنثروبولوجيا وجوجل وغيرها لفترة طويلة. يسعد العمل باستخدام الكثير من المال لتشفير الذكاء الاصطناعي وهذا واحد من أكثر مولدات الدخل واقعية لبدء الذكاء الاصطناعي بالنقد.
يؤكد Openai أيضًا على شجاعة GPT-5 في الرعاية الصحية. لكن معظمهم لم يختبروا في الممارسة العملية ، يجب ألا يعرفوا مدى نجاحها
المعايير القياسية لمنظمة العفو الدولية لها معنى أقل في السنوات القليلة الماضية ، حيث تغيرت بشكل متكرر وبعض الشركات التي اختارت ، مما يؤدي إلى الكشف عنها. لكن بشكل عام ، قد يعطيون صورة معقولة لنماذج GPT-5 ، هذا النموذج أفضل من النماذج السابقة في العديد من الاختبارات الصناعية. لكن التحسن ليس شيئًا للكتابة في المنزل هو Wildford وضعه“عند الحديث عن التقييم الرسمي ، يبدو أن GPT-5 من المرجح أن تتوقع-أكثر من ذلك بقليل مما يستحق Mesde الغامض.”
ولكن إذا كان التاريخ مؤخرًا ، فهناك أي شيء يمكن قوله حول هذا الأمر ، والذي قد يكون من المرجح أن تترجم الزيادة والزيادة قليلاً إلى أرباح ملموسة من المستهلكين الأفراد. تعرف شركة الذكاء الاصطناعى أن أكبر قنوات لجني الأموال هي منظمات حكومية ووعودها والحكومة والمعايير المتزايدة ، وكذلك الاستثمار في التشفير والهلوسة.