LLMS و AI ليست هي نفسها. ما وراء قوارب الدردشة التي يجب أن تعرفها عن كل شيء

هناك إمكانيات ، لقد سمعت عن مصطلح “نموذج اللغة الكبيرة” أو LLM ، عندما يتحدث الناس عن A. ولكنهم لا يعادلون تمامًا الدردشة GPT و Google Gemini و Microsoft Coptroot و Metaai و Metaai و Anthropic Class Chat.

يمكن أن تنتج قوارب الدردشة من الذكاء الاصطناعي نتائج رائعة ، لكنها لا تفهم حقًا معنى الكلمات كما نفعل. بدلاً من ذلك ، فهي الواجهات التي نستخدمها للتفاعل مع نماذج اللغة الكبيرة. يتم تدريب هذه التقنيات الأساسية على إدراك كيفية استخدام الكلمات والكلمات التي غالباً ما تُرى معًا ، بحيث يمكنها التنبؤ بالكلمات أو الجمل أو الفقرات المستقبلية. فهم كيف يعمل الذكاء الاصطناعي كيف تعمل LLMS. وبما أن الذكاء الاصطناعي يصبح سريعًا في تجاربنا اليومية عبر الإنترنت ، يجب أن تعرف.

هذا كل ما يجب معرفته عن LLM وماذا تفعل مع الذكاء الاصطناعي.

ما هو نموذج اللغة؟

يمكنك التفكير في نموذج لغة للكلمات.

وقال مارك ريدل ، أستاذ في كلية جورجيا للتكنولوجيا الحوسبة التفاعلية: “عينة اللغة هي شيء يحاول التنبؤ باللغة التي يولدها الإنسان”. “ما الذي يجعل نموذج اللغة هو ما إذا كان يمكن أن يتنبأ بالكلمات المستقبلية في ضوء الكلمات السابقة.”

عندما تقوم بالرسائل النصية ، بالإضافة إلى قوارب الدردشة من الذكاء الاصطناعي هي أيضًا أساس الوظائف المستقلة.

ما هو نموذج كبير للغة؟

يحتوي نموذج اللغة الكبير على كلمات واسعة النطاق من صف واسع من المصادر. يتم قياس هذه النماذج في ما يسمى “المعلمات”.

إذن ، ما هي المعلمة؟

حسنًا ، تستخدم LLM شبكة الأعصاب ، وهي نموذج تعلم آلي يأخذ إدخالًا ويقوم بحسابات رياضية لإنتاج الإخراج. عدد المتغيرات في هذه التهم هو المعلمات. يمكن أن يحتوي نموذج اللغة الكبيرة على مليار معلمة أو أكثر.

“نحن نعلم أنه عندما ينتجون فقرة كاملة من نص السوائل المدمج ، فإنها تكبر”.

كيف تتعلم نماذج اللغة الكبيرة؟

LLMS تعلم من خلال عملية منظمة العفو الدولية الأساسية تسمى التعلم العميق.

وقال جيسون آلان سنايدر ، سرعة وكالة الإعلان العالمية: “هذا كثير جدًا عندما تقوم بتدريس طفل – أنت تظهر العديد من الأمثلة”.

بمعنى آخر ، لدى LLM مكتبة من المحتوى (المعروفة باسم بيانات التدريب) مثل الكتب والمقالات والرموز ووسائل التواصل الاجتماعي للمساعدة في فهم كيفية استخدام الكلمات في سياقات مختلفة ، وحتى فروق غنية أكثر دقة. أساليب جمع البيانات والتدريب لشركات الذكاء الاصطناعي هي موضوع بعض النزاعات وبعض التقنين. زعم الناشرون ، مثل صحيفة نيويورك تايمز ، والفنانين وغيرهم من مالكي كتالوج المحتوى ، أن شركات التكنولوجيا قد استخدمت محتوى حقوقها دون إذن.

۔

نماذج الذكاء الاصطناعى هضم أكثر من شخص لا يمكن أن يقرأ في حياته – شيء عن أوامر تريليونات من الرموز. تساعد الرموز في كسر نموذج الذكاء الاصطناعى واتخاذ الإجراءات على النص. يمكنك التفكير في نموذج الذكاء الاصطناعي كقارئ يحتاج إلى مساعدة. يكسر النموذج عبارة في القطع الصغيرة ، أو الرمز المميز الذي يساوي أربعة أحرف باللغة الإنجليزية ، أو حوالي ثلاثة أرباع كلمة-يمكن أن يفهم كل قطعة ثم المعنى العام.

من هناك ، يمكن لـ LLM تحليل كيفية دمج الكلمات وتحديد الكلمات التي تظهر في كثير من الأحيان معًا.

قال سنايدر ، “هذا يعادل بناء هذه الخريطة الكبيرة للكلمات.” وبعد ذلك يبدأ في أن يكون قادرًا على القيام بالمرح حقًا ، ويتوقع ما هي الكلمة التالية … وهي تقارن التنبؤ مع الكلمة الأصلية في الشكل ويتكيف مع الدقة.

هذا التنبؤ والتعديل هو مليارات المرات ، وبالتالي فإن LLM تعمل بشكل دائم على تحسين فهمها للغة وتتحسن في تحديد العينات والتنبؤ بالكلمات المستقبلية. حتى يمكنك تعلم الأفكار والحقائق من البيانات للإجابة على الأسئلة وإنشاء أشكال نصية إبداعية وترجمة اللغات. لكنهم لا يفهمون معنى الكلمات كما نفعل – يعلمون جميعًا أن البيانات هي العلاقة.

تتعلم LLMS أيضًا تحسين رد فعلهم من خلال التعلم من الانطباع البشري.

وقال مارتن ساب ، أستاذ مساعد في معهد تقنيات اللغة بجامعة كارنيجي ميلنيون: “تتلقى قرارًا أو تفضيلًا من قبل البشر ، والذي كان من الأفضل إعطاؤه للبشر”. “ثم يمكنك تعليم النموذج لتحسين استجابته.”

الشخص يقوم بسحب دماغ ثلاثي الأبعاد يسبح فيه AI و LLM حوله

LLMs جيدة في التعامل مع بعض المهام ولكن ليس غيرها.

ألكساندر سكايوف/iStock/Getty Images Plus

ماذا تفعل النماذج الكبيرة من اللغة؟

تقديم سلسلة من كلمات الإدخال ، سوف تتنبأ LLM بالكلمة التالية.

على سبيل المثال ، فكر في هذه العبارة ، “لقد سافرت على أزرق عميق …”

من المحتمل أن يقدر معظم الناس “البحر” لأن هناك كل كلمات الإبحار ، عميقة وأزرق نربطها بالبحر. بمعنى آخر ، تحدد كل كلمة سياق ما يجب أن يحدث بعد ذلك.

وقال ريدل: “هذا النموذج الكبير للغة ، لأن لديهم العديد من المعلمات ، يمكنه تخزين العديد من العينات”. “إنهم جيدون حقًا في اختيار هذه القرائن والتقدم إلى الأمام ، جيد حقًا في أن تكون جيدًا في تقديرات CUS.”

ما هي أنواع نماذج اللغة المختلفة؟

ربما تكون قد سمعت عن العقل الصغير والمنطق والمصدر المفتوح/المصدر/الفتحة. بعض هذه النماذج متعددة الوسائط ، مما يعني أنها مدربة ليس فقط على النص ولكن أيضًا على الصور ومقاطع الفيديو والصوت. إنها جميع نماذج اللغة وتؤدي نفس الشيء ، ولكن هناك بعض الاختلافات الرئيسية التي يجب أن تعرفها.

هل هناك أي شيء يشبه نموذج اللغة الصغيرة؟

نعم ، قدمت شركات التكنولوجيا مثل Microsoft نماذج صغيرة مصممة لتشغيل “On Device” ولا تتطلب موارد الحوسبة التي تقوم بها LLM ، ولكن مع ذلك يساعد المستخدمين على النقر على قوة A.

ما هي نماذج حجة الذكاء الاصطناعي؟

نماذج الحجة هي نوع من LLM. تنظر هذه النماذج إلى الستار في قطار التفكير في حذاء الدردشة ، والإجابة على أسئلتك. إذا كنت قد استخدمت صندوق دردشة AI الصيني ، DeSsek ، فقد تكون قد رأيت هذه العملية.

ولكن ماذا عن نموذج المصدر المفتوح والمفتوح البيض؟

لا يزال ، LLMS! تم تصميم هذه النماذج لتكون أكثر شفافية قليلاً حول كيفية عملها. تسمح نماذج المصدر المفتوح لأي شخص برؤية كيفية صنع النموذج ، وعادةً ما يكون متاحًا لأي شخص لتخصيصه وجعله. توفر لنا نماذج البيض المفتوحة بعض الأفكار حول كيفية وزن النموذج لميزات محددة عند اتخاذ القرارات.

ما هي أكبر نماذج اللغة أفضل حقًا؟

LLMS جيدة جدًا في اكتشاف وإنتاج النصوص بين الكلمات التي تبدو طبيعية.

“إنهم يأخذون مدخلات ، والتي يمكن أن تكون في كثير من الأحيان مزيجًا من التعليمات ، مثل” افعلها من أجلي “، أو” أخبرني عنها “، أو” تلخيصها “، وتكون قادرة على إزالة هذه الأنماط من المدخلات وإنتاج سلك طويل من استجابة السوائل.

ولكن هناك العديد من نقاط الضعف.

أين تكافح نماذج اللغة الكبيرة؟

أولاً ، ليسوا جيدين في قول الحقيقة. في الواقع ، فإنهم في بعض الأحيان يصنعون الأشياء التي تبدو صحيحة فقط ، مثل الدردشة GPT أشار إلى ست حالات من المحكمة المزيفة في أي قصور قانوني أو عندما يكون طائر Google (سلف Jemini) الائتمان عن طريق الخطأ تلسكوب جيمس ويب مع الصور الأولى لكوكب خارج نظامنا الشمسي. يُعرف باسم الخداع.

قال SAP: “إنهم لا يصدقون للغاية أنهم يعملون كثيرًا ويجعلون الأمور كثيرًا”. “إنهم لا يتدربون أو يصممون أي شيء لبصق أي شيء.”

كما أنهم يكافحون مع الأسئلة التي تختلف بشكل أساسي عن أي شيء واجهوه. والسبب في ذلك هو أنهم يركزون على إيجاد العينات والرد عليها.

مثال جيد هو مشكلة رياضية مع مجموعة فريدة من الأرقام.

وقال ريدل: “قد لا يكون بإمكانه القيام بهذا الحساب بشكل صحيح لأنه لا يحل الرياضيات حقًا”. “إنها تحاول ربط سؤالك الرياضي بأمثلة سابقة للأسئلة الرياضية التي شاهدها سابقًا.”

على الرغم من أنهم يأخذون زمام المبادرة في التنبؤ بالكلمات ، إلا أنها ليست جيدة في التنبؤ بالمستقبل ، بما في ذلك التخطيط واتخاذ القرارات.

“فكرة التخطيط بهذه الطريقة التي يعمل بها الشخص … التفكير في حالات الطوارئ والبدائل المختلفة ، واختيار الاختيار ، يبدو أنها كتلة طريق صعبة حقًا لنماذج لغتنا الرئيسية الحالية في الوقت الحالي.”

أخيرًا ، إنهم يعانون من الأحداث الجارية لأن بيانات التدريب الخاصة بهم عادة ما تكون فقط في وقت معين ، ولا يوجد شيء يحدث جزء من معرفتهم. نظرًا لأنها صحيحة حقًا وليس لديها القدرة على التمييز بين ما هو محتمل ، يمكنهم توفير معلومات مضللة حول الأحداث الجارية بثقة.

إنهم لا يتحدثون حتى مع العالم كما نفعل.

“من الصعب عليهم فهم الفروق الدقيقة ومضاعفات الأحداث الجارية ، والتي تتطلب في كثير من الأحيان فهم السياق والديناميات الاجتماعية وعواقب العالم الحقيقي” ، “

كيف ترتبط LLM بمحركات البحث؟

نرى أن إمكانيات الاسترداد يتم تطويرها لتدريب هذه النماذج ، بما في ذلك توصيل محركات البحث مثل Google بحيث يمكن للموديلات إجراء بحث على شبكة الإنترنت ثم فتح هذه النتائج في LLM. هذا يعني أنه يمكنهم فهم الأسئلة بشكل أفضل وتوفير ردود فعل أكثر في الوقت المناسب.

وقال ريدل: “من المفيد أن تظل حاليًا وأحدث ما هو نموذج علاقتنا ، لأنهم في الواقع يمكنهم في الواقع رؤية المعلومات الجديدة على الإنترنت وتقديمها على الإنترنت”.

على سبيل المثال ، كان الهدف هو الحصول على فترة قصيرة مع الانفجار القوي. بدلاً من التسجيل في محركات البحث لزيادة ردك ، نظرت Microsoft إلى الذكاء الاصطناعي لتحسين محرك البحث الخاص بها ، وهي جزء من أسئلة المستهلك لفهم المعنى الحقيقي بشكل أفضل وتحسين نتائج الأسئلة. في شهر نوفمبر الماضي ، تم البحث عن دردشة GPT التي تم تقديمها مع الوصول إلى بعض ناشري الأخبار.

ولكن هناك مصيد. يمكن أن تتسبب مساحة مساحة البحث على الويب في إلحاق الضرر بالاحتيال دون آلية التحقق من الحقائق المناسبة. ستحتاج LLMS إلى تعلم كيفية تقييم موثوقيتها قبل الإشارة إلى مصادر الويب. تعلمت Google أن الطريقة الصعبة مع نتائج بحث مراجعة الذكاء الاصطناعي هي طريقة صعبة. قامت شركة البحث بعد ذلك بتحسين نتائج مراجعة الذكاء الاصطناعي لتقليل ملخص مضللة أو محتمل خطير. لكن حتى التقارير الحديثة وجدت أن مراجعات الذكاء الاصطناعى قد لا تخبرك بشكل دائم أي سنة هذا.

لمعرفة المزيد ، انظر إلى قائمة ملحقات الخبراء الخاصة بنا وأفضل قوارب الدردشة لعام 2025.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى