جي بي تي 4 يفشل في تقليد البشر رغم تطوره
على الرغم من أن “شات جي بي تي” يبدو ذكيًا بشكل واضح في المحادثات، ويعزز هذا الانطباع من خلال استخدامه للفكاهة ومحاكاة عبارات المراهقين واجتياز امتحانات بعض الكليات، فإنه في بعض الأحيان يظهر كما لو كان يعاني من اضطرابات، حيث يكون النص المكتوب صحيحًا لغويًا ونحويًا ولكنه غير منطقي. هذا الأمر جعل بعض الناس يشككون في قدرة الآلة، مهما بلغ من التطور، على محاكاة الإنسان بشكل كامل.
لتقييم “شات جي بي تي” بشكل علمي وقاطع، وللتأكد مما إذا كان يمكنه الوصول إلى النقطة التي يصبح فيها صعبًا تمييزه عن الإنسان، أجرى الباحثان المتخصصان في اللغة وعلم الدلالة والتعلم الآلي بجامعة كاليفورنيا في سان دييغو، كاميرون جونز وبنجامين بيرغن، اختبارًا معدلًا من اختبار تورينغ، باستخدام النسخة الأحدث من “شات جي بي تي”، المعروفة باسم “جي بي تي 4”.
اقترح العالم البريطاني آلان تورينغ هذا الاختبار في عام 1950، بهدف تقدير قدرة الآلات على التفكير، حيث يتم تقييم قدرة الآلة على تقديم استجابات تشبه استجابات الإنسان بدرجة لا يمكن التفريق بينهما بسهولة. الاختبار يعتمد على محادثات لغوية بين الإنسان والآلة، حيث يُطلب من شخص ما التمييز بينهما دون معرفة هوية الطرف الآخر، وإذا فشل الشخص في ذلك، فإن الآلة تعتبر ناجحة في اجتياز الاختبار.
وجاءت نتائج الدراسة التي نُشرت على موقع “أرخايف”، حيث أظهرت أن “جي بي تي 4” لم تتمكن من اجتياز الاختبار بنجاح. رغم أن الآلة تمكنت من خداع المشاركين بنسبة 41%، إلا أن هذه النسبة لا تعتبر كافية لتأكيد نجاحها في اجتياز الاختبار بشكل كامل.
يُعتبر الاختبار تحديًا للآلات، حيث يجب عليها تقليد سلوك الإنسان بشكل دقيق، بما في ذلك الشخصية والمعرفة والتفكير والروح الدعابة. وعلى الرغم من أن هذا التقليد يمكن أن يتحقق بشكل جزئي، إلا أن هناك بعض الصعوبات التي تواجه الآلات في التفاعل الاجتماعي بشكل متماثل للإنسان، مثل عدم قدرتها على متابعة الأحداث الجارية بشكل فعّال أو تقديم الشخصية البشرية بشكل كامل.
يشير الباحثون إلى أن هذه المشكلات قابلة للحل، وأن الأنظمة الحالية والمستقبلية للذكاء الاصطناعي قد تتمكن من اجتياز الاختبار إذا تم تحسين البرمجيات للتعامل مع تلك الصعوبات. إذا أردنا استخدام اختبار تورينغ كمعيار لقياس التفاعل الاجتماعي ومستوى الذكاء الاصطناعي، فيجب علينا مراعاة هذه الصعوبات والعمل على تطوير الأنظمة بما يجعلها قادرة على التفاعل بشكل أكثر تماثلًا للإنسان.
بالإضافة إلى ذلك، يتعين علينا أيضًا أن نتناول بعض النقاط الأخرى المهمة التي تم رصدها خلال الدراسة، والتي تلقى الضوء على الفروقات بين البشر والنماذج الذكاء الاصطناعي، ومنها:
- القدرة على الوصول إلى الأحداث الجارية: الإنسان يمتلك القدرة على فهم السياق الاجتماعي والسياسي والثقافي المحيط به، وهذا يساعده على تقديم ردود أفعال مناسبة ومتناسبة مع الظروف الحالية. بينما النماذج الذكاء الاصطناعي قد تجد صعوبة في تحليل الأحداث الجديدة وتكوين استجابات ملائمة لها.
- الشخصية البشرية: يعتمد التفاعل الاجتماعي بين البشر على الشخصية والعواطف والميول الشخصية، وهذا يمنح الحوار الإنساني عمقًا وتنوعًا يصعب تقليده بواسطة الذكاء الاصطناعي.
- أسلوب اللغة: يميل الإنسان إلى استخدام لغة غنية بالتعابير والمفردات المتنوعة، بينما قد يكون استخدام الذكاء الاصطناعي للغة أكثر رسمية أو جدية، مما قد يؤثر على طبيعة المحادثة ويجعلها تبدو أقل طبيعية.
على الرغم من أن هذه التحفظات قد تكون موجودة، إلا أن استخدام اختبار تورينغ لا يزال له أهمية كبيرة في تقدير قدرة الذكاء الاصطناعي على التفاعل الاجتماعي وتقليد سلوك الإنسان. ومع التطور المستمر في مجال الذكاء الاصطناعي والبرمجيات المتقدمة، يمكننا توقع أن تزداد قدرة الأنظمة الذكية على محاكاة الإنسان بشكل أفضل، مما يعزز استخدام اختبار تورينغ كأداة لتقييم التطورات في هذا المجال.