تفوق نظام الذكاء الاصطناعي من جوجل على البشر في الألعاب المتعددة اللاعبين، وذلك بعد أن بدأت شركة DeepMind البريطانية المملوكة لشركة جوجل المتخصصة في مجال الذكاء الاصطناعي في التعامل مع فئة الألعاب المتعددة اللاعبين التي تتطلب عملًا جماعيًا.
وأصبحت أنظمة الذكاء الاصطناعي قادرة على هزيمة البشر في الألعاب الفردية، مثل لعبة الشطرنج، بعد أن تغلب نظام ديب بلو Deep Blue على بطل العالم في الشطرنج غاري كاسباروف ثلاث مرات واتهم كاسباروف الشركة المصنعة للنظام IBM بالغش وطالب بمباراة انتقام ، ولكن شركة IBM رفضت و قامت بتفكيك ديب بلو , وتغلب نظام جوجل للذكاء الاصطناعي في عام 2017 على اللاعب الأول في العالم في لعبة Go.
وكانت الألعاب المتعددة اللاعبين تشكل مهمة صعبة بالنسبة للذكاء الاصطناعي؛ بسبب الحاجة إلى العمل الجماعي، والتفاعل في بيئات معقدة.
كيف تم تصميم وتدريب نظام الذكاء الاصطناعي للألعاب الممتعددة؟
وفصلت مجموعة من الباحثين في شركة DeepMind – عبر ورقة بحثية نشرتها مجلة Science كيفية تصميم نظام الذكاء الاصطناعي القادر على إتقان مرحلة التقاط العلم Capture the Flag في لعبة Quake III، حيث استخدم النظام وكلاء ذكاء اصطناعي – علموا أنفسهم كيف يلعبون اللعبة – لتمثيل اللاعبين في اللعبة، واللعب مع الخصوم البشريين أو ضدهم.
وجرى تدريب وكلاء الذكاء الاصطناعي من خلال 450 ألف جولة من جولات التقاط العلم، وعلى الرغم من حاجة العنصر البشري إلى زهاء أربع سنوات من اللعب لإكمال 450 ألف جولة من جولات التقاط العلم، إلا أن الذكاء الاصطناعي أكمل الجولات خلال بضعة أسابيع.
تجربة الفريق مع اللعبة :
وعمل فريق الباحثين بقيادة ماكس جادربرج Max Jaderberg على نسخة معدلة من لعبة Quake III Arena، وهي لعبة إطلاق نار، صدرت لأول مرة في عام 1999، لكنها استمرت في الازدهار في عالم الرياضات الإلكترونية.
وكانت المرحلة التي اختاروها مرحلة التقاط العلم Capture the Flag، والتي تتضمن العمل الجماعي مع باقي الفريق؛ للحصول على علم الفريق الخصم، مع حماية علمك، مما يجبر اللاعبين على وضع إستراتيجيات معقدة، تجمع بين العدوان والدفاع.
وكتب فريق الباحثين: لم يتمكن الفريق البشري – بعد 12 ساعة من التدريب – من الفوز إلا بنسبة 25 في المئة من المباريات ضد فريق الذكاء الاصطناعي، وظل أداء وكلاء الذكاء الاصطناعي متفوقًا حتى عندما تباطأت أوقات رد فعلهم بشكل مصطنع إلى مستويات بشرية.
كيف يتم تطوير خوارزميات الذكاء الاصطناعي؟
وكان عملاء الذكاء الاصطناعي يتحركون حركات عشوائية في البداية، لكن بعد اللعب مرارًا وتكرارًا، اكتشفوا في النهاية الإستراتيجيات والتقنيات، واستخدم الفريق الألعاب – مثل مرحلة التقاط العلم – كبيئات صعبة لاستكشاف المفاهيم العامة، مثل التخطيط، والإستراتيجية، والذاكرة، والتي يعتقد أنها ضرورية لتطوير الخوارزميات، التي يمكن استخدامها للمساعدة في حل مشكلات العالم الحقيقي.
ويذكر أن تقنيات الذكاء الاصطناعي تعتمد في أساس عملها على الشبكة العصبية الاصطناعية Artificial Neural Network حيث يتم تدريب الخلية الاصطناعية عن طريق ضرب عدة أوزان مع متغيرات مدخلة من أجل تقوية الخلية وتدريبها على التذكر .