الذكاء الاصطناعي العميق. اختبرت جوجل الذكاء الاصطناعي DeepMind في معضلة السجين


قدم باحثو Google Deepmind نوعًا جديدًا من نظام الذكاء الاصطناعي، وهو ما يسمى بالكمبيوتر العصبي القابل للتمايز، DNC. يجمع النظام بين القدرة على التعلم للشبكات العصبية والقدرات الاستنتاجية للذكاء الاصطناعي التقليدي. تم نشر وصفها في المجلة طبيعة، عمل جديد مخصص في نفس العدد من المجلة، رواية مختصرةيمكن قراءة العمل على مدونة Deepmind.

أبسط الشبكات العصبية هي نظام التنبؤ والانحدار، وتتمثل مهمتها في مقارنة إجابة معينة بالبيانات المدخلة. على سبيل المثال، يمكن لشبكة عصبية بسيطة التعرف على الشخصيات بناءً على صورها. وبهذا المعنى، يمكن اعتبار الشبكة العصبية بمثابة وظيفة رياضية، ووظيفة قابلة للتفاضل. إن تدريب شبكة عصبية على مثل هذا النموذج يعني تحسين هذه الوظيفة باستخدام الأساليب الرياضية القياسية (يمكنك قراءة شرح يسهل الوصول إليه لكيفية حدوث التدريب).

تعد القدرة على التعلم من البيانات دون برمجة بشرية مباشرة هي الميزة الرئيسية للشبكات العصبية. ومع ذلك، فإن أبسط الشبكات العصبية ليست كاملة تورينج، أي أنها لا تستطيع القيام بذلك الجميعتلك الأشياء التي تستطيع البرامج الخوارزمية التقليدية القيام بها (ومع ذلك، هذا لا يعني أنها لا تستطيع القيام بها). بعضمن هذه الأشياء أفضل من البرامج). أحد أسباب ذلك هو نقص الذاكرة في الشبكات العصبية، والتي يمكن استخدامها للعمل على بيانات الإدخال وتخزين المتغيرات المحلية.

في الآونة الأخيرة نسبيا، ظهر نوع أكثر تعقيدا من الشبكات العصبية التي تم فيها القضاء على هذا العيب - ما يسمى بالشبكات العصبية المتكررة. فهي لا تقوم فقط بتخزين معلومات حول حالة التعلم (مصفوفة أوزان الخلايا العصبية)، ولكن أيضًا معلومات حول الحالة السابقة للخلايا العصبية نفسها. ونتيجة لذلك، فإن استجابة مثل هذه الشبكة العصبية لا تتأثر فقط بالبيانات المدخلة ومصفوفة الوزن، ولكن أيضًا بتاريخها المباشر. يمكن لأبسط شبكة عصبية من هذا النوع، على سبيل المثال، التنبؤ "بذكاء" بالحرف التالي في النص: بعد تدريب الشبكة العصبية على بيانات القاموس، سيكون من الممكن الحصول على الإجابة "l" على الحرف "l" إذا الأحرف السابقة كانت "h" و"e" و"l"، ولكن الإجابة مختلفة هي "o"، إذا كانت الأحرف السابقة هي "h" و"e" و"l" ومرة ​​أخرى "l" (تحصل على كلمة "مرحبًا"، انظر الملحق).

مثال على شبكة عصبية متكررة ذات طبقة مخفية واحدة. يمكنك أن ترى كيف يغير توفير البيانات حالة الشبكة. يتم تخزين أوزان الخلايا العصبية المدربة في المصفوفات W_xh، W_hy ومصفوفة خاصة W_hh، مميزة فقط للشبكات المتكررة.

مدونة أندريه كارباثي

لقد أظهرت الشبكات العصبية المتكررة أنها جيدة جدًا في توليد الموسيقى أو النص "بأسلوب" بعض المؤلفين الذين تم استخدام مجموعتهم للتدريب، في *، ومؤخرًا، في الأنظمة وما إلى ذلك (على سبيل المثال،).

من الناحية الرسمية، حتى أبسط الشبكات العصبية المتكررة هي تورينج كاملة، ولكن عيبها المهم هو الطبيعة الضمنية لاستخدام الذاكرة. إذا تم فصل الذاكرة والكمبيوتر في آلة تورينج (مما يسمح بتغيير بنيتهما بطرق مختلفة)، ففي الشبكات العصبية المتكررة، حتى في أكثرها تقدمًا (LSTM)، يكون بُعد وطبيعة معالجة الذاكرة هو يتم تحديده من خلال بنية الشبكة العصبية نفسها.

لتصحيح هذا الخلل المتأصل في شبكات LSTM، اقترح علماء من DeepMind (جميعهم من بين مؤلفي الورقة الجديدة) مؤخرًا بنية ما يسمى بآلات تورينج العصبية. فيه، يتم فصل الكمبيوتر والذاكرة، كما هو الحال في آلات تورينج التقليدية، لكن النظام يحتفظ بخصائص وظيفة قابلة للتمييز، مما يعني أنه يمكن تدريبه عن طريق الأمثلة (باستخدام طريقة الانتشار العكسي) بدلاً من برمجته بشكل صريح. يعتمد النظام الجديد، وهو كمبيوتر عصبي قابل للتمايز، أو DNC، على نفس البنية، ولكن يتم تنظيم اتصال الكمبيوتر مع الذاكرة بطريقة أكثر مرونة: فهو ينفذ ليس فقط مفاهيم الحفظ، ولكن أيضًا السياقية التعرف والنسيان (خصص قسم منفصل للمقارنة بين النظامين في مقال جديد).

بشكل مبسط، يمكن تمثيل عمل DNC على النحو التالي. يتكون النظام من جهاز كمبيوتر، والذي يمكن أن يكون تقريبًا أي شبكة عصبية متكررة، وذاكرة. يحتوي الكمبيوتر على وحدات خاصة للوصول إلى الذاكرة، ويوجد فوق الذاكرة "بنية فوقية" خاصة على شكل مصفوفة تخزن تاريخ استخدامها (مزيد من التفاصيل أدناه). الذاكرة عبارة عن مصفوفة ذات البعد N×M، حيث الصفوف N i هي الخلايا الرئيسية التي يتم فيها كتابة البيانات (على شكل متجهات ذات البعد M).


بنية DNC: تظهر خطوط البيانات كخطوط ذات مربعات سوداء وبيضاء - تمثل هذه ببساطة الأرقام الموجبة والسالبة في المتجه. يمكن ملاحظة أن القراءة لها ثلاث وحدات عمل C وB وF، أي الترابط والمباشر والعكس - وهذه طرق لمقارنة متجه الإدخال مع المتجه الموجود في خلية الذاكرة. الذاكرة لها أبعاد N×M. يُظهر الشكل الموجود في أقصى اليمين بشكل تخطيطي مصفوفة "الذاكرة الوصفية" ذات البعد N×N، والتي تخزن تسلسل الوصول إلى الذاكرة.

والفرق الرئيسي بين DNC والأنظمة المماثلة هو طبيعة التعامل مع الذاكرة. وهو يطبق في الوقت نفسه العديد من المفاهيم الجديدة أو التي ظهرت مؤخرًا: الاهتمام الانتقائي، واسترجاع السياق، والتذكر الارتباطي، والنسيان. على سبيل المثال، إذا كانت أجهزة الكمبيوتر العادية تصل إلى الذاكرة بطريقة صريحة ("كتابة بيانات كذا وكذا في خلية كذا وكذا")، ففي DNC، بشكل رسمي، تحدث الكتابة في جميع الخلايا في وقت واحد، ولكن بدرجة يتم تحديد تأثير البيانات الجديدة على البيانات القديمة من خلال أوزان الاهتمام بالخلايا المختلفة. يُطلق على هذا التطبيق للمفهوم اسم "الانتباه الناعم"، وهذا بالتحديد هو الذي يضمن التمايز - فالأنظمة ذات الاهتمام الشديد لا تلبي متطلبات استمرارية الوظيفة ولا يمكن تدريبها بواسطة طريقة الانتشار العكسي (يتم استخدام التعلم المعزز). ومع ذلك، حتى "الانتباه الناعم" في نظام DNC يتم تنفيذه "بصعوبة شديدة" في الممارسة العملية، لذلك لا يزال بإمكاننا التحدث عن الكتابة أو القراءة من صف معين من مصفوفة الذاكرة.

يتم تنفيذ "الانتباه الناعم" في النظام بثلاثة أوضاع. الأول هو البحث السياقي، والذي يسمح لـ DNC بإكمال البيانات غير المكتملة. على سبيل المثال، عندما يتم توفير جزء من تسلسل ما يشبه ذلك الذي تم تخزينه بالفعل في الذاكرة إلى مدخلات الكمبيوتر، فإن مشغل القراءة اليقظ في وضع البحث السياقي يجد السلسلة الأقرب في التركيب و"يمزجها" مع بيانات الإدخال.

ثانيًا، يمكن تحديد الاهتمام بأجزاء مختلفة من الذاكرة من خلال تاريخ استخدامها. يتم تخزين هذا التاريخ في مصفوفة N×N، حيث تتوافق كل خلية N(i,j) مع درجة قريبة من 1 إذا كان الإدخال في الصف i متبوعًا بإدخال في الصف j (أو صفر إذا لم يكن كذلك). تعد "مصفوفة الذاكرة الفوقية" هذه أحد الاختلافات الأساسية بين نظام DNC الجديد ونظام NTM القديم. فهو يسمح للنظام "بتذكر" كتل البيانات بشكل تسلسلي إذا حدثت بشكل متكرر في سياق بعضها البعض.

ثالثًا، يسمح وضع الاهتمام الخاص للنظام بالتحكم في الكتابة إلى خطوط الذاكرة المختلفة: تخزين ما هو مهم ومحو ما هو غير مهم. يعتبر السطر أكثر اكتمالا كلما زاد عدد المرات التي تمت كتابته فيها، ولكن القراءة من السطر يمكن، على العكس من ذلك، أن تؤدي إلى محوه تدريجيا. تتجلى فائدة مثل هذه الوظيفة في مثال تدريب مكرر بسيط يعتمد على DNC (يجب أن تقوم الشبكة العصبية بإعادة إنتاج تسلسل البيانات التي تم تغذيتها بدقة). لمثل هذه المهمة، يمكن مسح حتى كمية صغيرة من الذاكرة وتكون كافية لتكرار عدد غير محدود من البيانات. تجدر الإشارة هنا إلى أن تنفيذ المكرر في البرنامج أمر بسيط للغاية، ولكن القيام بذلك على أساس الشبكة العصبية، من خلال التعلم المعزز، مهمة أكثر صعوبة بكثير.


تم تنفيذ مخطط تشغيل المكرر على أساس DNC. الوقت في الرسم البياني ينتقل من اليسار إلى اليمين. يُظهر الجزء العلوي البيانات التي تتلقاها وحدة التحكم عند الإدخال: أولاً عمود من عشرة خطوط سوداء (جميع الأصفار)، ثم عدة خطوط بيضاء وسوداء، ثم مرة أخرى عدة خطوط بيضاء وسوداء، ولكن بتسلسل مختلف. أدناه، حيث يتم عرض الإخراج من وحدة التحكم بنفس الطريقة، نرى أولاً أشرطة سوداء، ثم استنساخ دقيق تقريبًا لتسلسل الأنماط (نفس اللطخة البيضاء كما في الإدخال). ثم يتم توفير تسلسل جديد للإدخال - مع تأخير، يتم إعادة إنتاجه مرة أخرى عند الإخراج. يوضح الرسم البياني الأوسط ما يحدث لخلايا الذاكرة خلال هذا الوقت. المربعات الخضراء - اكتب، الوردي - اقرأ. يُظهر التشبع "قوة الانتباه" لهذه الخلية بالذات. يمكنك أن ترى كيف يقوم النظام أولاً بكتابة الأنماط الناتجة في الخلية 0، ثم 1، وهكذا حتى 4. في الخطوة التالية، يُعطى النظام مرة أخرى أصفارًا فقط (حقل أسود) وبالتالي يتوقف عن التسجيل ويبدأ في إعادة إنتاج الأنماط ، قراءتها من الخلايا بنفس التسلسل، كيف وصلت إلى هناك؟ في الجزء السفلي يظهر تفعيل البوابات التي تتحكم في تحرير الذاكرة.

أليكس جريفز وآخرون، طبيعة، 2016

اختبر العلماء النظام الناتج في عدة مهام اختبارية. كان أولها اختبارًا موحدًا لفهم النص تم تطويره مؤخرًا بواسطة باحثين في فيسبوك - bAbI. فيه، يُعطى نظام الذكاء الاصطناعي نصًا قصيرًا حيث تقوم بعض الشخصيات، ثم يحتاج إلى إجابة سؤال بناءً على النص ("ذهب جون إلى الحديقة، أخذت مريم زجاجة حليب، عاد جون إلى المنزل" سؤال: أين جون؟").

في هذا الاختبار الاصطناعي نظام جديدأظهرت معدل خطأ منخفضًا قياسيًا: 3.8 بالمائة مقابل 7.5 بالمائة من الرقم القياسي السابق - وبهذا تجاوزت كلاً من الشبكات العصبية LSTM وNTM. ومن المثير للاهتمام أن كل ما استقبله النظام كمدخلات كان عبارة عن سلسلة من الكلمات، والتي لم تكن ذات معنى في البداية بالنسبة لشبكة عصبية غير مدربة. وفي الوقت نفسه، فإن أنظمة الذكاء الاصطناعي التقليدية التي اجتازت هذا الاختبار بالفعل، كانت تُعطى سابقًا جملًا رسمية بشكل واضح ذات بنية صارمة: الفعل، الممثل، الحقيقة، وما إلى ذلك. وتمكنت شبكة عصبية متكررة ذات ذاكرة مخصصة من معرفة دور الكلمات في نفس الجمل بشكل مستقل تماما.

كان الاختبار الأكثر صعوبة هو اختبار فهم الرسم البياني. تم تنفيذه أيضًا كسلسلة من الجمل، لكن هذه المرة وصفوا بنية بعض الشبكات: مترو أنفاق لندن حقيقي أو شجرة عائلة نموذجية. التشابه مع اختبار bAbI هو أن الممثلين في نص موحد يمكن أيضًا تمثيلهم كعقد بيانية، وعلاقاتهم كحواف. في الوقت نفسه، في نصوص bAbI، تبين أن الرسم البياني بدائي تمامًا، ولا يضاهى بحجم مترو أنفاق لندن (يمكن فهم صعوبة فهم مخطط مترو الأنفاق باستخدام شبكة عصبية بشكل أفضل إذا تذكرت أن وصفه مذكور بالكلمات وليس في شكل صورة: حاول أن تتذكر بنفسك مخطط مترو الأنفاق لأي مدينة كبيرة وتعلم الإجابة عن الأسئلة المتعلقة به).

بعد التدريب على مليون مثال، تعلم كمبيوتر DNC الإجابة على أسئلة خريطة مترو الأنفاق بدقة تصل إلى 98.8 بالمائة، في حين فشل النظام المستند إلى LSTM تمامًا في المهمة - فقد أعطى 37 بالمائة فقط من الإجابات الصحيحة (الأرقام معطاة لـ أبسط مشكلة مثل "أين سينتهي بي الأمر إذا مررت بالعديد من المحطات على خط كذا وكذا، وقمت بالتغيير هناك ومررت بالعديد من المحطات؟" تبين أن مشكلة أقصر مسافة بين محطتين هي الأكثر صعوبة، لكن DNC تعاملت معها أيضًا).

تم إجراء تجربة مماثلة باستخدام شجرة العائلة: تم إعطاء البرنامج سلسلة من الجمل الرسمية حول العلاقات الأسرية عائلة كبيرة، وكان عليها أن تجيب على أسئلة مثل "من هو ابن عم ماشا الثاني من جهة والدتها". تتلخص كلتا المشكلتين في إيجاد مسار على الرسم البياني، والذي يتم حله بكل بساطة بالطريقة التقليدية. ومع ذلك، تكمن قيمة العمل في حقيقة أنه في هذه الحالة وجدت الشبكة العصبية حلاً بشكل مستقل تمامًا، لا يعتمد على الخوارزميات المعروفة من الرياضيات، ولكن على أساس الأمثلة ونظام التعزيز أثناء التدريب.

رسم بياني لسرعة حل مشكلة SHRDLU بواسطة نظامي DNC (الأخضر) وLSTM (الأزرق).

كان الاختبار الثالث عبارة عن اختبار SHRDLU "كلاسيكي" مبسط قليلاً، حيث تحتاج إلى نقل كائنات افتراضية معينة حول المساحة الافتراضية وفقًا لنتيجة نهائية محددة يجب الحصول عليها في النهاية. تلقى نظام DNC مرة أخرى وصفًا للحالة الحالية للفضاء الافتراضي في شكل جمل رسمية، ثم تم تكليفه بنفس الطريقة بمهمة والرد بنص متسق حول كيفية تحريك الأشياء. كما هو الحال في الاختبارات الأخرى، أثبت DNC أنه أكثر كفاءة بشكل ملحوظ من أنظمة LSTM، وهو ما يمكن رؤيته بوضوح من خلال الرسوم البيانية لمعدل التعلم.

ومع المجازفة بتكرار الأمور الواضحة مرة أخرى، لا يسعني إلا أن أؤكد على أن البساطة الواضحة للمهام التي تم اختبار اللجنة الوطنية الديمقراطية عليها هي في الواقع ظاهرة فقط. بمعنى أنه لا يعكس مدى تعقيد مشاكل العالم الحقيقي التي سيتمكن نظام مثل اللجنة الوطنية الديمقراطية من التعامل معها في المستقبل. بالطبع، من وجهة نظر الخوارزميات الموجودة، فإن مهمة العثور على طريق في مترو الأنفاق هي مجرد هراء - يمكن لأي شخص تنزيل تطبيق على هاتفه يمكنه القيام بذلك. كما سيتم حساب الوقت مع عمليات النقل والإشارة إلى السيارة الأفضل للركوب. لكن كل هذه البرامج تم إنشاؤها حتى الآن من قبل البشر، وفي DNC "ولدت" من تلقاء نفسها، في عملية التعلم بالقدوة.

في الواقع، إن بساطة مهام الاختبار تخفي شيئًا مهمًا للغاية أريد أن أقوله. واحدة من أكبر المشاكل في التعلم الآلي هي مكان الحصول على البيانات اللازمة لتدريب النظام. تلقي هذه البيانات "باليد"، أي. إن إنشائها بنفسك أو بمساعدة الأشخاص المستأجرين أمر مكلف للغاية. يحتاج أي مشروع تدريب رياضي إلى خوارزمية بسيطة يمكنها بسهولة وبتكلفة زهيدة إنشاء غيغابايت من البيانات الجديدة للتدريب (أو تحتاج إلى الوصول إلى قواعد البيانات الجاهزة). مثال كلاسيكي: لاختبار أنظمة التعرف على الحروف، لا يكتب الأشخاص المزيد والمزيد من الحروف بأيديهم، ولكنهم يستخدمون برنامجًا بسيطًا يشوه الصور الموجودة. إذا لم يكن لديك خوارزمية جيدة للحصول على عينة تدريبية (أو، على سبيل المثال، لا يمكن إنشاء مثل هذه الخوارزمية من حيث المبدأ)، فإن النجاح في التطوير سيكون تقريبًا نفس نجاح علماء المعلوماتية الحيوية الطبية، الذين يضطرون إلى اعمل فقط مع البيانات الحقيقية وبالتالي "البيانات الذهبية" حقًا (باختصار: ليست ناجحة جدًا).

هذا هو المكان الذي أصبح فيه مؤلفو المقال في متناول أيديهم من خلال الخوارزميات الجاهزة لحل المشكلات على الرسم البياني - فقط للحصول على ملايين الأزواج الصحيحة من الأسئلة والأجوبة. ولا شك أن سهولة إنشاء المجموعة التدريبية هي التي تحدد طبيعة الاختبارات التي تم استخدامها لاختبار النظام الجديد. ومع ذلك، من المهم أن نتذكر أن بنية DNC نفسها لا علاقة لها ببساطة هذه الاختبارات. ففي نهاية المطاف، حتى الشبكات العصبية المتكررة الأكثر بدائية لا يمكنها ترجمة النصوص ووصف الصور فحسب، بل يمكنها أيضًا كتابة أو إنشاء رسومات تخطيطية (لأذن المؤلف بالطبع). ماذا يمكننا أن نقول عن الأنظمة المتقدمة "الذكية" حقًا مثل DNC.

الكسندر ارشوف

قامت Google بشراء شركة مقرها لندن تعمل على تطوير الذكاء الاصطناعي – DeepMind. وقدرت المصادر الصفقة بأكثر من 500 مليون دولار. تم تأكيد عملية الشراء رسميًا من قبل ممثلي Google.


ماذا ستستفيد جوجل من هذا الاستحواذ؟ أولاً، ستسمح لها بالتنافس مع شركات التكنولوجيا الكبرى الأخرى بفضل تركيزها على التعلم العميق. على سبيل المثال، قامت شركة فيسبوك مؤخراً بتعيين البروفيسور يان لوكان لقيادة جهود الذكاء الاصطناعي الخاصة بها. يركز حاسوب Watson العملاق التابع لشركة IBM حاليًا على التعلم العميق، كما استحوذت شركة Yahoo مؤخرًا على شركة LookFlow الناشئة لتحليل الصور، مما يعني أنها تحرز تقدمًا أيضًا في هذا المجال.

تأسست شركة DeepMind على يد عالم الأعصاب ديميس هاسابيس، معجزة الشطرنج السابقة، ومطور Skype وKazaa جان تالين، والباحث شين ليغ.

وقالت المصادر إن خطوة جوجل ستسمح لفريق عملاق التكنولوجيا بملء مجاله الخاص من خبراء الذكاء الاصطناعي، وقد أشرف الرئيس التنفيذي لشركة جوجل لاري بيج شخصيًا على عملية الاستحواذ. إذا عمل المؤسسون الثلاثة في جوجل، فسوف ينضمون إلى المخترع ورجل الأعمال والمؤلف والمستقبلي راي كورزويل، الذي أصبح كبير مسؤولي التكنولوجيا في قسم التعلم الآلي ومعالجة اللغة في جوجل في عام 2012.

صرح كورزويل أنه يريد بناء محرك بحث متقدم جدًا بحيث يمكن أن يصبح "صديقًا إلكترونيًا" حقيقيًا.

وبعد الاستحواذ على Nest في وقت سابق من هذا الشهر، أثار النقاد مخاوف بشأن كمية بيانات المستخدم التي سيتم إرسالها إلى Google. وأدى شراء شركة بوسطن ديناميكس الشهر الماضي أيضًا إلى جدل حول خطط جوجل لتصبح صانعًا للروبوتات.

ومع ذلك، فإن Google مستعدة جيدًا لتهدئة مخاوفنا بشأن عمليات الاستحواذ الأخيرة التي قامت بها. تقول المصادر إن جوجل قررت إنشاء مجلس أخلاقيات يشرف على تطوير الذكاء الاصطناعي داخل DeepMind.

ومع ذلك، سيتعين على الشركة توضيح ما يفعله الذكاء الاصطناعي DeepMind بالضبط. يحتوي موقع الشركة حاليًا على صفحة مقصودة تحتوي على وصف غامض نسبيًا يقول إن DeepMind هي "شركة في المقدمة" تقوم ببناء خوارزميات المستقبل لعمليات المحاكاة والتجارة الإلكترونية والألعاب. اعتبارًا من ديسمبر، كان لدى الشركة الناشئة 75 موظفًا.

الداعمون الرئيسيون للشركة الناشئة هم Founders Fund وHorizons Ventures. تأسست شركة DeepMind قبل ثلاث سنوات.

في عام 2012، كتب لاري واسرمان، أستاذ جامعة كارنيجي ميلون، أن "الشركة الناشئة ستقوم ببناء نظام يفكر. اعتقدت أنه كان جنونًا خالصًا حتى اكتشفت عدد المليارديرات المشهورين الذين استثمروا في الشركة.

6 ديسمبر 2016 الساعة 00:41

يفتح DeepMind الوصول المجاني إلى بيئة التعلم الآلي الافتراضية

  • العلوم الشعبية,
  • الذكاء الاصطناعي ،
  • الألعاب وأجهزة الألعاب

في الآونة الأخيرة، أعلن ممثلو قسم DeepMind (الذي أصبح الآن جزءًا من شركة Alphabet Holding) أنهم يوفرون للمطورين إمكانية الوصول المجاني إلى الكود المصدري لمنصة DeepMind Lab. هذه خدمة تعلم آلي تعتمد على Quake III، وهي مصممة لتدريب الذكاء الاصطناعي. وهي تعلم كيفية حل المشكلات في الفضاء ثلاثي الأبعاد دون تدخل بشري. تعتمد المنصة على محرك اللعبة Quake III Arena.

داخل عالم اللعبة، يحصل الذكاء الاصطناعي على شكل كرة والقدرة على الطيران واستكشاف الفضاء المحيط. الهدف الذي حدده المطورون لأنفسهم هو تعليم شكل ضعيف من الذكاء الاصطناعي "لفهم" ما يحدث والاستجابة للمواقف المختلفة التي تحدث في عالم افتراضى. يمكن "للشخصية" تنفيذ عدد من الإجراءات، والتنقل في المتاهة، ودراسة البيئة المباشرة.

يقول شين ليغ، كبير العلماء في DeepMind: "نحن نحاول تطوير أشكال مختلفة من الذكاء الاصطناعي يمكنها أداء مجموعة من المهام بدءًا من استكشاف عالم اللعبة ببساطة وحتى اتخاذ الإجراءات وتحليل عواقبها".

ويأمل الخبراء أن يتمكن الذكاء الاصطناعي من التعلم من خلال التجربة والخطأ. تعتبر الألعاب في هذه الحالة خيارًا مثاليًا تقريبًا. على سبيل المثال، استخدم DeepMind سابقًا (ويستخدم الآن) وحدة تحكم ألعاب Atari لتعليم الشبكة العصبية تنفيذ الإجراءات التسلسلية اللازمة للعبة.

لكن العالم المفتوح ثلاثي الأبعاد الذي يمكن تعديله يوفر بيئة واعدة لتدريب الذكاء الاصطناعي أكثر بكثير من العالم المسطح لألعاب أتاري البسيطة بيانيًا. يتمتع الذكاء الاصطناعي في عالم ثلاثي الأبعاد بمهام واضحة تتغير بالتسلسل بحيث تصبح الخبرة المكتسبة من حل كل مهمة سابقة مفيدة للذكاء الاصطناعي عند حل المهمة التالية.

تتمثل ميزة البيئة ثلاثية الأبعاد في إمكانية استخدامها لتدريب أنظمة الكمبيوتر على الاستجابة لمختلف المشكلات التي قد تنتظر الروبوت وفي العالم الحقيقي. وبمساعدة جهاز المحاكاة هذا، يمكن للروبوتات الصناعية أن تتدرب بسهولة. والعمل مع بيئة افتراضية أسهل بكثير في بعض الحالات من تدريب مثل هذه الأنظمة "يدويًا".

وفي الوقت نفسه، تم تطوير معظم الشبكات العصبية الحديثة لحل مشكلة واحدة محددة (معالجة الصور، على سبيل المثال). يعد مطورو النظام الأساسي الجديد بأنه سيساعد في إنشاء شكل عالمي من الذكاء الاصطناعي قادر على حل المشكلات عدد كبير منمهام. علاوة على ذلك، في هذه الحالة، لن يحتاج نظام الكمبيوتر إلى مساعدة الناس. يتم إنشاء بيئة الشبكة العصبية بترتيب عشوائي في كل مرة.


وفقًا لمطوري المنصة، فهي تساعد الذكاء الاصطناعي على التعلم بنفس الطريقة التي يتعلم بها الأطفال. "الطريقة التي تعلمت بها أنت أو أنا عن العالم عندما كنا أطفالًا"، أعطى أحد موظفي DeepMind مثالاً على ذلك. "لقد كان مجتمع التعلم الآلي دائمًا منفتحًا للغاية. ننشر حوالي 100 مقالة سنويًا، كما قمنا أيضًا بفتح مصادر مفتوحة للعديد من مشاريعنا."

الآن قام Google DeepMind بفتح الكود المصدري لـ DeepMind Lab ونشره على GitHub. وبفضل هذا، يمكن لأي شخص تنزيل رمز النظام الأساسي وتعديله ليناسب احتياجاته. يقول ممثلو المشروع إن المتخصصين المتصلين يمكنهم إنشاء مستويات لعب جديدة بشكل مستقل عن طريق تحميل مشاريعهم الخاصة على GitHub. يمكن أن يساعد هذا المجتمع بأكمله على العمل نحو تحقيق هدفه بشكل أسرع وأكثر كفاءة.

هذا المشروع ليس الوحيد لشركة DeepMind. وفي الشهر الماضي، أبرم ممثلوها اتفاقية تعاون مع شركة Activision Blizzard Inc. الهدف هو بيئة Starcraft 2 لتكون بمثابة اختبار للذكاء الاصطناعي. ربما سينضم مطورو الألعاب الآخرون قريبًا إلى هذا المشروع. بالمناسبة، الذكاء الاصطناعي في بيئة الألعاب لا يكتسب أي ميزة على العدو، ويستخدم فقط للتقدم، تمامًا مثل الإنسان.

ومن الناحية العملية، يعني هذا أن الذكاء الاصطناعي في جوجل سيحتاج إلى التنبؤ بما يفعله العدو في أي وقت من أجل الاستجابة بشكل مناسب لأفعال "العدو". بالإضافة إلى ذلك، سيكون من الضروري الرد بسرعة على أي شيء يخرج عن الخطة. كل هذا سيسمح لنا باختبار المستوى التالي من قدرات الذكاء الاصطناعي. وقال ديميس هاسابيس، مؤسس شركة Deepmind (التي اشترتها جوجل في عام 2014، وتعمل الآن على تطوير الذكاء الاصطناعي بناءً على إنجازات الشركة المشتراة: "في النهاية، نريد استخدام هذه القدرات لحل المشكلات العالمية".

ويشيد خبراء الذكاء الاصطناعي بحذر بالمشروع. قال إيليا سوتسكيفار، المؤسس المشارك لـ OpenAI: "الشيء الجيد هو أنها توفر عددًا كبيرًا من أنواع البيئات". "ماذا مع كمية كبيرةوتابع: "كلما زادت سرعة تطور أنواع البيئات التي يواجهها النظام". في الواقع، تحتوي بيئة تعلم الذكاء الاصطناعي ثلاثي الأبعاد على أكثر من 1000 مستوى ونوع من البيئات.

ويعتقد زوبين جهرحماني، الأستاذ في جامعة كامبريدج، أن مختبر DeepMind والمنصات الأخرى لتعزيز تطوير الذكاء الاصطناعي تقود التقدم من خلال السماح للباحثين بالدخول إلى البيئة المتقدمة. وفي الوقت نفسه، مشاريع مثل

حاليًا، تعمل العديد من الشركات على تطوير الذكاء الاصطناعي (AI). لقد تم بالفعل إنشاء أبسط أشكالها، وهي قادرة على تنفيذ العمليات العقلية البدائية.

عملاق الانترنت جوجلتشارك بنشاط في تطوير الذكاء الاصطناعي. وفي عام 2014، استحوذت هذه الشركة على شركة ناشئة عميقعقلالتقنياتمقابل 400 مليون دولار ومن المثير للاهتمام أن شركة Deep Mind Technologies هي التي طورت جهازًا يجمع بين خصائص الشبكة العصبية وقدرات الحوسبة للكمبيوتر. العلماء واثقون من أن هذا التطور سيقرب البشرية من إنشاء ذكاء اصطناعي كامل.

جهاز Deep Mind Technologies هو جهاز كمبيوتر يعيد إنتاج الطريقة التي يقوم بها الدماغ البشري بتخزين المعلومات وإدارتها، أي قسم الذاكرة قصيرة المدى. أساس الجهاز هو نوع من الشبكات العصبية، التي يشبه هيكلها بنية الدماغ البشري، وتتكون من الخلايا العصبية المترابطة. تكمن خصوصية الذكاء الاصطناعي في أنه بعد إكمال سلسلة من المهام البسيطة، يمكن للكمبيوتر استخدام البيانات المخزنة لأداء مهام أكثر تعقيدًا. وبالتالي، يتمتع الذكاء الاصطناعي بالقدرة على التعلم الذاتي والرغبة في التطور، مما قد يؤدي في النهاية إلى مواجهة بين الذكاء الاصطناعي والبشر.

وفقا لعالم الفيزياء العالمي الشهير ستيفن هوكينجالذكاء الاصطناعي يشكل خطرا على البشرية. وذكر ذلك في مقابلة مع بي بي سي: “لقد أثبتت الأشكال البدائية للذكاء الاصطناعي الموجودة اليوم فائدتها. ومع ذلك، أعتقد أن تطوير الذكاء الاصطناعي الكامل يمكن أن يعني نهاية الجنس البشري. عاجلاً أم آجلاً، سيخلق الإنسان آلة تخرج عن نطاق السيطرة وتتفوق على خالقها. مثل هذا العقل سوف يأخذ زمام المبادرة ويبدأ في تحسين نفسه بسرعة متزايدة. فالقدرات البشرية محدودة بسبب التطور البطيء للغاية، ولن نكون قادرين على التنافس مع سرعة الآلات وسوف نخسر.

ويشاركه رأي هوكينج أيضًا علماء ومتخصصون آخرون، بما في ذلك ايلون ماسكقال رجل الأعمال الأمريكي الشهير في مجال تكنولوجيا المعلومات ومبتكر شركتي Tesla وSpace X، إن الذكاء الاصطناعي يمكن أن يكون أكثر خطورة من الأسلحة النووية ويشكل تهديدًا خطيرًا لوجود البشرية.

حددت جوجل لنفسها هدف خلق الذكاء الفائق بحلول عام 2030. سيتم دمج هذا الذكاء الفائق في نظام الكمبيوتر، وخاصة الإنترنت. في اللحظة التي يبحث فيها المستخدم عن المعلومات، يقوم الذكاء الفائق بتحليل النمط النفسي لهذا الشخص وتزويده بالمعلومات التي يراها مناسبة. يكتب إريك شميدت، رئيس مجلس إدارة جوجل، عن هذا في كتابه. ويقترح اعتبار أولئك الذين يرفضون الاتصال بهذا النظام أشخاصًا يحتمل أن يشكلوا خطرًا على الدولة. ومن المتوقع أنه من أجل تنفيذ عمل هذا النظام، أ الإطار التشريعيعلى مستوى الدولة.

وبالتالي، فإن الذكاء الفائق الذي يجري تطويره سيصبح أداة عالمية للسيطرة على البشرية. مع ظهور الذكاء الفائق، سيتوقف الإنسان عن ممارسة العلوم؛ وسيتم ذلك عن طريق الذكاء الفائق، الذي سيكون متفوقًا عدة مرات على الدماغ البشري في جميع جوانب تجلياته.

مرجع:

تغلب- هو أي ذكاء يتفوق بشكل كبير على كبار العقول البشرية في جميع المجالات تقريبًا، بما في ذلك مجموعة متنوعة من المجالات بحث علميوالمهارات الاجتماعية وغيرها من المجالات.

ستكون نتيجة خلق الذكاء الفائق أن الجنس البشري سيتوقف عن كونه الشكل الأكثر ذكاءً للحياة في الجزء المعروف من الكون. ويعتقد بعض الباحثين أن خلق الذكاء الفائق هو الخطوة الأخيرة التطور البشري، بالإضافة إلى الاختراع الأخير الذي ستحتاج البشرية إلى صنعه. لأنه من المفترض أن الذكاء الفائق سيكون قادرًا على الاعتناء بشكل مستقل بالتقدم العلمي والتكنولوجي اللاحق بشكل أكثر فعالية بكثير من البشر.

غذاء للفكر:

منذ عام 2007، يستضيف أحد الفنادق البريطانية مؤتمر Google Zeitgeist السنوي. ومن المثير للاهتمام أن هذا الاجتماع لا يحضره سوى المتخصصين في هذا المجال تقنية عاليةوممثلي الشركات عبر الوطنية والبنوك الدولية. يمكننا أن نستنتج أن رؤساء الشركات العابرة للقارات والبنوك الدولية مهتمون بإنشاء الذكاء الفائق، وربما حتى تمويل هذا المشروع.

رسول جيراياليف

يبدو من المرجح أن الذكاء الاصطناعي (AI) سيكون نذير الثورة التكنولوجية القادمة. إذا تطور الذكاء الاصطناعي إلى النقطة التي يصبح فيها قادراً على التعلم والتفكير وحتى "الشعور"، كل هذا من دون أي مساهمة بشرية، فإن كل ما نعرفه عن العالم سوف يتغير بين عشية وضحاها تقريباً. سيأتي عصر الذكاء الاصطناعي الذكي حقًا.

العقل العميق

ولهذا السبب نحن مهتمون جدًا بتتبع المعالم الرئيسية في تطوير الذكاء الاصطناعي التي تحدث اليوم، بما في ذلك تطوير شبكة Google العصبية DeepMind. لقد تمكنت هذه الشبكة العصبية بالفعل من هزيمة أي شخص عالم الألعابوتظهر دراسة جديدة أجرتها جوجل أن منشئي DeepMind ليسوا متأكدين بعد مما إذا كان الذكاء الاصطناعي يفضل سلوكًا أكثر عدوانية أو تعاونًا.

أنشأ فريق جوجل سيناريوهين بسيطين نسبيًا، يمكنهما اختبار ما إذا كانت الشبكات العصبية قادرة على العمل معًا، أو البدء في تدمير بعضها البعض عند مواجهة نقص الموارد.

جمع الموارد

خلال الحالة الأولى، التي تسمى Gathering، تم تكليف الإصدارين المشاركين من DeepMind - الأحمر والأزرق - بحصاد "التفاح" الأخضر داخل مساحة ضيقة. لكن الباحثين كانوا مهتمين بما هو أكثر من مجرد من سيصل إلى خط النهاية أولاً. كان كلا الإصدارين من DeepMind مسلحين بأشعة الليزر، والتي يمكن استخدامها لإطلاق النار على الخصم في أي وقت وتعطيله مؤقتًا. اقترحت هذه الشروط سيناريوهين رئيسيين: يجب على إصدار واحد من DeepMind تدمير الآخر وجمع كل التفاح، أو سيسمح كل منهما للآخر بالحصول على نفس الكمية تقريبًا.

من خلال تشغيل المحاكاة ألف مرة على الأقل، وجد باحثو Google أن DeepMind كان مسالمًا ومتعاونًا للغاية عندما كان هناك الكثير من التفاح في مكان ضيق. ولكن مع تضاؤل ​​الموارد، بدأت الإصدارات الحمراء أو الزرقاء من DeepMind في مهاجمة أو تعطيل بعضها البعض. يذكرنا هذا الوضع إلى حد كبير بالحياة الحقيقية لمعظم الحيوانات، بما في ذلك البشر.

والأهم من ذلك، أن الشبكات العصبية الأصغر حجمًا والأقل ذكاءً فضلت المزيد من التعاون طوال الوقت. تميل الشبكات الأكبر والأكثر تعقيدًا إلى تفضيل الخيانة والأنانية على سلسلة من التجارب.

بحث عن "الضحية"

في السيناريو الثاني، المسمى Wolfpack، طُلب من النسختين الحمراء والزرقاء مطاردة شكل "الفريسة" الذي لا يوصف. يمكن أن يحاولوا الإمساك بها بشكل منفصل، ولكن سيكون من المفيد لهم أن يحاولوا القيام بذلك معًا. ففي نهاية المطاف، من الأسهل بكثير محاصرة الضحية إذا عملتما معًا.

وعلى الرغم من أن النتائج كانت مختلطة مع شبكات أصغر، إلا أن الإصدارات الأكبر سرعان ما أدركت أن التعاون بدلاً من المنافسة سيكون أكثر فائدة في هذه الحالة.

"معضلة السجين"

إذًا، ما الذي توضحه لنا هاتان النسختان البسيطتان من معضلة السجين؟ تدرك شركة DeepMind أن التعاون هو الأفضل عندما يتعلق الأمر بتعقب الهدف، ولكن عندما تكون الموارد محدودة، فإن الخيانة تعمل بشكل أفضل.

ولعل أسوأ ما في هذه النتائج هو أن "غرائز" الذكاء الاصطناعي تشبه إلى حد كبير غرائز الإنسان، ونحن نعرف جيدا ما تؤدي إليه أحيانا.