۵۳۳۴۰۲ ۲۷ اردیبهشت ۱۳۹۶ ۱۱:۰۵

آموزش به روبات برای یادگیری مشابه انسان

گروهی از پژوهشگران موفق به توسعه‌ی نوعی الگوریتم جدید شده‌اند که به هوش‌های مصنوعی اجازه می‌دهد وظیفه‌ی خود را تنها با یک مثال یاد بگیرند.

وب سایت سایبربان: گروهی از پژوهشگران موفق به توسعه‌ی نوعی الگوریتم جدید شده‌اند که به هوش‌های مصنوعی اجازه می‌دهد وظیفه‌ی خود را تنها با یک مثال یاد بگیرند.

فناوری روباتیک در عصر امروزی بسیار پیشرفت کرده و الگوریتم‌های متفاوتی برای آموزش آن‌ها به وجود آمده است؛ اما در تمامی روش‌ها حجم عظیمی از نمونه‌ها و اطلاعات مورد نیاز است تا بتوان آن‌ها را به سطح مناسبی از عملکرد رساند.

شرکت اپن اِی.آی۱ (OpenAI)، به تازگی اعلام کرد روی فناوری جدیدی برای توسعه‌ی روبات‌ها کار می‌کند. محققان این شرکت موفق به توسعه‌ی الگوریتم جدیدی به نام «یادگیری تقلید یک مرحله‌ی» (one-shot imitation learning) شده‌اند که به کاربران اجازه می‌دهد در واقعیت مجازی با هوش‌ها مصنوعی ارتباط برقرار کرده و نحوه‌ی انجام کاری را به آن نشان بدهند. در نتیجه روبات‌ها می‌توانند تنها با یک مثال وظیفه‌ی خود را یاد گرفته و عملی کاملاً مشابه را انجام بدهند.

تقلید یک مرحله از دو شبکه‌ی عصبی مختلف با نام‌های شبکه‌ی بینایی (vision network) و شبکه‌ی تقلید (imitation network) استفاده می‌کند.

شبکه‌ی بینایی تصاویر را به عنوان ورودی از دوربین روبات دریافت کرده و موقعیت اشیا را به عنوان خروجی ارسال می‌کند. این شبکه توسط صدها هزار تصویر شبیه‌سازی شده از با محتواهایی مانند نوع روشنایی، اشیا و بافت، پس‌زمینه و بافت آن‌ها آموزش دیده است. لازم به ذکر است که شبکه‌ی بینایی یکی از دستاوردهای گذشته‌ی اپن اِی.آی بوده و بدون این که توسط حتی یک تصویر واقعی آموزش ببینید توانایی تشخیص اجسام را با دقت بالا کسب کرده است. در واقع محققان اعتقاد داشتند برای آموزش الگوریتم یادگیری عمیق باید صدها هزار عکس تهیه شود و این کار هزینه‌های بسیار زیادی را به دنبال دارد؛ به همین دلیل سامانه‌ای را ایجاد کردند که از طریق شبیه‌سازی تصادفی تصاویر با ویژگی‌هایی مانند رنگ، بافت، شرایط نوری و موقعیت متفاوت دوربین، بی‌نهایت حالت مختلف را برای آموزش هوش مصنوعی به وجود آورد. این کار علاوه برافزایش سرعت یادگیری، هزینه‌های مصرفی را نیز به شدت کاهش می‌دهد.

سامانه شبیه‌سازی تصاویر و ویدئوها

شبکه‌ی تقلید وظیفه‌ی هدایت روبات را بر عهده داشته و توسط خروجی شبکه بینایی تغذیه می‌شود. این شبکه ابتدا به عملکرد انسان دقت کرده و سعی می‌کند عمل کرد خود را با آن تطبیق بدهد. برای آموزش این شبکه نیز از هیچ تصویر یا ویدئوی واقعی استفاده نشده است.
با استفاده از دو شبکه‌ی بالا می‌توان شرایطی را فراهم کرد تا روبات‌ها تنها با یک مثال بتوانند وظیفه‌ی خواسته شده را انجام بدهند.

برای نمونه پژوهشگران سعی کردند به یک بازوی روباتیک آموزش بدهند که چگونه تعدادی مکعب رنگی را روی یکدیگر قرار بدهد. آن‌ها ابتدا با استفاده از سیاست تولید محتوای شبیه‌سازی شده، اسکریپتی از نحوه‌ی انجام این را ایجاد کرده و شبکه‌ی تقلید را با آن آموزش دادند. سپس در زمان شروع آزمایش یک اپراتور انسان هدستی را روی سر خود قرار داده و همان وظیفه را در واقعیت مجازی به نمایش گذاشت. بازوی روباتیک با وجود اینکه هیچ داده‌ای از نحوه‌ی عملکرد انسان نداشت، موفق شده به درستی وظیفه‌ی خواسته شده را تقلید کند.

پژوهشگران توضیح دادند هدف از انجام تحقیقات بالا ایجاد قابلیتی است که هوش‌های مصنوعی بتوانند به سرعت رفتارهای جدید را یاد گرفته و از دانش خود برای انطباق با تغییرات غیرقابل پیش‌بینی محیط استفاده کنند.

_________________________________

۱- اپن اِی.آی با هدف توسعه‌ی هوش مصنوعی برای بهبود زندگی انسان‌ها توسط ایلان ماسک تأسیس شد.