آموزش به روبات برای یادگیری مشابه انسان
گروهی از پژوهشگران موفق به توسعهی نوعی الگوریتم جدید شدهاند که به هوشهای مصنوعی اجازه میدهد وظیفهی خود را تنها با یک مثال یاد بگیرند.
فناوری روباتیک در عصر امروزی بسیار پیشرفت کرده و الگوریتمهای متفاوتی برای آموزش آنها به وجود آمده است؛ اما در تمامی روشها حجم عظیمی از نمونهها و اطلاعات مورد نیاز است تا بتوان آنها را به سطح مناسبی از عملکرد رساند.
شرکت اپن اِی.آی۱ (OpenAI)، به تازگی اعلام کرد روی فناوری جدیدی برای توسعهی روباتها کار میکند. محققان این شرکت موفق به توسعهی الگوریتم جدیدی به نام «یادگیری تقلید یک مرحلهی» (one-shot imitation learning) شدهاند که به کاربران اجازه میدهد در واقعیت مجازی با هوشها مصنوعی ارتباط برقرار کرده و نحوهی انجام کاری را به آن نشان بدهند. در نتیجه روباتها میتوانند تنها با یک مثال وظیفهی خود را یاد گرفته و عملی کاملاً مشابه را انجام بدهند.
تقلید یک مرحله از دو شبکهی عصبی مختلف با نامهای شبکهی بینایی (vision network) و شبکهی تقلید (imitation network) استفاده میکند.
شبکهی بینایی تصاویر را به عنوان ورودی از دوربین روبات دریافت کرده و موقعیت اشیا را به عنوان خروجی ارسال میکند. این شبکه توسط صدها هزار تصویر شبیهسازی شده از با محتواهایی مانند نوع روشنایی، اشیا و بافت، پسزمینه و بافت آنها آموزش دیده است. لازم به ذکر است که شبکهی بینایی یکی از دستاوردهای گذشتهی اپن اِی.آی بوده و بدون این که توسط حتی یک تصویر واقعی آموزش ببینید توانایی تشخیص اجسام را با دقت بالا کسب کرده است. در واقع محققان اعتقاد داشتند برای آموزش الگوریتم یادگیری عمیق باید صدها هزار عکس تهیه شود و این کار هزینههای بسیار زیادی را به دنبال دارد؛ به همین دلیل سامانهای را ایجاد کردند که از طریق شبیهسازی تصادفی تصاویر با ویژگیهایی مانند رنگ، بافت، شرایط نوری و موقعیت متفاوت دوربین، بینهایت حالت مختلف را برای آموزش هوش مصنوعی به وجود آورد. این کار علاوه برافزایش سرعت یادگیری، هزینههای مصرفی را نیز به شدت کاهش میدهد.
سامانه شبیهسازی تصاویر و ویدئوها
شبکهی تقلید وظیفهی هدایت روبات را بر عهده داشته و توسط خروجی شبکه بینایی تغذیه میشود. این شبکه ابتدا به عملکرد انسان دقت کرده و سعی میکند عمل کرد خود را با آن تطبیق بدهد. برای آموزش این شبکه نیز از هیچ تصویر یا ویدئوی واقعی استفاده نشده است.
با استفاده از دو شبکهی بالا میتوان شرایطی را فراهم کرد تا روباتها تنها با یک مثال بتوانند وظیفهی خواسته شده را انجام بدهند.
برای نمونه پژوهشگران سعی کردند به یک بازوی روباتیک آموزش بدهند که چگونه تعدادی مکعب رنگی را روی یکدیگر قرار بدهد. آنها ابتدا با استفاده از سیاست تولید محتوای شبیهسازی شده، اسکریپتی از نحوهی انجام این را ایجاد کرده و شبکهی تقلید را با آن آموزش دادند. سپس در زمان شروع آزمایش یک اپراتور انسان هدستی را روی سر خود قرار داده و همان وظیفه را در واقعیت مجازی به نمایش گذاشت. بازوی روباتیک با وجود اینکه هیچ دادهای از نحوهی عملکرد انسان نداشت، موفق شده به درستی وظیفهی خواسته شده را تقلید کند.
پژوهشگران توضیح دادند هدف از انجام تحقیقات بالا ایجاد قابلیتی است که هوشهای مصنوعی بتوانند به سرعت رفتارهای جدید را یاد گرفته و از دانش خود برای انطباق با تغییرات غیرقابل پیشبینی محیط استفاده کنند.
_________________________________
۱- اپن اِی.آی با هدف توسعهی هوش مصنوعی برای بهبود زندگی انسانها توسط ایلان ماسک تأسیس شد.
ارسال نظر