۱۳۲۷۰۷۸ ۱۱ تیر ۱۴۰۲ ۰۸:۵۴

وقتی بازتاب چشم‌ها مکان را لو می‌دهند!

تبدیل انعکاس تصاویر در چشم به صحنه‌های سه ‌بعدی طرح جاه‌طلبانه‌ای است که مسیری طولانی را در پیش رو دارد ولی گام‌های ابتدایی مهمی دراین مسیر برداشته شده است.

خبرآنلاین: محققان دانشگاه مریلند موفق شده‌اند تا انعکاس چشمی را به صحنه‌های سه بعدی که تا حدودی قابل تشخیص هستند، تبدیل کنند. این تلاش‌ها برپایه میدان‌های تابشی عصبی (NeRF)، یک تکنولوژی هوش مصنوعی که محیط‌ها را از تصاویر دوبعدی بازسازی می‌کند انجام می‌شود.

اگرچه رویکرد انعکاس چشم راه درازی را پیش رو دارد تا بتواند کاربردی عملی داشته باشد، اما این تحقیقات دیدگاهی اجمالی و جالب توجهی از فناوری ارائه می‌دهد که می‌تواند در آینده محیطی را از مجموعه‌ای از عکس‌های پرتره ساده به نمایش بگذارد.

روند کار به چه ترتیب است؟

اعضای تیم تحقیقاتی با استفاده از تصاویر متوالی ثبت شده توسط یک سنسور و با بهره‌گیری از انعکاس‌های ظریف نور گرفته شده از چشم انسان، برای تشخیص محیط اطراف فرد اقدام کردند. آنها کار را با چندین تصویر با وضوح بالا که ثبت آنها توسط یک دوربین که در جایی ثابت شده بود، آغاز کردند و فردی متحرک را به تصویر کشیدند که به دوربین نگاه می‌کرد. آنها سپس روی بازتاب‌ها و واکنش‌ها زوم کردند؛ آنها را جدا کرده و به محاسبه این پرداختند که چشم‌های فرد در عکس‌ها به چه نگاه می‌کنند.

نتایج این آزمایش، یک بازسازی محیطی قابل تشخیص از چشم انسان را در یک محیط کنترل شده نشان داد. این صحنه با استفاده از یک چشم مصنوعی (عکس زیر) ثبت شده و صحنه‌ای رویایی و چشمگیر را خلق کرد. البته تلاش برای مدل‌سازی انعکاس‌های چشم در هنگام تماشای موزیک ویدیوهای مایلی سایرس و لیدی گاگا، حباب‌های مبهمی را تولید کرد که محققان تنها توانستند حدس بزنند که اینها در واقع دریچه‌های LED و دوربینی روی سه‌پایه هستند؛ این نشان می‌دهد که این فناوری تا حد زیادی با کاربردی شدن در دنیای واقعی فاصله دارد.

اعضای تیم برای بازسازی صحنه‌های خام و مبهم هم بر موانع مهم و بزرگی غلبه کردند. به عنوان مثال، قرنیه "نویز ذاتی" ای را معرفی می‌کند که تفکیک آن از نوربازتاب یافته از بافت پیچیده عنبیه انسان سخت و پیچیده است. برای رسیدگی به این موضوع، بهینه‌سازی حالت قرنیه (تخمین موقعیت و جهت قرنیه) و تجزیه بافت عنبیه (استخراج ویژگی‌های منحصر به فرد قرنیه فرد) در طول آزمایش‌ها انجام شد. در نهایت از دست دادن منظم سازی بافت شعاعی (تکنیک یادگیری ماشینی که بافت‌های صاف‌تری را نسبت به ماده منبع شبیه‌سازی می‌کند)، به جدا سازی و بهبود بهتر مناظربازتاب یافته کمک کرد.

مسیری طولانی پیش روست

به رغم پیشرفت‌های چشمگیر و ارائه راه‌حل‌های هوشمندانه، همچنان موانع قابل توجهی نیز پیش روست. در بخشی از مقاله منتشره در این باره می‌خوانیم: نتیجه فعلی دنیای واقعی، از یک "تنظیم آزمایشگاهی" مثل تصویربرداری با بزرگ‌نمایی از صورت یک فرد، نورهای منطقه‌ای برای روشن کردن صحنه و حرکت عمدی فرد حاصل می‌شود. ما بر این باور هستیم که برخی تنظیمات بدون محدودیت، همچنان چالش برانگیز خواهند بود؛ از جمله ویدیو کنفرانس با حرکات طبیعی سر ... و دلیل آن هم وضوح پائین‌تر سنسورها، محدوده دینامیکی و تاری حرکت است.

به علاوه، اعضای تیم به این نکته اشاره کردند که فرضیه جهانی درباره بافت عنبیه ممکن است خیلی ساده‌تر از چیزی باشد که به طور گسترده اعمال شود؛ مخصوصا زمانی که چشم‌ها معمولا بیشتر از این تنظیمات کنترل شده، می‌چرخند و حرکت می‌کنند.

درهر حال، اعضای تیم تحقیقاتی پیشرفت خود را به عنوان نقطه عطفی می‌دانند که به پیشرفت‌های آینده کمک زیادی خواهد کرد:« با این تلاش‌ها، ما امیدواریم تا بتوانیم الهام‌بخش کاوش‌های آینده باشیم که از سیگنال‌های بصری غیرمنتظره و تصادفی برای ارائه اطلاعات درباره دنیای اطرافمان استفاده می‌کند و افق بازسازی صحنه‌های سه بعدی را گسترش می‌دهد.»

با وجودی که نسخه‌های کامل تر این تحقیق می‌تواند باعث نفوذ وحشتناک و ناخواسته به حریم خصوصی افراد شود، اما حداقل می‌توان با خیال راحت گفت که نسخه امروزی تنها می‌تواند در ایده‌آل‌ترین شرایط یک عروسک را به شکلی مبهم تشخیص دهد.