هوش مصنوعی گوگل لبخوانی میکند
محققان مرکز هوشمند مصنوعی شرکت گوگل که DeepMind نام دارد، توانستهاند امکان لبخوانی کردن را به هوش مصنوعی گوگل اضافه کنند. براساس ادعای محققان این سیستم دقیقترین روش موجود برای لب خوانی کردن است.
محققان با استفاده از ساعتها برنامهی تلویزیونی از خبرگزاریهای مختلف و سخرانیهای معمولی توانستهاند دقت هوش مصنوعی شرکت گوگل برای لبخوانی را به ۴۶٫۸ درصد برسانند. شاید در نگاه اول این آمار چندان شگفت انگیز نباشد؛ اما باید به این موضوع اشاره کنیم که لبخوانهای حرفهای با دقت ۱۲٫۴ درصد میتوانند این کار را انجام دهند.
البته گروهی دیگر از محققان چند وقت پیش توانسته بودند یک برنامهی لب خوانی با نام LipNet خلق کنند که در شرایط خاص دقت آن به ۹۳٫۴ درصد هم میرسید. البته این برنامه روی افرادی خاص که یکسری جملات رسمی بیان میکردند، آزمایش شده بود. هوش مصنوعی گوگل در لحظه ویدیوها را نگاه میکند و در شرایط مختلف میتواند صحبتها را حدس بزند؛ به همین دلیل چالشهای بیشتری را پشتسر میگذارد. این هوش مصنوعی میتواند صحبتهایی که از قبل مشخص نشدهاند و یا در برنامههای زنده گفته میشوند را هم تشخیص دهد.
برای بالا بردن دقت این هوش مصنوعی از ۵۰۰۰ ساعت ویدیو استفاده شده است. این ویدیوها شامل ۱۷۵۰۰ کلمهی منحصر به فرد بودند. محققان مرکز DeepMind گفتهاند که از هوش مصنوعی گوگل میتوان برای ترجمه کردن صحبت مهاجران استفاده کرد. حتی میتوان از آن در فیلمهای بیصدا و حتی برای کنترل کردن دستیارهای دیجیتالی مانند سیری و الکسا استفاده کرد. افراد کافی است تنها جلوی دوربین لبهای خودشان را تکان دهند تا هوش مصنوعی متوجه گفته آنها بشود و دستور را اجرا کند.
ارسال نظر