هوش مصنوعی چشم نابینایان می‌شود

رها منفرد
گروه علم و فناوری


محققان دانشگاه پنسیلوانیا با طراحی اپلیکیشن NaviSense، به یاری نابینایان شتافتند تا بتوانند مستقل‌تر و ایمن‌تر از همیشه، در خانه، محل کار یا شهر تردد کنند. این اپ مبتنی بر هوش مصنوعی، اشیا را در لحظه تشخیص می‌دهد و با کمک راهنمای صوتی و ویبره، نابینایان را به سمت آن هدایت می‌کند.
«ویجی نارایانان»، از سازندگان این اپلیکیشن می‌گوید:«بسیاری از ابزارهای فعلی که برای کمک به نابینایان طراحی شده، وابسته به پشتیبانی انسانی هستند یا باید مدل‌های اشیا از پیش در یک کتابخانه داده، ذخیره شده باشد. اما این روش‌ها انعطاف‌پذیری اندکی دارند و کاربر را محدود می‌کنند. گاه فرد نابینا با یک شیء مواجه می‌شود که پیش از این در کتابخانه داده‌ها ذخیره نشده بود، به همین دلیل شناسایی شیء توسط فرد نابینا امکان‌پذیر نخواهد بود.» حالا NaviSense برای حل مشکلات قدیمی ابزارهای ناوبری کمکی طراحی کرده است. او ادامه می‌دهد:«تیم تحقیقاتی ما برای رفع این مشکل، سراغ هوش مصنوعی و مدل‌های زبانی بزرگ (LLMs) و مدل‌های بینایی-زبانی (VLMs) رفته است. این سیستم‌ها امکان تفسیر دستورهای صوتی، اسکن محیط اطراف و تشخیص اشیا بدون اتکا به پایگاه داده ثابت را فراهم می‌کنند که یک دستاورد بزرگ در فناوری است.
«ویجی نارایانان»، توسعه NaviSense را بر اساس مصاحبه‌های گسترده با کاربران دارای اختلال بینایی می‌داند و توضیح می‌دهد که این گفت‌و‌گوها تصویر روشنی از چالش‌های واقعی کاربران ارائه داد. حالا دیگر این اپلیکیشن پس از شنیدن فرمان صوتی کاربر، با جست‌و‌جوی محیط، اشیای بی‌ربط را حذف می‌کند. اگر برای شناسایی دقیق به اطلاعات بیشتری نیاز باشد، سؤالات تکمیلی می‌پرسد و تعامل گفت‌وگومحور ایجاد می‌کند؛ قابلیتی که بسیاری از ابزارهای موجود فاقد آن هستند.
این اپ با ردیابی حرکت گوشی، کاربر را هدایت می‌کند که به سمت بالا، پایین، چپ یا راست برود. در واقع NaviSense با کاهش مدت زمان جست‌وجو و افزایش دقت شناسایی، تجربه بهتری برای کاربران رقم می‌زند. قرار است در مرحله‌ بعد، بهینه‌سازی مصرف انرژی و کارایی مدل‌های پردازش این فناوری در دستور کار قرار گیرد.