هوش مصنوعی چشم نابینایان میشود
رها منفرد
گروه علم و فناوری
محققان دانشگاه پنسیلوانیا با طراحی اپلیکیشن NaviSense، به یاری نابینایان شتافتند تا بتوانند مستقلتر و ایمنتر از همیشه، در خانه، محل کار یا شهر تردد کنند. این اپ مبتنی بر هوش مصنوعی، اشیا را در لحظه تشخیص میدهد و با کمک راهنمای صوتی و ویبره، نابینایان را به سمت آن هدایت میکند.
«ویجی نارایانان»، از سازندگان این اپلیکیشن میگوید:«بسیاری از ابزارهای فعلی که برای کمک به نابینایان طراحی شده، وابسته به پشتیبانی انسانی هستند یا باید مدلهای اشیا از پیش در یک کتابخانه داده، ذخیره شده باشد. اما این روشها انعطافپذیری اندکی دارند و کاربر را محدود میکنند. گاه فرد نابینا با یک شیء مواجه میشود که پیش از این در کتابخانه دادهها ذخیره نشده بود، به همین دلیل شناسایی شیء توسط فرد نابینا امکانپذیر نخواهد بود.» حالا NaviSense برای حل مشکلات قدیمی ابزارهای ناوبری کمکی طراحی کرده است. او ادامه میدهد:«تیم تحقیقاتی ما برای رفع این مشکل، سراغ هوش مصنوعی و مدلهای زبانی بزرگ (LLMs) و مدلهای بینایی-زبانی (VLMs) رفته است. این سیستمها امکان تفسیر دستورهای صوتی، اسکن محیط اطراف و تشخیص اشیا بدون اتکا به پایگاه داده ثابت را فراهم میکنند که یک دستاورد بزرگ در فناوری است.
«ویجی نارایانان»، توسعه NaviSense را بر اساس مصاحبههای گسترده با کاربران دارای اختلال بینایی میداند و توضیح میدهد که این گفتوگوها تصویر روشنی از چالشهای واقعی کاربران ارائه داد. حالا دیگر این اپلیکیشن پس از شنیدن فرمان صوتی کاربر، با جستوجوی محیط، اشیای بیربط را حذف میکند. اگر برای شناسایی دقیق به اطلاعات بیشتری نیاز باشد، سؤالات تکمیلی میپرسد و تعامل گفتوگومحور ایجاد میکند؛ قابلیتی که بسیاری از ابزارهای موجود فاقد آن هستند.
این اپ با ردیابی حرکت گوشی، کاربر را هدایت میکند که به سمت بالا، پایین، چپ یا راست برود. در واقع NaviSense با کاهش مدت زمان جستوجو و افزایش دقت شناسایی، تجربه بهتری برای کاربران رقم میزند. قرار است در مرحله بعد، بهینهسازی مصرف انرژی و کارایی مدلهای پردازش این فناوری در دستور کار قرار گیرد.

