اگنا-مایکروسافت برنامهی Seeing AI را بر پایهی شبکهی عصبی و با قابلیتهای فراوان برای افراد نابینا منتشر کرد.
به گزارش اگنا مایکروسافت (Microsoft) برنامهای برای گوشیهای هوشمند منتشر کرده است که با استفاده از بینایی کامپیوتری، محیط پیرامونی را برای افراد نابینا تشریح میکند. با استفاده از این اپلیکیشن، کاربران میتوانند دوربین گوشی را به سمت اشخاص بگیرند و اپلیکیشن به آنها بگوید آن شخص چه ویژگیهای ظاهری دارد، چندساله است و در آن لحظه چه احساسی دارد. همچنین میتوانند دوربین را به سمت یک محصول بگیرند و اپلیکیشن به آنها بگوید آن چه محصولی است. تمام این خدمات به وسیلهی هوش مصنوعی و در خود گوشی بهصورت آفلاین انجام میپذیرد.
مایکروسافت در ماه مارس سال گذشته در کنفرانس Build، نمونهی اولیهی Seeing AI را رونمایی کرد. این اپلیکیشن از امروز برای iOS در آمریکا بهصورت رایگان قابل دانلود است؛ اما در مورد زمان انتشار برای کشورهای دیگر و ارائهی نسخهی اندروید آن اعلام رسمی صورت نگرفته است.
این اپلیکیشن در موقعیتهای متعددی قابل استفاده است؛ علاوه بر تشخیص افرادی که قبلا شناسایی کرده است، سن و جنسیت افرار ناآشنا را تشخیص میدهد؛محصولات خانه را با اسکن بارکد آنها تشخیص میدهد؛ اسناد را اسکن میکند و میخواند و پول رایج آمریکا را نیز تشخیص میدهد. این مورد آخر میتواند بسیار کاربردی باشد؛ چرا که تمام اسکناسهای دلار به یک اندازه و رنگ هستند و تشخیص آنها برای افراد نابینا بسیار دشوار و شاید غیر ممکن است. برنامهای مانند Seeing AI به آنها کمک میکند رقم پول را تشخیص دهند.
این اپلیکیشن از شبکهی عصبی برای تشخیص جهان اطراف استفاده میکند. شبکهی عصبی همان فناوری است که در اتومبیلها و پهپادهای خودران به کار میرود. ویژگیهای پایهی اپلیکیشن بهصورت آفلاین روی گوشی انجام میگیرد؛ این یعنی دسترسی به آنها سریع انجام میگیرد و در موقعیتهایی که دسترسی به اینترنت امکانپذیر نیست نیز قابل استفاده هستند؛ اما ویژگیهای آزمایشی Seeing AI، مانند تشریح کل صحنهی مقابل یا تشخیص دستخط، نیاز به اتصال اینترنت و فضای ابری دارد.
سقیب شیخ، سرگروه تیم برنامهنویسی Seeing AI که خود یک نابینا است، میگوید که معمولا از این اپلیکیشن برای خواندن اسناد، امضاها و فهرستها استفاده میکند. وی میگوید این برنامه علاوه بر تشخیص کاراکترها، از کاربر میخواهد که گوشی را به چپ و راست حرکت دهد تا مطلب هدف در کادر قرار گیرد.
به گفتهی شیخ، تفاوت بین این برنامه و برنامههای مشابه سرعت شبکههای عصبی است. وی میگوید:
یکی از مواردی که ما میخواستیم اعمال کنیم، تشخیص چهره بهصورت آفلاین بود و حالا این امر صورت گرفته است و در تنها چند میلیثانیه نتیجهی تشخیص چهره را میشنوید. تفاوت در سرعت است و ما تمام تلاش خود را خواهیم کرد که تا حد امکان، اپلیکیشن آفلاین کار کند
منبع:زومیت