دوربین های هوشمندی که می توانند آنچه را که می بینند یاد بگیرند و درک کنند

ژوئیه 7, 2022 - 09:13

0 43

دوربین های هوشمند می توانند به لطف همکاری تحقیقاتی بین دانشگاه های بریستول و منچستر که دوربین هایی را ساخته اند که می توانند آنچه را که می بینند یاد بگیرند و درک کنند.

رباتیک ها و محققان هوش مصنوعی (AI) می دانند مشکلی در چگونگی درک و پردازش سیستم های فعلی جهان وجود دارد. در حال حاضر آنها هنوز هم ترکیبی از سنسورها هستند ، مانند دوربین های دیجیتال که برای ضبط تصاویر طراحی شده اند و دستگاه های محاسباتی مانند واحدهای پردازش گرافیک (GPU) که برای تسریع گرافیک بازی های ویدیویی طراحی شده اند.

این بدان معناست که سیستم های AI فقط پس از ضبط و انتقال اطلاعات بصری بین حسگرها و پردازنده ها ، جهان را درک می کنند. اما بسیاری از چیزهایی که دیده می شوند اغلب برای کار مورد نظر بدرد بخور نیستند.

با این حال ، در حال حاضر تمام این اطلاعات توسط سنسورها با جزئیات دقیق ضبط می شود و باعث مسدود شدن سیستم با داده های بی ربط ، مصرف انرژی و زمان پردازش می شود. برای فعال کردن دید کارآمد برای ماشین های هوشمند ، نیاز به برنامه ریزی بهتری است.

دو مقاله از همکاری های بریستول و منچستر نشان داده است که چگونه می توان سنجش و یادگیری را برای ایجاد دوربین های جدید برای سیستم های AI ترکیب کرد.

Walterio Mayol-Cuevas ، استاد رباتیک ، رایانه بینایی و سیستم های سیار در دانشگاه بریستول و محقق اصلی (PI) ، اظهار داشت: "برای ایجاد سیستم های ادراکی کارآمد ، باید مرزها را فراتر از راههایی که تاکنون دنبال کرده ایم ، رد کنیم.

"ما می توانیم از روش پردازش سیستم های طبیعی جهان بینایی الهام بگیریم - ما همه چیز را درک نمی کنیم - چشم ها و مغز ما با هم کار می کنند تا جهان را درک کنند و در بعضی موارد ، چشم ها نیز برای کمک به مغز کار می کنند. "

مقالاتی ، به سرپرستی دکتر لوری بوز و دیگری توسط یانان لیو در بریستول ، دو اصلاح در مورد این هدف را نشان داده است.

با پیاده سازی شبکه های عصبی (ConvolutionalCNNs) ، نوعی الگوریتم AI برای امکان درک بصری ، مستقیماً در صفحه تصویراست که CNN های ساخته شده توسط این تیم می توانند فریم ها را هزاران بار در ثانیه طبقه بندی کند ، بدون این که نیازی به ضبط این تصاویر یا پردازش آن باشد. محققان نمایش طبقه بندی اعداد دست نویس ، حرکات دست و حتی طبقه بندی پلانکتون ها را در نظر گرفتند و از روی این موجودات الگو برداری کرده اند.

این تحقیق آینده را با دوربین های هوشمند اختصاصی AI - سیستم های دیداری که می توانند به راحتی اطلاعات سطح بالا را به بقیه سیستم ارسال کنند ، از جمله نوع اشیا یا رویدادی که در جلوی دوربین رخ می دهد. این روش باعث می شود سیستم ها بسیار کارآمدتر و ایمن تر باشند زیرا هیچ تصویری نیازبه ثبت وبررسی مجدد ندارد.

این کار به لطف معماری SCAMP که توسط Piotr Dudek ، استاد مدارها و سیستم ها و PI از دانشگاه منچستر و تیمش تهیه شده است ، امکان پذیر شده است. SCAMP یک تراشه پردازنده دوربین است که تیم به عنوان یک آرایه پردازنده (Pixel PPA) توصیف می کند. PPA دارای یک پردازنده در هر پیکسل است که می تواند با یک دیگر ارتباط برقرار کند تا به صورت کاملاً موازی پردازش شود. این برای CNN ها و الگوریتم های دید ایده آل است.

پروفسور دودک گفت: "یکپارچه سازی حسگر ، پردازش و حافظه در سطح پیکسل نه تنها سیستم های با کارایی بالا ، با تاخیر کم را امکان پذیر می کند ، بلکه سخت افزار کم مصرف و بسیار کارآمدی را خواهد داشت.

"دستگاه های SCAMP را می توان با ردپای مشابه سنسورهای دوربین فعلی ، اما با توانایی داشتن یک پردازنده موازی گسترده برای اهداف کلی درست در نقطه ضبط تصویر ، اجرا کرد."

دکتر تام ریچاردسون ، مدرس ارشد مکانیک پرواز ، در دانشگاه بریستول و یکی از اعضای این پروژه در حال تلفیق معماری SCAMP با هواپیماهای بدون سرنشین سبک است.

وی توضیح داد: "آنچه در مورد این دوربین ها بسیار جالب است اینه که ، نه تنها قابلیت یادگیری ماشین تازه ظهور شده ، بلکه سرعت عملکرد آنها و پیکربندی سبک آن است. آنها کاملاً ایده آل برای سکوهای هوایی با سرعت بالا و بسیار چابک هستند که می‌توانند هنگام پرواز یاد بگیرند! "

تحقیقات انجام شده توسط شورای تحقیقات مهندسی و علوم فیزیکی (EPSRC) نشان داده است که زیر سوال بردن فرضیاتی که هنگام طراحی سیستم های AI وجود دارد بسیار مهم است و مواردی که غالباً مهم تلقی می شوند ، مانند دوربین ها ، باید در جهت رسیدن به هدف ماشین هایی با تکنولوژی هوشمند کارآمد بهبود یابند.

منابع

"جاسازی کامل شبکه های کانولوشن سریع در آرایه های پردازنده پیکسل" توسط لوری بوز ، جیانینگ چن ، استفان جی کری ، پیوتر دودک و والتریو مایول-کوئواس ارائه شده در کنفرانس اروپایی چشم انداز رایانه (ECCV 2020)

"استنتاج CNN سبک وزن با استفاده از پیچهای پیچیده روی یک آرایه پردازنده پیکسل" توسط یانان لیو ، لوری بوز ، جیانینگ چن ، استفان جی کری ، پیوتر دودک ، والتریو مایول-کوئوس در کنفرانس ماشین بینایی انگلیس (BMVC 2020)

برای مشاهد بیشتر کلیک کنید