بررسی چگونگی عملکرد Computer Vision - قسمت اول !

تاریخ انتشار 1403/4/12

بررسی چگونگی عملکرد Computer Vision - قسمت اول  !

 

از آنجا که من وارد فاز پیاده سازی یک سیستم بزرگ مبتنی بر Computer Vision شده ام، با خود گفتم اندکی شما هم از اقیانوس علم بنده بهره مند شوید، باشد که اصلا در این اقیانوس غرق شوید و از شرتان خلاص شویم، مگر آنکه با تیوپ و جلیقه نجات وارد شوید که آن دیگر امری است علی حده !

 همانطور که میدانید ، بینایی چشم انسان به خودی خود پدیده ای است پشم ریزان و راز آلود !. از میلیونها سال قبل انسان میتواند با چشمان خود ببیند و این آغاز این ماجرای شگفت انگیز بوده است . اگر بخواهیم در چند ثانیه و خیلی کوتاه به بررسی مغز و سیستم عصبی و بینایی انسان بپردازیم، تصویر ساده ای مشابه زیر خواهیم داشت.

ظاهرا در سال 1860 بوده که اولین دوربین عکاسی یا میتوان گفت چیزی مشابه آن اختراع گشته است ( سالش را شک دارم، خیلی هم برایم مهم نیست). در عمل یک قوطی بوده که درون آن یک صفحه آغشته به کلرید نقره بوده است ، نه چیزی بیشتر.وقتی آن دریچه جولو را باز میکرده اند ، نور به این صفحه میتابیده و یک سری قسمتها سیاه میشده است که در عمل همان قسمتهایی که بوده که بعدا شامل تصویر می گشته است که یک چیزی مشابه آن در تصویر زیر مشهود است.

حالا در شونصد سال بعد، می توانیم اصلا تصویر را به Digital Form تبدیل کنیم، یعنی دقیقا عملکرد Human Eye را میتوانیم Mimic کنیم . آن هم در زیر 1 ثانیه ( پششششماااام).

 تا اینجای کار بخش آسان قصه بود، اصل کار که سخت است درک محتوای تصویر است. این چیزی است که عملکرد مغز انسان است و این همان قسمت رازآلود ماجرا می باشد.

 به این تصویر دقت کنید

 

خوب هر خری به این نگاه کند می فهمد که این عکس یک گل است !
ولی خوب مشکل اینجا است که حتی خر هم مغز دارد و مغز را خداوند بزرگ و مهربان آفریده است و ما بنده های خدا از خلق مغزی طبیعی عاجزیم، لذا باید یک ماشینی درست کنیم که اندکی زور این عضو عجیب را داشته باشد، در نتیجه اول باید تصویر را برای ماشین قابل فهم کنیم. اینجا است که پای الگورتیم به میان می آید . در اساس و بنیان الگورتیم ها ، تصویر دارای ساختار زیر است

یک آرایه گنده از اعداد صحیح !

 

خوب حالا یک بررسی کننده الگورتیم نیاز داریم که اندکی شبیه مغز انسان عمل کند !. این یعنی همان Machine و برای اینکه بحث را کوتاه کنم، باید بگویم، این یعنی Machine Learning

 

 

 

 

یعنی ماشین را به شکلی Train کنیم که بر اساس یک سری پترن توان تشخیص و تمیز دادن مثلا اشیاع را پیدا کند !

 مثلا اینطوری

 

 

خوب حالا این را میتواند برچسبی بزند و به آن بگوید Flower !

 

خوب حالا باز بدبختی جدیدی شروع میشود. این دسته بندیها و بررسی کردنها در جهت دقیق تر شدن این توان تشخیص خودش هم سخت است، هم زمانبر ، هم هزینه بر ، لذا خود ماشین باید این وظیفه را بر عهده بگیرد

 الان به مثال زیر توجه کنید

 

این سگها و تمیز کننده های کف خیلی شبیه همدیگر هستند. اینها تشخیصشان برای ما انسانها هم ساده نیست، حالا چه خاکی توی سرمان کنیم ؟

خوب اینم حل شدنی است، ببینیم چطوری :

به این شکل!. حالا به این شکل، یعنی چی ؟

 

باید حجم بالایی از تصاویر این نوع از سگها و این زمین شورها را تهیه کنیم و در اختیار ماشین قرار دهیم

  

 

 حالا خواهیم دید که Computer Vison وظیفه تشخیص این را از همدیگر بر عهده خواهد گرفت

 

ظاهرا درصد تشخیصش هم بد نیست

اما خوب مثل ما آدمها، ماشین هم گاهی در وضعیت این دیگه چه کوفتی بود دیگه قرار می گیرد  و دقت آن زیر سوال می رود !

 

خوب حالا برویم و ببینیم کلا چه راه حلهایی پیش رو داریم اصلا . اولین و عمومی ترین راه حل موجود : Convolutional neural network که به آن CNN هم گفته می شود ، می باشد!

 

حال از آنجا که با یک کارشناس ارشد هوش مصنوعی به عنوان نویسنده این چرندیات طرف هستید، در قسمت بعدی به بررسی CNN از بیخ خواهم پرداخت تا همه خزان شوید !

 

 

 

 


An unhandled exception has occurred. See browser dev tools for details. Reload 🗙