بینایی ماشین [۱]یکی از شاخههای نوین علوم کامپیوتری است که امروزه با افزایش دوربین های فیلمبرداری دیجیتال ارزان قیمت با کیفیت و بکارگیری این دوربینها در سیستمهای حفاظتی، نظارتی و اتوماسیونها منجربه افزایش نیاز برای تحلیلها وتصمیمگیریهای خودکار ویدیویی را در پی داشته علاقهمندیهای زیادی را نسبت به خود ایجاد کرده است که باعث پیشرفت سریع و قابل توجه این شاخه شده است. یکی از اهداف اصلی بینایی ماشین قادر ساختن رایانه به انجام عملکردهای پایه چشم انسان مانند درک حرکت و درک صحنه می باشد. بینایی ماشین با ترکیب روشهای مربوط به پردازش تصویر و ابزارهای یادگیری ماشینی، رایانه را قادر به درک هوشمند معنا و محتوای تصاویر می کند.
۲-۳-۱)کلیات سیستم
کلیه سیستمهای کنترل اتوماتیک اساسا از یک دوربین، یک کامپیوتر مجهز به بورد رابط و یک سیستم نوردهی و حسگر تشکیل میشوند. چنین سیستمی، ماشین بینایی نامیده میشود که در اندازه گیری و بررسی محصولات کشاورزی و مواد غذایی موفق عمل کرده است. ماشین بینایی از لحاظ کارایی در صنعت مواد غذایی، جزو ١٠ صنعت برتر استفاده کننده از این فنآوری است. پیشرفتهای اخیر در سخت افزار و نرم افزار، به لحاظ مطالعات بیشتر و تولید لوازم ارزانتر، به توسعه این سیستم در صنعت مواد غذایی کمک کرده است. صرفه اقتصادی، دایم بودن، سرعت بالا، دقت و غیر مخرب بودن، دلایل مهم رشد در این صنعت میباشند(بروسنان و سان، ٢٠٠٢ ).
ماشین بینایی علاوه بر بررسی نمونه در نور مرئی، قادر به بررسی در نورهای نامرئی مانند نور NIR،UV و IR میباشد. اطلاعات گرفته شده از اجسام در نور نامرئی در تشخیص میزان رسیدگی محصول، کیفیت و نوع محصول بسیار مفید میباشد. همچنین در تعیین کیفیت و عیوب، ترکیبات و خصوصیات اساسی و تشخیص بیماری پس از برداشت، بسیار مورد استفاده قرار میگیرد. فناوری ماشین بینایی، بهره وری را افزایش داده، هزینهها را کاهش میدهد و کیفیت بهتر و مطمئنتری را برای مصرف کننده فراهم می کند.(چن و همکاران ٢٠٠٢ ) منظور از کیفیت، مجموعه تمام صفاتی است که در صورت جمع شدن آنها در یک مجموعه، محصولی مورد قبول مصرف کننده تولید می شود. فاکتورهای طراحی آن، وابسته به اندازه و رنگ محصول و نیز ویژگیهای بارز آن بوده با تغییر آن ها، این فاکتورها متفاوت خواهند بود.
یک سیستم ماشین بینایی شامل تمام اجزاء لازم بمنظور تهیه ، تعریف دیجیتالی یک تصویر تغییر و اصلاح داده ها و ارائه نمایش داده های تصویری دیجیتالی به دنیای بیرون می باشد چنین سیستمی چنانچه در یک محیط صنعتی بکار گرفته شود ، ممکن است به دلیل اینکه متصل به سایر تجهیزات خط تولید می باشد بسیار پیچیده بنظر می رسد ولی اگر چنانچه با توجه به نقش و وظیفه سیستم بینایی اجزاء اصلی تشکیل دهنده آن بیان شوند ، مشخص خواهد شد که پیچیدگی زیادی در سیستم وجود ندارد. در ادامه جزییات بینایی ماشین را به همراه سایر ویژگی های این فناوری در حوزه پردازش تصویر را تشریح خواهیم کرد.
۲-۳-۲) بینایی ماشین(MV)
بینایی ماشین، روند بکارگیری طیف وسیعی از فن آوریها و روشهایی را در فراهم کردن بازرسی خودکار را بر پایه تصویر برداری، کنترل فرایند و هدایت ربات در کاربردهای صنعتی را شامل میشود. در حالیکه دامنه MV گسترده است و در نظر گرفتن یک تعریف جامع برای ان مشگل است، ما در اینجا یک تعریف کلی و عمومی که در باب بینایی ماشین پذیرفته شده است را بیان میکنیم: بینایی ماشین شامل تجزیه و تحلیل تصاویر در استخراج داده ها برای کنترل یک فرایند یا فعالیت.
۲-۳-۳) کاربردهای بینایی ماشین
استفادههای اولیه برای بینایی ماشین، بازرسی اتوماتیک و هدایت ربات است. برنامه های کاربردی MVمتداول شامل: تضمین کیفیت، دسته بندی، هدایت ربات، بررسی های عمده و کلی و مقیاس نوری میباشد.
۲-۳-۴) متدها
روش بینایی ماشین با دو فرایند، تعریف و ایجاد یک راه حل MVحاصل شده است. و به عنوان فرایندی فنی در طول عملیات تعریف و ایجاد راه حل رخ میدهد. در سال ۲۰۰۶، استاندارد کمی در واسط و تنظیمات مورد استفاده در MV وجود داشت که شامل: واسطهای کاربری و واسطهایی برای یکپارچه سازی سیستمهای چند جزئی و تبادل خودکار اطلاعات میباشد. بااین حال اولین قدم در MV، سلسله متوالی از عملیات برای دستیابی به یک تصویر است که به طور معمول با بهره گرفتن از دوربین، لنز و نور بوده است، که برای فراهم کردن تمایز مورد نیاز در پردازشهای بعدی طراحی شده است.
۲-۳-۵) پردازش تصویر و بینایی ماشین
هدف بسیاری از کارهای پردازش تصویر این است که ویژگیهای مشخصی از تصویر را استخراج کند، تا براساس این خصایص، تفسیر و تعبیرهایی از تصویر پدیدار شود و یا تصمیم گیری انجام پذیرد. این گونه عملیات مخصوصاَََ در حوزه بینایی ماشین مکرراََ مورد استفاده قرار میگیرند. میتوان شکل کلی یک سیستم بینایی ماشین را در سه گروه اصلی تعریف کرد:
استخراج خصایص[۵]، قسمت بندی[۶]، دسته بندی[۷]
۲-۳-۵-۱) استخراج ویژگی
هر کمیت قابل اندازه گیری می تواند همانند یک ویژگی در نظر گرفته شود، که می تواند عددی و یا سمبولیک و یا ترکیبی از هر دو باشد. معمولا ویژگیهای استخراج شده را به شکل یک بردار[۸] نمایش می دهند. نکات مهم در انتخاب ویژگی عبارتند از: قابل محاسبه باشد، سیستم مورد نظر بتواند بر اساس ان ویژگی کار کند و این که ویژگی باید مسئله را بهتر کند و در واقع خصوصیات مهم داده را شامل شود.
استخراج ویژگی فرایندی است که در آن از اطلاعات اولیه، یکسری خصوصیاتی که برای ارزیابی هدف مورد نیاز میباشد، استخراج میشود. یکی از مهم ترین نکات در انتخاب ویژگی این است که ویژگی انتخاب شده باید تحت عملیات چرخشی[۹] و تغییر مقیاس[۱۰] و جابجایی[۱۱] ثابت باقی بماند.
روش های استخراج ویژگی به چند دسته کلی تقسیمبندی میشوند:
۱-استخراج مشخصههای مکانی: که شامل مشخصات دامنهای و مشخصات مربوط به هیستوگرام میباشد.
- مشخصات دامنهای: استخراج مشخصات دامنهای بهسهولت بهوسیله انتخاب نقاطی که مقدار سطح خاکستری آنها در محدوده یا محدودههای مشخصی قرار دارد، قابل انجام است. این روش به نام Intensity Window Slicing معروف است.
- مشخصههای مربوط به هیستوگرام: این مشخصهها بر اساس هیستوگرام ناحیه ای از تصویر تعیین میشود. در واقع مشخصههای استخراج شده از هر ناحیه از تصویر در این روش، از هیستوگرام ان ناحیه استخراج میشوند.
۲- استخراج مشخصههای تبدیلی: بسیاری از مشخصههای یک ناحیه در حوزه فرکانس و یا در حالت کلی در حوزه یک تبدیل از آن ناحیه مشخص میشوند.
۳- آشکارسازی لبهها: یکی از مسائل اساسی در تجزیه و تحلیل تصاویر است. لبه ها، مرزهای اشیاء را مشخص می کنند و لذا برای قسمتبندی تصویر بر اساس اشیاء موجود در آن و نیز تشخیص و شناسایی این اشیاء بهکار برده میشوند. یک نقطه لبه، نقطهای است که در آن تغییر سریع در سطوح خاکستری نقاط مجاور مشاهده می شود. بنابراین با بهکارگیری مکانیزمی برای محاسبه تغییرات سطح خاکستری نقاط در جهات مختلف و تعیین نقاطی که تغییر آن در آنها ماکسیمم است، میتوانیم نقاط لبه را شناسایی کنیم.
۴- استخراج مرزها: مرز، تشکیل شده از لبههای به هم پیوستهای است که یک شیء را مشخص می کند. از مرز برای محاسبه ویژگیهای هندسی شیء نظیر: موقعیت و اندازه ابعاد استفاده میشود. مسئله اول در تشخیص مرز، تشخیص اتصال بین نقاط واقع در لبه است. مسئله دوم پیگیری مرز شیء است و مسئله سوم، پیوند دادن بین نقاط مرزی است که بین آنها اتصال قطع شده است. به این عمل اصطلاحاََ Edge Linking گویند.
۵- مشخص کردن ناحیهها: سادهترین روش برای این کار تعیین نقاطی است که در داخل ناحیه قرار دارند. همچنین میتوانیم مرز ناحیه را مشخص کنیم که در این صورت در مقدار حافظه مورد نیاز صرفهجویی میشود. روش دیگر، روش Run- Lengthcoding است که در این روش تصویر خط به خط پویش میشود، با رسیدن به هر قطعه از ناحیه در خط مورد نظر، نقطه شروع و تعداد نقاطی که در ادامه این نقطه و متصل به آن به ناحیه تعلق دارند، ذخیره میشوند. چهارمین روش استفاده از Quad-Tree برای تعیین نقاط متعلق به یک ناحیه است.
۶- گشتاورها: میتوان آنها را برای هر ناحیه مورد نظر استخراج و مورد استفاده قرار داد.
۷- استخراج مشخصههای هندسی: ویژگیهای هندسی ناحیه مورد نظر را بیان می کند. برخی از مهمترین این مشخصهها عبارتند از: محیط، مساحت، مرکز سطح، شعاعهای مینیمم، تعداد گوشهها، میزان دایروی بودن، تعداد سوراخها، میزان تقارن و … می باشد.
۸- بافت: بافت عبارت از الگوی ساختاری سطح یک شیء مانند: چوب، ماسه، علفزار و پارچه. عبارت بافت معمولا اشاره دارد به ناحیهای که از تکرار یک عنصر بافت[۱۲] تولید میشود. یک بافت شامل چندین پیکسل است که مقادیر آنها ممکن است متناوب، شبه متناوب و یا تصادفی باشد. بافتهای طبیعی ماهیتاََ تصادفی هستند. در حالیکه بافتهای مصنوعی اغلب متناوب هستند. در کل در تجزیه و تحلیل بافتها دو نوع بافت تصادفی و بافت ساختاری را داریم.
استخراج مشخصهها بوسیله شبکه های عصبی خودگردان: این شبکهها، شبکههایی هستند که در آنها یادگیری بدون نظارت صورت میگیرد و تنظیم وزنها با بهره گرفتن از اطلاعات محلی انجام میشود. به این معنی که تغییرات در وزنهای متصل به یک سلول، محدود به همسایگی آن سلول میشود.
۲-۳-۵-۲)روشهای قسمتبندی تصویر
۱- Thresholding: این روش در هر جا که اطلاعات دامنهای تصویر بطور مؤثر بتواند موضوعات مختلف موجود در آن را بیان کند، مفید واقع میشود. با انتخاب ناحیه یا ناحیههایی از فضای دامنه نقاط میتوانیم یک یا چند موضوع را از بقیه جدا کنیم. نحوه انتخاب شدتهای روشنایی (دامنه نقاط) مهمترین مرحله در این روش میباشد.
۲- نام گذاری مؤلفهها[۱۳]: اساس کار این روش بر بررسی اتصال پیکسلها با پیکسل های مجاور میباشد. به این صورت که پیکسلهایی را که به هم متصل هستند بهعنوان یک موجود مستقل در نظر گرفته و نامگذاری می کنند و هنگامی که اتصال بههم بخورد، یک موجود جدید شناسایی میشود، این روش را نامگذاری پیکسل گویند.
۳- روشهای مبتنی بر مرز: روشهایی که مرز اشیاء را مشخص می کنند، نوعی تقسیمبندی روی اجزای تصویر میتوانند انجام دهند. به این صورت که با پیگیری هر مرز میتوان یک شیء را تفکیک کرد و بهعنوان یک قسمت از تصویر در نظر گرفت.
۴- روشهای مبتنی بر ناحیهها[۱۴]: ایده اصلی در روش مبتنی بر ناحیهها این است که ناحیههایی از تصویر را که دارای خصوصیات مشابه میباشند شناسایی نماییم.
۲-۳-۶-۳) دستهبندی
روشهای دستهبندی به دو گروه تقسیمبندی میشوند: روش با حضور ناظر[۱۵] و روش بدون حضور ناظر[۱۶].
۱- با حضور ناظر: روشهای تحت نظارت ممکن است Distribution-Free یا آماری باشند. روشهای Distribution-Free روشهایی هستند که نیازی به دانستن توابع توزیع احتمال را ندارند. در حالیکه روشهای آماری بر اساس مدلهای احتمالاتی عمل می کنند.
۲- بدون حضور ناظر: در این روش سعی میشود تا خوشهبندی یا به عبارت دیگر گروهبندی طبیعی نقطهها، در فضای مشخصهها انجام پذیرد. یک خوشه[۱۷]، مجموعه ای از نقاط در فضای مشخصههاست که چگالی محلی آنها در مقایسه با چگالی نقاط ناحیه احاطه کننده آن، نسبتاََ زیاد باشد. روش خوشهای هم برای قسمتبندی تصویر وهم برای دستهبندی اطلاعات خام برای ایجاد کلاسها و الگوهای اساسی مناسب می باشد. همچنین خوشه برای فشرده سازی اطلاعات نیز کاربرد دارد.
در اینجا پس از به دست آوردن یک تصویر باید عملیات پردازش روی آن را انجام داد.
[۱] Machine vision
[۲] Image processing
[۳] Machine learning
[۴] Machine Vision
[۵] feature extraction
[۶] segmentation
[۷] classification
[۸] feature vector
[۹] Rotation
[۱۰] Scale
[۱۱] Translation
[۱۲] Texel
[۱۳] Component Labeling
[۱۴] Clustring
[۱۵] Supervised
[۱۶] Nonsupervised
[۱۷] Cluster