الگوریتم تشخیص اشیاء یولو

الگوریتم یولو یکی از قدرتمندترین الگوریتمهای تشخیص اشیاء است. این الگوریتم یک مرحله ای بوده و نسبت به رقبای دومرحله ای خود به لحاظ سرعت و دقت پیشی گرفته است.

تاریخچه الگوریتم یولو

الگوریتم یولو اولین بار در سال ۲۰۱۵ در مقاله‌ای از اساتید و دانشجویان دانشگاه واشینگتن ارائه شد. در این مقاله جوزف ردمن و دکتر علی فرهادی به همراه دو تن دیگر با ارائه ساختار و شیوه‌ای نوین توانستند مدلی پیشنهاد دهند که با دقت و سرعت بالایی اشیا در تصاویر را شناسایی و موقعیت‌یابی کند . نتایج به دست آمده از این مدل توجه زیادی از محققان و کارشناسان به خود جلب کرد به طوری که تا آگوست سال ۲۰۲۲ این مقاله بالغ بر ۲۶۰۰۰ ارجاع داشته است.

الگوریتم یولو چیست؟

به طور کلی الگوریتم‌های تشخیص اشیا را می‌توان به دو دسته تقسیم کرد:

  • ۲ مرحله‌ای: در اینگونه الگوریتم‌ها در مرحله اول تشخیص ناحیه‌های که ممکن است شی وجود داشته باشد صورت می‌گیرد و در مرحله بعد طبقه‌بندی هر کدام از ناحیه‌ها صورت می‌گیرد
  • ۱ مرحله‌ای: در اینگونه الگوریتم‌ها مانند یولو مراحل ذکر شده به صورت یکجا صورت می‌گیرد.

الگوریتم یولو چگونه کار می‌کند؟

در الگوریتم یولو عکس ورودی به یک شبکه SxS تبدیل می‌شود که هر کدام از سلول‌های شبکه مسئول موقعیت‌یابی و شناسایی شی درون آن می‌باشند. با مشخص شدن مختصات باکس‌ها و احتمال کلاس‌ها و محاسبه confidenceمشخص می‌شود که در هر باکس چقدر محتمل می‌باشد که شی وجود داشته باشد.

مفهوم IOU (Intersection over Union)

برای اینکه مشخص شود مدل به چه میزانی پیش‌بینی را خوب انجام داده است از معیاری به نام IOU استفاده می‌کنیم. اگر فرض کنیم شی مورد نظر داخل باکس قرمز رنگ ‌باشد و باکس آبی رنگ پیش‌بینی مدل از شی بوده باشد، به نسبت حاصل اشتراک دوباکس به اجتماع آن IOU گفته می‌شود و هرچه به مقدار ۱ نزدیک‌تر باشد بیانگر همپوشانی بیشتر دو باکس می‌باشد.

نسخه‌های الگوریتم یولو

پس از ارائه اولین نسخه از این الگوریتم در سال ۲۰۱۵، محققان در طی این سال‌ها همواره سعی در بهبود این الگوریتم داشته‌اند تا به سرعت و دقت بالاتری بتوانند دست پیدا کنند. آخرین نسخه ارائه شده برای این الگوریتم در جولای ۲۰۲۲ به اسم یولو نسخه 7 بوده که نسبت به نسخه‌های پیشین خود به طور محسوسی عملکرد بهتری دارد.

گردآورنده: فرید حسنی تبار