الگوریتم یولو یکی از قدرتمندترین الگوریتمهای تشخیص اشیاء است. این الگوریتم یک مرحله ای بوده و نسبت به رقبای دومرحله ای خود به لحاظ سرعت و دقت پیشی گرفته است.
الگوریتم یولو اولین بار در سال ۲۰۱۵ در مقالهای از اساتید و دانشجویان دانشگاه واشینگتن ارائه شد. در این مقاله جوزف ردمن و دکتر علی فرهادی به همراه دو تن دیگر با ارائه ساختار و شیوهای نوین توانستند مدلی پیشنهاد دهند که با دقت و سرعت بالایی اشیا در تصاویر را شناسایی و موقعیتیابی کند . نتایج به دست آمده از این مدل توجه زیادی از محققان و کارشناسان به خود جلب کرد به طوری که تا آگوست سال ۲۰۲۲ این مقاله بالغ بر ۲۶۰۰۰ ارجاع داشته است.
به طور کلی الگوریتمهای تشخیص اشیا را میتوان به دو دسته تقسیم کرد:
در الگوریتم یولو عکس ورودی به یک شبکه SxS تبدیل میشود که هر کدام از سلولهای شبکه مسئول موقعیتیابی و شناسایی شی درون آن میباشند. با مشخص شدن مختصات باکسها و احتمال کلاسها و محاسبه confidenceمشخص میشود که در هر باکس چقدر محتمل میباشد که شی وجود داشته باشد.
برای اینکه مشخص شود مدل به چه میزانی پیشبینی را خوب انجام داده است از معیاری به نام IOU استفاده میکنیم. اگر فرض کنیم شی مورد نظر داخل باکس قرمز رنگ باشد و باکس آبی رنگ پیشبینی مدل از شی بوده باشد، به نسبت حاصل اشتراک دوباکس به اجتماع آن IOU گفته میشود و هرچه به مقدار ۱ نزدیکتر باشد بیانگر همپوشانی بیشتر دو باکس میباشد.
پس از ارائه اولین نسخه از این الگوریتم در سال ۲۰۱۵، محققان در طی این سالها همواره سعی در بهبود این الگوریتم داشتهاند تا به سرعت و دقت بالاتری بتوانند دست پیدا کنند. آخرین نسخه ارائه شده برای این الگوریتم در جولای ۲۰۲۲ به اسم یولو نسخه 7 بوده که نسبت به نسخههای پیشین خود به طور محسوسی عملکرد بهتری دارد.
گردآورنده: فرید حسنی تبار