Вісник Львівського університету. Серія прикладна математика та інформатика
Інформація
Рік видання |
2018 |
Випуск |
26 |
Автори |
Романюк В. |
Назва статті |
Дослідження техніки Dropout для детекторів Faster R-CNN з наперед навченими згортковими нейронними мережами для виявлення дуже простих об’єктів, що можуть бути замаскованими |
Анотація |
Метод виявлення об’єктів Faster R-CNN використовує наперед навчену згорткову нейронну мережу для того, щоб навчати детектор на малих навчальних множинах, типових для практики виявлення об’єктів. Перенавчанню в згорткових мережах запобігають за допомогою вставки шарів DropOut. Відкритим питанням є те, чи техніка DropOut набагато поліпшує точність детектора об’єктів Faster R-CNN. Тому наша мета – з’ясувати, як техніка DropOut впливає на продуктивність детектора об’єктів. Первинним набором даних класифікації зображень для попереднього навчання згорткової нейронної мережі є CIFAR-10. Відповідна архітектура згорткової мережі для класифікації зображень CIFAR-10 має 50 % шар DropOut, вставлений між двома повнозв’язними шарами. Задачі виявлення об’єктів, використовувані для навчання і тестування детектора Faster R-CNN, складаються з монохромних зображень, на яких мають бути виявлені невеликі чорні прямокутники. Незважаючи на те, що такі об’єкти – дуже прості, вони можуть бути замаскованими поблизу деяких темних ділянок так, щоб виявлення не було легким. Одна задача полягає у виявленні чорних прямокутників на фронтальних зображеннях приміських будинків. Інша – у виявленні таких прямокутників на зображеннях офісних кімнат. Набір даних приміських зображень поділений на навчальну множину зі 120 зображень і тестову множину зі 121 зображення, з чорним прямокутником у кожному зображенні. Набір даних офісних зображень поділений так само на навчальну множину зі 115 зображень і тестову множину зі 100 зображень, з чорним прямокутником у кожному зображенні. Продуктивність детектора досліджують за трьома параметрами навчання: співвідношення перекриття обмежувальних прямокутників для позитивних навчальних зразків, розмір мінімального прямокутника прив’язки і коефіцієнт пірамідального масштабування обмежувальних прямокутників. Під продуктивністю розуміють кількість виявлених об’єктів разом зі співвідношенням перетину й об’єднання. Однак ні графіки для сум співвідношень перетину й об’єднання, ні графіки для кількості виявлених об’єктів не продемонстрували, щоб техніка DropOut впливала на продуктивність детектора об’єктів Faster R-CNN. Навіть пропустивши кілька об’єктів та знижуючи поріг точності, такий вплив видається незначним. Відтак наперед навчена згорткова нейронна мережа для включення її у склад детектора об’єктів Faster R-CNN не повинна містити шару DropOut, особливо якщо ця мережа з шаром DropOut навчається набагато довше. |
Мова |
Англійська |
PDF
формат |
Романюк В.@nbsp |
| |
©2003-2009 Львівський університет |
Контакти