Основываясь на идее скользящего окна, я использовал сверточные сети для обнаружения объектов на изображениях. Вот его принцип. Предположим, мы хотим обнаружить на фотографии лицо. Мы собираем много фотографий, на которых есть лица, и другие фотографии, на которых их нет. Затем вручную рисуем квадрат вокруг каждого лица. Компьютер регистрирует положение квадратов, извлекает миниатюры лиц, обозначенные квадратами, и стандартизирует их размер, скажем, до 32 × 32 пикселей. Он также собирает большое количество квадратов в произвольных положениях и размерах на изображениях, где нет лиц. Теперь у нас есть коллекция миниатюр с лицами и без. С помощью таких миниатюр мы обучаем сверточную сеть для получения +1 для миниатюр с лицами и 0 для остальных.
Как учится машина. Революция в области нейронных сетей и глубокого обучения
·
Ян Лекун