Понижающая дискретизация может происходить по-разному. Уменьшение изображения вдвое эквивалентно генерации одного пикселя на выходе на основе четырех соседних пикселей на входе. Как именно вычислять значение на выходе по значениям на входе — наше дело. Можно:
• усреднять значения четырех входных пикселей — изначально весьма распространенный подход под названием «усредняющая субдискретизация» (average pooling), несколько утративший популярность в последнее время;
• брать максимум из значений четырех входных пикселей — в настоящее время чаще всего используется именно этот подход: субдискретизация с выбором максимального значения (max pooling). Его недостаток в том, что отбрасываются три четверти данных;
• шаговая свертка (strided convolution), при которой учитывается лишь каждый N-й пиксель — свертка 3 × 4 с шагом 2 позволяет учесть значения всех пикселей предыдущего слоя. Судя по публикациям, этот подход весьма перспективен, хотя и не вытеснил пока что субдискретизацию с выбором максимального значения.