Тимур Мухамедрахимов: Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности кітабынан алынған цитата. Поэтому нам нужно масштабировать матрицы весов ров...

Тимур Мухамедрахимовдәйексөз келтірді1 жыл бұрын

Поэтому нам нужно масштабировать матрицы весов ровно так, чтобы стандартное отклонение активаций оставалось равным 1. Мы можем вычислить точное подходящее значение математически, как это демонстрируют Ксавье Глорот и Йошуа Бенжио (Xavier Glorot, Yoshua Bengio) в своей работе Understanding the Difficulty of Training Deep Feedforward Neural Networks (https://oreil.ly/9tiTC) («Понимание сложности обучения глубоких нейронных сетей прямого распространения»)

Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности

Джереми Ховард

Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности

Джереми Ховард Сильвейн Гуггержәне т.б.

1.1K

Кіру не тіркелу пікір қалдыру үшін

Тимур Мухамедрахимовдәйексөз келтірді1 жыл бұрын

Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности

Джереми Ховард

Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности

Джереми Ховард Сильвейн Гуггержәне т.б.

1.1K

Кіру не тіркелу пікір қалдыру үшін