БастыАудиоКомикстерБалаларға арналған
Тимур Мухамедрахимов
Тимур Мухамедрахимовдәйексөз келтірді1 жыл бұрын
Поэтому нам нужно масштабировать матрицы весов ровно так, чтобы стандартное отклонение активаций оставалось равным 1. Мы можем вычислить точное подходящее значение математически, как это демонстрируют Ксавье Глорот и Йошуа Бенжио (Xavier Glorot, Yoshua Bengio) в своей работе Understanding the Difficulty of Training Deep Feedforward Neural Networks (https://oreil.ly/9tiTC) («Понимание сложности обучения глубоких нейронных сетей прямого распространения»)
Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности
Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности
·
Джереми Ховард
Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности
Джереми ХовардСильвейн Гуггержәне т.б.
989

Кіру не тіркелу пікір қалдыру үшін