Это может привести к значительным изменениям градиента, которые будут препятствовать сходимости сети. Чтобы упростить обучение сети, данные должны:
• принимать небольшие значения — как правило, значения должны находиться в диапазоне 0–1;
• быть однородными — то есть все признаки должны принимать значения примерно из одного и того же диапазона.
Глубокое обучение на Python. 2-е межд. издание
·
Франсуа Шолле