Это не техническая проблема алгоритмов. Это следствие человеческого решения о том, какие данные считать релевантными и достаточными. Инженеры, создающие модель (систему машинного обучения), часто даже не знают об исторических особенностях сбора данных в своей предметной области. Они видят набор данных с миллионами записей и считают его репрезентативным, не задаваясь вопросом о том, кто и почему не попал в эти данные
Машинное обучение без иллюзий. Понимание возможностей и границ ML
·
Сергей Кирницкий