Машинное обучение — это набор методов анализа данных, основанных на алгоритмах, которые дают все более точные результаты по мере поступления новых данных. Машинное обучение лежит в основе систем рекомендаций, программ распознавания лиц, «умных» колонок и даже беспилотных автомобилей. Эта уникальная книга объясняет основные понятия машинного обучения на простых и доступных примерах, увлекательных упражнениях и запоминающихся иллюстрациях. Здесь нет зубодробительного академического жаргона, для понимания объяснений достаточно знаний основ алгебры. По мере чтения вы будете создавать модели для идентификации спама, и распознавания изображений и другие интересные проекты на языке Python. Откройте для себя мощные методы машинного обучения, для понимания и применения которых достаточно знаний математики на уровне средней школы! Для читателей, знающих основы языка Python. Знаний в области машинного обучения не требуется.
NumPy — для хранения массивов и выполнения сложных математических вычислений; • Pandas — для хранения, обработки и анализа больших наборов данных; • Matplotlib — для построения графиков данных; • Turi Create — для хранения и обработки данных, а также обучения моделей; • Scikit-Learn — для обучения моделей машинного обучения; • Keras (TensorFlow) — для обучения нейронных сетей.
Теперь применим алгоритм, чтобы приблизить прямую к точкам. Следующая строка кода запускает алгоритм с признаками, метками, скоростью обучения, равной 0,01, и количеством периодов, равным 10 000:
В первую очередь мы кодируем признаки и метки набора данных, приведенных в табл. 3.2, в виде массивов NumPy следующим образом:
import numpy as np
features = np.array([1,2,3,5,6,7])
labels = np.array([155, 197, 244, 356, 407, 448])
Далее строим график набора данных. В репозитории в файле utils.py есть некоторые функции для построения кода, на который вам предлагается взглянуть. График набора данных показан на рис. 3.14. Обратите внимание на то, что точки практически образуют прямую