Главные 6 разделов искусственного интеллекта
Курс знакомит умного читателя с понятиями и алгоритмами искусственного ин-
теллекта (ИИ) и современными цифровыми технологиями на описании по-опера-
бельного, функционального наполнения различных систем ИИ, включая
DataScience и машинное обучение. Вводятся метрики доходности и рисков внед-
рения ИИ и обосновывается введение синтетического показателя AIY (соотноше-
ние доходности и-риска). Обсуждаются вопросы внедрения ИИ в условиях конку-
ренции на рынке. Вводится вторая рабочая дефиниция ИИ.
18+ В соответствии с ФЗ от 29.12.2010 №436-ФЗ
ISBN 978-5-0053-4210-2 © Leonid Nikiforov, 2021
1. ДЕФИНИЦИИ
как должен быть устроен мозг, чтобы понимать дефиниции?
Этого никто не знает и самые умные карьеристы никогда не задают таких глупых вопросов.
При чем здесь Аристотель?
Алгоритм= чем отличается от алгоритмического Алкоголя? Недоступно для обычного DATA SCIENCE.
Данные, информация = см. Теоремы Шеннона.
Критерии Стьюдента, Пирсона =
http://cito-web.yspu.org/link1/metod/theory/node44.html
Теоремы =
Математический анализ = Математический анализ бесконечно малых переменных величин. Лучше всего по учебнику Сергей Михалыча, конечно.
Дефиниция продвинутого DATA SCIENCIST — см. ЭПИЛОГ.
А ежели нет — то кому-то пора лечиться =
2. ЦЕЛИ ПРОДВИНУТЫХ ЧАЙНИКОФФ
Деньги
Имидж
Жена приказала=
Теща приказала=
Сдуру=
Карьера
…=
…=
Деньги, карты, два ствола!
3. ПУТИ
Думать
Конспектировать
Найти кого, чтобы не скучно
Упал, встал, опять упал, за одного битого=
проверьте ваш мозг — найдите имя художника — автора этой картины)
…=
4. ЯМЫ
Тупо влом
Тупо неврубаюсь
Вру сам себе
Начал, но надрался
Денег хочу, а знания бесполезны!
…=
5. ЯМКИ
Дефки, как всегда
Пошел в баню
…=
6. МУЖИКИ, А ЗАЧЕМ ВАМ «ЭТО
ВСЁ»?
не скажу
сам не знаю
…=
7. ЗАБУДЬТЕ ВСЁ И ДАВАЙ СНАЧАЛА?
С понедельника
В выходные
…=
8. ПОЛЕЗНЫЕ ШПАРГАЛКИ ПО ДИФФЕРЕНЦИАЛЬНЫМ
УРАВНЕНИЯМ И ДРУГИМ МАТЕМАТИЧЕСКИМ ДИСЦИПЛИНАМ
Ну этого добра хоть отбавляй
Дифференциальные уравнения
Конечно, Емелин =
http://mathprofi.com/knigi_i_kursy/
С великой благодарностью!
9. КАК ЛЕГЧЕ ВСЕГО ВЕСТИ СВОИ
ЖУРНАЛЫ ДАННЫХ
Нужно выбрать несколько форм, самых удобных
Бумажные
Электронные — писать во Вконтактик
https://vk.com/club202434888
Нам этом систематика заканчивается, далее — тушите свет,
мужики!
Прорвутся только самые умные. Остальные — не нойте
и не обижайтесь. Ползите под юбку мамки и там плачьте.
Курс Никифорова Л. Г. =Искусственный интеллект и практи-
ческие шаги по внедрению в 2021 г. для руководителей
Курс знакомит участников с понятиями и алгоритмами Ис-
кусственного Интеллекта (ИИ) и современными цифровыми
технологиями на описании по-операбельного, функционального
наполнения различных систем ИИ, включая DataScience и ма-
шинное обучение. Вводятся метрики доходности и рисков
внедрения ИИ и обосновывается введение синтетического по-
казателя AIY (соотношение доходности и-риска). Приводятся
примеры создания показателя при различных уровнях толе-
рантности к риску. Обсуждаются вопросы внедрения ИИ
в условиях конкуренции на рынке. Вводится вторая рабочая
дефиниция ИИ как Принятие решений в условиях неопреде-
ленности. Приводятся примеры на языках python и R структур
данных и операций с ними. Подчеркивается особая роль визу-
ализации даже больших массивов данных и приводится список
команд для построения графиков на языках python и R. Рас-
сматриваются самые распространенные математические крите-
17
рии при обработке больших массивов данных — критерии
Пирсона, Фишера, Стьюдента Дарбина-Уотсона и др. На про-
стых и конкретных примерах разбирается современный подход
к построению систем создания стационарных Баз Знаний. Рас-
сматривается взаимосвязь ИИ с цифровыми технологиями об-
работки данных. После окончания курса, слушатели не обяза-
тельно и не сразу станут разработчиками систем ИИ в полном
смысле этого большого технологического процесса, но хорошо
поймут, как мыслят и как работают разработчики современных
систем ИИ, и смогут стать постановщиками задач и стратегами,
использующими DataScience и современные цифровые техно-
логии в деятельности своей организации. Курс включает в себя
лекционно-учебные занятия, самостоятельную подготовку
участников с помощью предоставленных материалов, выполне-
ние домашних заданий, (а также подготовку и защиту мини-
проекта.)
После завершения данного курса слушатели смогут:
— Организовывать внедрение технологий ИИ в практику
своей деятельности.
— Эффективно взаимодействовать с разработчиками техно-
логий ИИ и BigDATa & DataScience обработки данных, в том чис-
ле способность читать скрипты на языках python и R.
— Формулировать и ставить задачи в области ИИ, а также
таких составляющих как BigDATa & DataScience для разработчи-
ков современных цифровых решений.
— Подготавливать и создавать простые и надежные синтети-
ческие показатели AIY= y — lambda*Risk в практических техно-
логиях ИИ, цифровых технологиях и их составляющих
— Уметь давать задания для составления компьютерных
программ для решения задач ИИ.
Продолжительность курса: 30—45 академических часов
(6 дней).
Содержание курса:
ТЕМА 1: ЧТО ТАКОЕ
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
(ИИ ИЛИ AI).НЕОБХОДИМО
И ДОСТАТОЧНО
— 1.1.Необходимые и достаточные сведения об ИИ. ГЛАВ-
НЫЕ СОСТАВЛЯЮЩИЕ БЛОКИ ИИ. (экономический расчёт вари-
антов затрат на ИИ в 2021г.). Первая рабочая дефиниция ИИ —
по-операбельные и функциональные цепочки логических кон-
струкций как представление компетенций «руководителя» и «ис-
полнителя». Распространение по пространству и времени в 2000
— 2020 гг.
— 1.2. Первое необходимое понимание ИИ, BIG Data,
DataMining — чтобы не переплатить в затратах. Как найти спо-
соб увеличения экономии затрат. Связь доходности внедрения
ИИ с рисками от их деятельности. Необходимость и достаточ-
ность применения функций риска наряду с целевыми функция-
ми оптимизации доходности. Примеры на рынке труда, рынке
ритейла, рынке интернет-услуг и т. д. Как преодолеть противоре-
чия в показателях доходности и риска?.
— 1.3. Необходимые и достаточные базы данных Первое
необходимое понимание ИИ, BIG Data, DataMining — чтобы
не переплатить в затратах. Как способ увеличения экономии за-
трат..
— 1.4. Необходимые и достаточные алгоритмы ИИ с точки
зрения выгоды фирмы. (в 2021г.)
— 1.5. Дз1. Необходимые функции и компетенции ИИ для
эффективного решения первоочередные задач (фирмы в 2021—
2025 гг.).Домашнее задание №1-advanced+ на примере финан-
совых рынков — портфеля марковица по соотношению «доход-
ность-риск».
Ключевые слова: ИИ, риск, доходность, алгоритмы, теория
игр, равновесие по Нэшу, равновесие по Парето
ТЕМА 2: МАССИВЫ ДАННЫХ,
СПОСОБЫ ПОСТРОЕНИЯ БАЗ
ДАННЫХ, СТРУКТУРЫ ДАННЫХ
BIGDATA
— 2.1. Структуры данных в ИИ, BIG Data, DataMining. Увели-
чение потоков данных, оцифровка сегментов рынка и отраслей
покупательских процессов.
— 2.2. Четыре нормальных формы баз данных по Дейту.
Представление данных в языках программирования Python, R,
C++, Matlab.
— 2.3. Процессы накопления данных. Необходимость кор-
ректной визуализации баз данных для увеличения экономиче-
ской эффективности. Получение оценок экономической эффек-
тивности административно-программными методами.
— 2.4. Основные операторы представления больших масси-
вов данных, датасетов и баз данных в языках R, Рython, fortran
etc. Практические примеры скриптов..
— 2.5. Дз-№2. Применение визуализации эффективного
процесса накопления баз данных в 3—5 отраслях покупатель-
ского поведения. Применение операторов языков R, Python, C+
+, fortran. Домашнее задание №2-advanced+.Построение струк-
тур данных. на примере различных секторов экономики. Интер-
нет-кафе, мясокомбинат, ресторан, прачечная/химчистка, авиа-
перевозки, складская логистика.
ТЕМА 3: МАШИННОЕ ОБУЧЕНИЕ
И УТОЧНЕНИЕ ПОНИМАНИЯ
ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
— 3.1. Необходимость и достаточность применения Алгорит-
мов математического моделирования и ML при обработке баз
данных. Линейная алгебра, математический анализ, теория ве-
роятностей, математическая статистика, дискретная математика,
анализ бесконечно малых величин, теория игр, комбинаторика,
линейное программирование, алгоритмы максимизации и др.
— 3.2. Закономерность появления синтетического критерия
{Доходность — Риск} для построения систем ИИ. Понятие «толе-
рантность к риску». Применение синтетического показателя
в России и США. Как практически конструировать YTM? Учет
предметной области (сегмента рынка цифровых технологий)
и характеристик пользователя-руководителя/исполнителя. Риски
так называемых «жадных алгоритмов» теории игр. Основные ха-
рактеристики «равновесия по Нэшу»и «равновесия «по Парето»
в условиях конкурентного рынка..
— 3.3. ИНТЕГРАЛЬНОЕ понимание баз данных и алгоритмов.
Необходимость Второй ДЕФИНИЦИИ ИИ = принятие решений
в условиях неопределённости. Построение синтетического пока-
зателя AIY= y — lambda*Risk, где lambda — толерантность к рис-
ку. Примеры в РФ и США.
— 3.4. Программные средства и основные алгоритмы в зада-
чах ИИ. Задача распознования образов, задача расстояний, за-
дачи поиска, алгоритмы сегментации и др.
— 3.5. Дз3. Примеры построения синтетического показателя
YTM (ДОХОДНОСТИ К СРОКУ) на выбранных 3—5 сегментах по-
требительского поведения как жертвах ВАШЕГО ИИ Домашнее
задание advanced+№3. От простого к сложному. Как составить
алгоритм внедрения ИИ на крупной фирме с min рисков и max
доходности.
ТЕМА 4: ОСНОВНЫЕ КРИТЕРИИ
МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
BIGDATA & DATASCIENCE КАК
НЕОБХОДИМОЕ И ДОСТАТОЧНОЕ
В ИИ.
— 4.1. НЕОБХОДИМОСТЬ математической статистики для об-
работки больших массивов данных. Способы постановки и про-
верки простых и сложных статистических Гипотез. (Мой 35-лет-
ний опыт постановки и проверки Гипотез на больших массива
данных.)
— 4.2. Основные критерии математической статистики —
Пирсона, Стьюдента, Фишера, DURBIN-WATSON, тест Чоу, тест
Рамсея и др. Подробное рассмотрение и необходимая визуали-
зация для (начальства) референтных вышестоящих ЛПР.
— 4.3. РЕГРЕССИИ как способ проверки Гипотез математиче-
ского моделирования о причинах и следствиях экономических
закономерностей и покупательского поведения. Теорема Гаусса-
Маркова и необходимые условия её применения.
— 4.4. Способы устранения «недостатков и недостаточности»
данных для применения Теоремы Гаусса-Маркова — гетероске-
дастичности и автокорреляции остатков. Отрицательные послед-
ствия недостаточного учёта автокорреляции для прогнозов по-
купательского поведения. Практические примеры построения
бинарных моделей logit/probit.
— 4.5. Дз4. Построение доверительных интервалов
в нескольких простых и сложных регрессиях на базе материа-
лов Академии Внешней Торговли. Методы. Домашнее задание-
advanced+ №4. Как просто и буквально на листке бумаги постро-
ить регрессию для 2020 точек?
ТЕМА 5: НЕЙРОСЕТИ И ТЕОРЕМА
КОЛМОГОРОВА. ОБУЧЕНИЕ
И ПЕРЕОБУЧЕНИЕ НС. РИСКИ
НЕЙРОСЕТЕЙ
— 5.1 Доверительные интервалы и их применение в процес-
сах обработки больших массивов данных. Взаимосвязь критери-
ев Фишера и Стьюдента, доверительные эллипсы как основа
экономически эффективного способа обработки больших масси-
вов данных.
— 5.2. Нейросети как способ решения задачи определения
расстояния. Задачи распознования образов в НС и их преобра-
зование к задаче расстояний.
— 5.3 Теорема Колмогорова и стохастический градиентный
спуск в нейросетях. Применение 1-ой дефиниции к нейросетям.
Второй дефиниции к НС. Разбор примеров по необходимости
и достаточности компетенций и результатов. Применение к ма-
шинному обучению.
— 5.4. Принципы нейросетей и что такое обучение и переобучение
НС. Как построить нейросеть наиболее экономно и наглядно (эффек-
тивно) по затратам по различным типам задач (распознавание, обу-
чение, вычисление категорий).
— 5.5. Дз5 Придумать 3—5 постановок,
только постановок задач НС.
Домашнее задание-advanced+ №5.
Подготовка выпускного проекта по применению математических
методов в ИИ.
ТЕМА 6: ВРЕМЕННЫЕ РЯДЫ
(TIME-SERIES). ПОСТРОЕНИЕ
СТАЦИОНАРНЫХ БАЗЗНАНИЙ.
НЕОБХОДИМЫЕ СВЕДЕНИЯ
ИЗ ТЕОРИИ СЛУЧАЙНЫХ
ПРОЦЕССОВ
— 6.1. Особый объект больших массивов данных — времен-
ные ряды (time-series). Теорема об автокорреляции стационар-
ного процесса. АКФ и АКЧФ в задачах моделирования и прогно-
зирования.
— 6.2. Построение стационарных БазЗнаний. Необходимые
сведения из теории случайных процессов: стационарные про-
цессы, случайное блуждание, белый шум, стационарные процес-
сы с трендом по времени. Прогнозируемость, необходимость
и достаточность стационарных процессов для построения устой-
чивых и предсказуемых алгоритмов и БазЗнаний BigDATA
и DataScience. Как посчитать ДОСТАТОЧНЫЕ СТАТИСТИКИ для
описания каждой кусочно-стационарной выборки.
— 6.3. Рассмотрение процесса построения стационарных Ба-
зЗнаний с точки зрения руководителя и исполнителя. Рассмотре-
ние рисков построения Баз Знаний. Как достигнуть наиболее
выгодного/прибыльного алгоритма построения стационарных
БазЗнаний. Конкретные примеры dataset’ов для тестирования
необходимых и достаточных компетенций в задаче создания
первичных Баз Знаний + ИИ.
— 6.4. Вычисление автокорреляционной функции временного
ряда в разных пакетах, а также на языках R, Python, C++. Учет ав-
токорреляции при прогнозировании покупательского поведения.
— 6.5. Домашнее задание №6. Пример на языке R –готовый
алгоритм прогнозирования к использованию. Пример на языке
Python — готовый алгоритм прогнозирования к использованию.
Использование программного пакета GRETL. Домашнее зада-
ние-advanced+ №6. Апробация 2—3 аксиоматик (по полному
учету нескольких компетенций в принятии управленческих ре-
шений, делегируемых ИИ).
Слушатели
Все руководители и специалисты, планирующие внедрение
ИИ, BigData, DataScience и современных цифровых технологий
работы с данными, и желающих получить о них представление.
Предварительная подготовка
Не требуется. Для умных. Для ленивых — всё равно ничего
не поможет… Папику пожалуйтесь.
Но если вы читаете, значит, вы — умный. Так что нет про-
блем, мужики. Я научу, не бойтесь.
Никифоров Леонид Гербертович
1979—1985гг. МФТИ. Факультет управления и прикладной
математики.
1985—1988 аспирантура АН СССР.
1988—1993 — бухгалтер, главный бухгалтер, фин. директор,
Москва.
1994—1999 — работа в коммерческих банках, Москва. Глав-
ный экономист, нач. аналитического отдела, нач. отдела разви-
тия и маркетинга,
главный специалист внутреннего аудита.
2005—2006 начальник отдела маркетинга «Инженерного
центра», СПб.
2005—2006 преподаватель кафедры Высшей математики
СПбПолитехнического Университета.
2008—2010 преподаватель курсов прикладной математики
повышения квалификации «Юридической школы на Фонтан-
ке».
2009 консультант по брендингу группы «РОЭЛ» -консалтинг,
Москва.
27
2009—2012 экономический анализ данных группы «Здоро-
вье нации», Москва.
2000—2020 частный репетитор, Санкт-Петрбург, Москва.
Преподаватель Бизнес-школы INC GROUP в области DATA
SCIENCE, BigDATA, Искусственного интеллекта
Более 20 лет опыта преподавания высшей математики, тео-
рии вероятностей, мат. статистики, маркетингу потребительских
рынков,
эконометрики, DataScience и т. п.
Разработка и проведение более 100 эконометрических мо-
делей Анализа данных на уровне курсовых, дипломных работ и
кандидатских/докторских диссертаций.
Автор более 30 научных статей по анализу данных, матема-
тическому моделированию, искусственному
интеллекту и эконометрики (по темам рынка ценных бумаг,
отраслевому анализу, маркетингу потребительских рынков,
брендингу и т.д.).
++++++++++++++++++++++++++++++++++++
Тема 6: Временные ряды (time-series). Построение стацио-
нарных БазЗнаний. Необходимые сведения из теории случай-
ных процессов.
— 6.1. Особый объект больших массивов данных — времен-
ные ряды (time-series). Теорема об автокорреляции стационар-
ного процесса. АКФ и АКЧФ в задачах моделирования и прогно-
зирования.
Лучше всего прочитать это в учебничке (2011 оригинал,
а русский перевод 2015, 900 стр.) «Введение в эконометрику».
Найдите этот хороший учебничек, если мосх есть.
Страничка для ваших заметок.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Теорема об автокорреляции стационарного процесса. АКФ
и АКЧФ в задачах моделирования и прогнозирования.
Прекрасная Теорема. У Артамонова (МГИМО). Сейчас напишу.
6.2. Построение стационарных БазЗнаний. Необходимые
сведения из теории случайных процессов: стационарные про-
цессы, случайное блуждание, белый шум, стационарные процес-
сы с трендом по времени. Прогнозируемость, необходимость
и достаточность стационарных процессов для построения устой-
чивых и предсказуемых алгоритмов и БазЗнаний BigDATA
30
и DataScience. Как посчитать ДОСТАТОЧНЫЕ СТАТИСТИКИ для
описания каждой кусочно-стационарной выборки.
Стационарные процессы и randomwalk + белый шум ibid.
ДОСТАТОЧНЫЕ СТАТИСТИКИ понятно — мат. ожидание
и дисперсия.
.
.
— 6.3. Рассмотрение процесса построения стационарных Ба-
зЗнаний с точки зрения руководителя и исполнителя. Рассмотре-
ние рисков построения Баз Знаний. Как достигнуть наиболее
выгодного/прибыльного алгоритма построения стационарных
БазЗнаний. Конкретные примеры dataset’ов для тестирования
необходимых и достаточных компетенций в задаче создания
первичных Баз Знаний + ИИ.
— 6.4. Вычисление автокорреляционной функции временного
ряда в разных пакетах, а также на языках R, Python, C++. Учет ав-
токорреляции при прогнозировании покупательского поведения.
— 6.5. Домашнее задание №6. Пример на языке R –готовый
алгоритм прогнозирования к использованию. Пример на языке
Python — готовый алгоритм прогнозирования к использованию.
Использование программного пакета GRETL. Домашнее зада-
ние-advanced+ №6. Апробация 2—3 аксиоматик (по полному
учету нескольких компетенций в принятии управленческих ре-
шений, делегируемых ИИ).
Для вопросов Вконтактик