Интеллектуальное право в условиях развития технологии Big Data. База данных как объект интеллектуальных и иных прав. Монография
Қосымшада ыңғайлырақҚосымшаны жүктеуге арналған QRRuStore · Samsung Galaxy Store
Huawei AppGallery · Xiaomi GetApps

автордың кітабын онлайн тегін оқу  Интеллектуальное право в условиях развития технологии Big Data. База данных как объект интеллектуальных и иных прав. Монография


Интеллектуальное право в условиях развития технологии Big Data.
База данных как объект интеллектуальных и иных прав

Монография



Информация о книге

УДК 347.77:004

ББК 64.404.3:32.81

И73


Авторы:
Войниканис Е. А., кандидат юридических наук, кандидат философских наук, доцент, ведущий научный сотрудник Международного центра конкурентного права и политики БРИКС НИУ ВШЭ;
Кольздорф М. А., магистр юриспруденции (РШЧП), LL.M. (FU, MIPLC), преподаватель НИУ ВШЭ;
Корнеев В. А., кандидат юридических наук, доцент, профессор кафедры интеллектуальных прав Исследовательского центра частного права им. С. С. Алексеева при Президенте Российской Федерации;
Ульянова Е. В., аспирант Российской академии народного хозяйства и государственной службы при Президенте Российской Федерации (РАНХиГС);
Шебанова Н. А., доктор юридических наук, доцент, профессор кафедры интеллектуальных прав Московского государственного юридического университета им. О. Е. Кутафина (МГЮА).

Рецензенты:
Гринь Е. С., кандидат юридических наук, доцент, заместитель заведующего кафедрой интеллектуальных прав Московского государственного юридического университета им. О. Е. Кутафина (МГЮА);
Новоселова Л. А., доктор юридических наук, профессор, заслуженный юрист Российской Федерации, заведующая кафедрой интеллектуальных прав Московского государственного юридического университета им. О. Е. Кутафина (МГЮА).


Стремительный рост объема разнородной информации, формируемой в виртуальной среде, привел к возникновению феномена, известного как «большие данные» (Big Data). Данные становятся сегодня основным ресурсом для повышения эффективности и производительности практически всех отраслей современной экономики. Ценность больших данных актуализирует вопрос о возможности и целесообразности охраны этих данных, защиты тех ресурсов, которые были затрачены на их сбор и обработку. Особенностью российского и зарубежного законодательства является возможность правовой охраны больших массивов данных смежным правом на базы данных, которое, не вводя правовой охраны данных как таковых (отдельных материалов, элементов содержания базы данных), устанавливает правовой режим использования всей совокупности данных, составляющих содержание баз данных. Не менее важным является вопрос о защите самих данных, которые, будучи весьма разнородными, могут охраняться государством по-разному.

Законодательство приведено по состоянию на 1 декабря 2021 г.

Настоящая монография посвящена в первую очередь исследованию вопроса о том, что же в целом понимается под условным термином «большие данные», какое в этой сфере существует регулирование и в каком направлении следует задуматься о его совершенствовании. Отдельно проводится анализ правового регулирования баз данных в России и за рубежом тех возможностей, которые правовая охрана баз данных предоставляет при работе с Big Data. Правовой режим данных как таковых рассматривается на примере защиты персональных данных, поскольку обработка больших данных открывает невиданные прежде возможности вмешательства в частную жизнь, неприкосновенность которой гарантирована ст. 23 Конституции Российской Федерации.


Исследование выполнено при финансовой поддержке Российского фонда фундаментальных исследований (РФФИ) в рамках гранта № 18-29-16169
«Интеллектуальное право в условиях развития технологии Big Data.
База данных как объект интеллектуальных и иных прав».
Текст печатается в авторской редакции.
Изображение на обложке foxaon1987 /Shutterstock.com


УДК 347.77:004

ББК 64.404.3:32.81

© Коллектив авторов, 2022

© ООО «Проспект», 2022

ВВЕДЕНИЕ

Мы живем в мире, где непрерывно генерируются и обрабатываются огромные массивы данных, однако даже с учетом высоких темпов технологического развития большие данные представляют собой относительно новый феномен. История больших данных насчитывает менее двадцати лет: с 2005 г. берет свое начало активное использование больших данных для управления бизнес-­процессами и прогностической аналитики1, и только затем, спустя некоторое время, получает признание ощутимое воздействие больших данных на экономику и общество2. На современном этапе важное значение имеет сопряженность больших данных с другими сквозными технологиями, такими как технологии искусственного интеллекта и интернета вещей. Не случайно в Российской Федерации после длительных дискуссий в итоге отказались от принятия самостоятельной дорожной карты по большим данным: направление больших данных было объединено с направлением по развитию искусственного интеллекта3. Наличие и анализ массивов данных является необходимым условием для разработки и развития любых технологий искусственного интеллекта. Так, сбор огромных массивов машинных данных обеспечивает, прежде всего, интернет вещей. Но и сам искусственный интеллект, включая машинное и глубокое обучение, можно назвать ключевой технологий, позволяющей извлекать максимальную ценность из больших данных.

Стремительное развитие технологий, повсеместное внедрение компьютерных сетей, построение глобального информационного пространства, рост числа лиц, задействованных в сфере информационных технологий, увеличение доли ВВП, приходящейся на информационный сектор экономики стран — это все основные признаки информационного сообщества.

Данные становятся сегодня основным ресурсом для повышения эффективности и производительности практически всех отраслей современной экономики. Не менее интенсивно данные используются в государственном управлении и в социальной сфере. Однако большие данные имеют и свою негативную сторону: риски, связанные с концентрацией и монополизацией данных, непрозрачными и нередко недобросовестными бизнес-­практиками, манипулированием общественным мнением и нарушением права на неприкосновенность частной жизни. Как следствие, перед государством стоит задача не только стимулировать развитие рынка больших данных, но и максимально снизить существующие риски. В решении этой задачи существенную роль играет правовое регулирование.

Развитие информационных технологий закономерно привело к возникновению ряда острых правовых вопросов. В центре стоит решение главных задач: кому принадлежит информация и как право на информацию должно соотноситься с частными интересами и правами лиц — участников отношений.

В настоящее время отечественное законодательство предусматривает общие положения, касающиеся правового регулирования информации в целом.

В соответствии с Федеральным законом «Об информации, информационных технологиях и о защите информации»4 (далее — Закон об информации) информация — сведения (сообщения, данные) независимо от формы их представления. В сферу правового регулирования Закона об информации попадают отношения, связанные с осуществлением поиска, получением, передачей, производством и распространением информации в информационных сетях, в том числе в сети Интернет.

В статье 3 Закона об информации устанавливаются основные принципы правового регулирования отношений в указанной сфере, в том числе:

1) принцип свободы поиска, получения, передачи, производства и распространения информации любым законным способом;

2) принцип установления ограничений доступа к информации только федеральными законами;

3) принцип неприкосновенности частной жизни, недопустимость сбора, хранения, использования и распространения информации о частной жизни лица без его согласия.

При этом закон отдельно указывает, что информация может являться объектом публичных, гражданских и иных правовых отношений (статья 5 Закона об информации).

Обладатель информации, которым может быть гражданин Российской Федерации, юридическое лицо, сама Российская Федерация и ее субъекты, а также муниципальное образование, вправе самостоятельно определять порядок доступа, использования, передачи или совершения иных действий, связанных с информацией.

Исходя из содержания Закона об информации, информация, в зависимости от пределов ее распространения, может быть нескольких видов:

1) свободно распространяемой;

2) распространяемой в соответствии с законодательством;

3) распространяемой в ограниченном круге лиц (по соглашению участников);

4) запрещенной к распространению.

При этом важно отметить, что в соответствии со статьей 7 Закона об информации, информация может являться общедоступной — то есть доступ к ней является неограниченным. К такой информации, в частности, относится информация, размещаемая ее обладателями в сети Интернет в формате, допускающем автоматизированную обработку без предварительных изменений человеком. Данная разновидность информации размещается в форме открытых данных.

Таким образом, в зависимости от пределов доступности информация может быть:

1) ограниченного доступа (например, персональные данные в соответствии с Федеральным законом «О персональных данных»5);

2) общего доступа;

3) закрытого доступа (например, информация, составляющая тайну усыновления ребенка в соответствии со статьей 139 СК РФ).

Как было отмечено выше, в соответствии с Законом об информации, информация может являться объектом гражданских прав. Следует отметить, что именно в качестве объекта гражданских прав (статья 128 ГК РФ), информация была исключена из гражданского законодательства с 5 декабря 2007. Таким образом, в настоящее время информация, размещаемая пользователями в сети Интернет, с точки зрения гражданского права, может быть отнесена к:

— информации, по своей сути составляющей персональные данные (имена пользователей, контактные данные, данные о рождении, информация о подписках и подписчиках и т. д.)

— информации, являющейся объектом интеллектуальной собственности (фотографии, видеоклипы, посты, комментарии, музыкальные произведения и др.).

В отношении информации, размещаемой в сети Интернет и попадающей под режим правовой охраны объектов интеллектуальной собственности, действуют механизмы использования и защиты, предусмотренные частью четвертой ГК РФ. За пределами правовой охраны в данном случае оказывается информация, составляющая сообщения о событиях и фактах, имеющие исключительно информационный характер (статья 1259 ГК РФ).

В свою очередь информация, представляющая персональные данные, по своей природе является нематериальным благом, принадлежащим гражданину от рождения или в силу закона, неотчуждаемым и непередаваемым по своей природе (статья 150 ГК РФ). То есть, с точки зрения как гражданского законодательства, так и специальных законов, такая информация является защищенной от свободного использования третьими лицами априори.

Нормы действующего законодательства достаточно четко направлены на регулирование отношений, связанных с самостоятельным размещением пользователями информации в общедоступных источниках. При этом за пределами общей правовой определенности остается та информация, которая собирается за счет автоматизированных систем или оказывается предоставленной пользователями неосознанно, о чем будет сказано ниже.

В информационно-­телекоммуникационных сетях, в частности в сети Интернет, размещаемая напрямую или опосредовано пользователями информация сама по себе является разнородной. Пользователи, не придавая значения, какие именно сведения передаются во «всемирную паутину», своими действиями сами дают согласие на использование принадлежащих им данных (составляющих, как результаты интеллектуальной деятельности, так и персональные данные). Более того, зачастую пользователи даже не имеют возможности отследить, кто именно будет осуществлять доступ и обработку размещаемой информации.

Для определения огромного массива разнородных данных, как структурированных, так и разрозненных, размещенных в информационно-­телекоммуникационных сетях, принято использовать термин — Big Data (дословно «большие данные»)6. Именно возможность свободного использования «больших данных» вызывает наибольшую обеспокоенность с правовой точки зрения.

Председательствующая судья Верховного патентного суда ФРГ К. Фрие отметила, что Big Data представляет новую эпоху цифрового обмена данными. При этом сбор указанных данных осуществляют не люди, а автоматические программные алгоритмы, поскольку такой объем сведений человек обработать не в состоянии. Во многом это связано с тем, что «большие данные», помимо сведений, размещаемых пользователями самостоятельно, содержат также автоматически собираемую информацию при помощи:

— систем слежения (содержат записи изображений физических лиц, которые, скорее всего, не давали своего разрешение на проведение видеофиксации);

— платежных систем (внесение данных о банковских картах при проведении транзакции через информационно-­телекоммуникацион­ные сети);

— использование электронных устройств, имеющих доступ в ин­формационно-­телекоммуникационную сеть и обрабатывающих информацию («умные» часы, навигаторы и др.);

— автомобили, оснащенные бортовым компьютером;

— жилые помещения, оснащенные технологией «умный дом»;

— сведения, собираемые организаторами мероприятий (покупка билетов на мероприятия через электронные кассы, заполнение онлайн форм для регистрации на научные и развлекательные события) и т. д.

Цели, для которых операторы (лица, заинтересованные в использовании данных) собирают сведения о пользователях, чаще всего преследуют коммерческий интерес. Нарушение прав на информацию заключается в том, что операторы желают осуществлять такой сбор с наименьшими затратами с финансовой точки зрения и в сокращенные сроки (ценность информации о пользователях заключается в ее актуальности). Поэтому источниками необходимых сведений для операторов становятся социальные сети, сведения о запросах из поисковых систем, а также любая иная информация, находящаяся в открытом доступе.

Собранная информация систематизируется при помощи автоматических алгоритмов. В итоге операторы получают готовый продукт в виде систематизированных сведений о конкретном лице, который может быть использован самим оператором или продан заказчику.

Указанный выше процесс сбора, обработки и последующего использования данных о пользователе в преобладающем большинстве случаев происходит без согласия последнего.

Таким образом, перед общепринятой системой защиты информации стоит сложная задача: оставляя возможность распространения информации, при этом сохранять тайну данных пользователей, собираемых в том числе в автоматическом режиме.

Возможным способом решения поставленной задачи является деперсонализация пользователей информационно-­телекоммуникационных сетей. Большинство действующих браузеров, действующих в сети Интернет, предоставляют пользователям возможность включения режима приватного просмотра сайтов. В таком режиме браузер не сохраняет данных о просмотренных интернет-­страницах, а временные файлы Интернета, файлы кэша, журналы просмотра не будут сохраняться в памяти устройства, через который выполнен вход в сеть.

При этом использование приватного режима не гарантирует изоляции всех данных о пользователях по ряду причин.

Во-первых, как уже было сказано, в некоторых случаях пользователи вынуждены передавать данные о себе операторам, в том числе давая согласие на сохранение таких данных. Например, при использовании услуг сетевых магазинов клиент должен указать контактную информацию (адрес электронной почты, номер телефона; почтовый адрес), сведения о способе оплаты (включает информацию о банковских картах). В объем собираемых данных также может попасть информация о товарах, которые пользователь приобретает.

Во-вторых, в большинстве случаев пользователи добровольно сообщают информацию о себе в социальных сетях. Даже при минимальном доступе к странице в социальной сети общедоступной информацией является имя пользователя, его фотографическое изображение, а также непосредственный адрес страницы в сети. Количество пользователей крупнейших социальных сетей (Facebook, Instagram, Twitter, ВКонтакте) по состоянию на 2019 превышает 3 млрд человек (по состоянию на 2010 год количество зарегистрированных пользователей составляло около 900 млн)7.

В-третьих, широкое распространение получило явление известное как «интернет вещей» — тесная интеграция реального и виртуального мира, в котором производится общение между людьми и устройствами8. Это означает, что информацию о пользователе могут собирать не только традиционные компьютерные устройства, смартфоны, планшетные компьютеры, но и любые бытовые предметы, имеющие доступ к информационно-­телекоммуникационной сети (технология «умный дом»). В силу удобства использования современных технологий большинство пользователей не готово отказаться от комфорта в пользу абстрактной защиты персональных данных.

Очевидным становится факт, что полностью прекратить размещение информации пользователями в информационно-­телекоммуника­ционных сетях в современных условиях не представляется возможным.

Поэтому в качестве возможных мер по поиску баланса между интересами пользователей и возможностью свободного использования информации высказываются следующие предложения:

1. Сведения о защите персональных данных и иной размещаемой пользователями информации должны быть доступны на всех ресурсах, где такие данные запрашиваются.

2. Разработка международных документов, предусматривающих основополагающие принципы и минимальные гарантии пользователей в вопросах защиты информации. Проблема заключается в том, отношения, возникающие в сети Интернет, носят трансграничный характер, поэтому национальные законодательства отдельных стран могут быть не в состоянии комплексно решить поставленную задачу.

Расширение возможностей общения, обмена информацией, появление новых специальностей и профессий, улучшение условий проживания, завязанных на активно развивающихся информационно-­телекоммуникационных технологиях — блага, который технический прогресс привнес в повседневную жизнь общества. Вместе с тем очевидным становится то, что виртуальный мир компьютерных сетей стирает привычную осторожность пользователей, подталкивая их раскрывать в общедоступном режиме личную информацию. Помимо операторов, занимающихся сбором данных в коммерческих, научно-­исследовательских, публичных целях, существует реальный риск использования таких сведений во вред самим пользователям.

Построение сбалансированных правил использования информации, соблюдение частных и публичных интересов — одна из первостепенных задач, стоящих перед современным юридическим сообществом.

Настоящее исследование посвящено в первую очередь исследованию вопроса о том, что же в целом понимается под условным термином «большие данные», какое в этой сфере существует регулирование и в каком направлении следует задуматься о его совершенствовании.

Особенностью российского (как и европейского) законодательства является возможность правовой охраны больших массивов данных смежным правом на базы данных (в Европейском Союзе — правом sui generis), которое, не вводя правовой охраны данных как таковых (отдельных материалов, элементов содержания базы данных), устанавливает правовой режим использования всей совокупности данных, составляющих содержание баз данных. С этой точки зрения законодательство о базах данных существенным образом, с одной стороны, защищает ресурсы лиц, вложившихся в подбор определенного рода данных, а с другой — ограничивает третьих лиц в использовании этих данных. Исходя из этого, необходим анализ как в целом правового регулирования баз данных, так и тех возможностей, которые правовая охрана баз данных предоставляет третьим лицам (как с согласия правообладателя, так и без него).

Как отмечено выше, данные, составляющие содержание баз данных и в целом охватываемые понятием «большие данные» могут быть весьма разнородными, подпадающими под разные правовые режимы и охраняемые государством разным образом. В ряде случаев они могут подпадать под нормы законодательства о том или ином виде тайны — налоговой, банковской, врачебной, адвокатской, усыновления (и многих других).

Вместе с тем главный вопрос, который стоит в настоящее время в отношении обработки больших данных, которые тем или иным образом становятся доступными третьим лицам, заключается в необходимости охраны персональных данных. Обработка больших данных позволяет получать доселе невиданные возможности вмешательства в частную жизнь, неприкосновенность которой гарантирована статьей 23 Конституции Российской Федерации. Так, объединение данных, получаемых из разных источников (с камер видеонаблюдения, из баз данных служб такси, из баз органов безопасности дорожного движения, из баз данных органов государственной регистрации юридических лиц, содержащих данные об их местонахождении), путем их совмещения, обработки и сопоставления можно получить с высокой степенью достоверности информацию не только о самом передвижении конкретного лица, но и о цели такого передвижения). И это лишь один из возможных результатов обработки больших данных.

Это приводит к новому вызову для права — при всех плюсах, которые дает обработка больших данных, нельзя лишить современное население Земли права на частную жизнь. В этом смысле настоящее исследование предпринимает попытку анализа того, какие меры могут быть предприняты для защиты такого права.

[4] Федеральный закон от 27.07.2006 № 149-ФЗ «Об информации, информационных технологиях и о защите информации» // Российская газета. № 165, 29.07.2006

[3] «Мы ожидаем появления консорциумов крупных игроков». Дмитрий Песков об утверждении «дорожных карт» по сквозным технологиям // Коммерсантъ. 11.06.2019. № 100. С. 2. URL: https://www.kommersant.ru/doc/3998262

[2] В 2011 г. Глобальный институт McKinsey опубликовал доклад, посвященный значению больших данных для дальнейшего роста инноваций, конкуренции и производительности, а в 2012 г. большие данные стали одной из ключевых тем повестки Всемирного экономического форума. См.: McKinsey Big data: The next frontier for innovation, competition, and productivity. McKinsey & Company, 2011; Big Data, Big Impact: New Possibilities for International Development. WEF Report, 2012. URL: https://www.weforum.org/reports/big-data-big-impact-new-possibilities-­international-development

[1] В 2005 г. Тим О'Райли опубликовал программную статью «Что представляет собой Web 2.0?», в которой указал на особую роль данных в будущем развитии информационных технологий, а компанией Yahoo! была создана ключевая технология Hadoop, которая рассматривается сегодня как ключевая технология для хранения и обработки больших данных. Однако исследования новых способов обработки данных проводились уже в 90-е гг. Об истории развития больших данных см. подробнее: Diebold F. X. A Personal Perspective on the Origin(s) and Development of «Big Data»: The Phenomenon, the Term, and the Discipline // Penn Institute for Economic Research (PIER) Working Paper. Archive 12-037, 2012; Dontha R. The Origins of Big Data // Digital Transformation. URL: https://www.kdnuggets.com/2017/02/origins-big-data.html

[8] Интернет вещей — а что это? // Habr.com. 2012. https://habr.com/ru/post/149593/

[7] Clement J. Number of social network users worldwide from 2010 to 2021 (in billions) // Statista. 23.07.2019. URL: https://www.statista.com/statistics/278414/number-of-worldwide-­social-network-­users/

[6] В литературе термином «Big Data» обозначаются как само явление больших данных, а именно огромного массива неструктурированных данных, так и технологию, позволяющую производить их обработку. В настоящее работе понятия «Big Data» и «большие данные» используются в качестве синонимов.

[5] Федеральный закон от 27.07.2006 № 152-ФЗ «О персональных данных» // Российская газета. № 165, 29.07.2006.

Глава 1.
ОБЩИЕ ВОПРОСЫ РЕГУЛИРОВАНИЯ БОЛЬШИХ ДАННЫХ

1. Регулирование больших данных и право интеллектуальной собственности: общие подходы, проблемы и перспективы развития

Когда речь идет о регулировании ­какого-либо нового объекта, обычно, возникает необходимость в его легальном определении. Однако в случае с большими данными складывается иная ситуация. Попытки ввести определение больших данных в российское законодательство пока остаются безуспешными9. Согласно позиции, которую последовательно отстаивает Ассоциации больших данных (АБД), создание единого термина, описывающего большие данные в целом, нецелесообразно, с учетом того, что категории обрабатываемой информации постоянно меняются, а сам термин служит своего рода метафорой, что не позволяет дать ему однозначное юридическое определение10.

Законодательство зарубежных стран не дает определения больших данных, что в целом подтверждает приведенную позицию. Однако и за пределами правовой сферы единого общепринятого определения больших данных до сих пор не выработано. Чаще других, пожалуй, цитируется двухстраничная публикация агентства Гартнер 2001 г., где бизнес-­аналитик Д. Лейни впервые описал так называемую модель «трех V»11.

К ним относят:

1. «Volume» — «объем». К 2020 г. общий объем информации, созданный в цифровой среде, достиг 44 зеттабайтов12. По прогнозам Всемирного экономического форума, к 2025 г. объем ежедневного интернет-­трафика данных по всему миру достигнет 463 эксабайтов13. С точки зрения наглядной оценки такого огромного объема информации следует отметить, что для его записи потребовалось бы более 212 млн DVD-дисков. Информация, которая образует объем «больших данных», поступает от миллионов используемых электронных сетевых устройств и приложений. Например, в 2019 г. среднее ежедневное количество созданных сообщений в Twitter составляло 500 млн 294 млрд электронных почтовых сообщений, 65 млрд сообщений и 2 млрд голосовых записей в мессенджере WhatsApp, 5 млрд поисковых запросов и т. д. Важно иметь в виду, что на этапе накопления информации Big Data не производит отбора «ненужных» данных: любые транзакции, действия пользователей в сети (включая просто просмотр интернет-­страниц, без совершения активных действий или перехода по ссылкам). Обычные инструменты хранения и анализа не способны справляться с таким объемом данных.

2. «Velocity» — «скорость». Указанные выше объемы данных поступают в обработку в режиме реального времени, в отличие от традиционной обработки пакета данных. Это означает, что они накапливаются моментально, при этом не имеет значения продолжительность потока самих данных. Таким образом, Big Data не только фиксирует потоки данных, но и производит их запись и обработку в таком виде, чтобы не было потерь. Примером потоковой обработки данных является сервис YouTube, проводящий анализ данных пользователей, исходя не только из просмотренных полностью видеозаписей и трансляций, но из пропущенных пользователями материалов и воспринятых ими в качестве ненужных. Для целей авторов каналов YouTube дополнительно предлагает услуги по сбору данных об интересах зрителей, географических особенностях, контентных предпочтениях, предложения по целевой аудитории14.

3. «Variety» — «разнообразие». Big Data формируется из различных источников и в виде множества разнообразных форматов данных (видеоданные, фотографии, звуковые записи, текстовые сообщения, файлы транзакций, комментарии, использование ссылок и фиксация просмотров страниц и т. д.). Наибольший объем «больших данных» формируется из сведений в социальных сетях и социальных медиа-­сервисах и представляет либо частично структурированную, либо неструктурированную информацию.

Любопытно, что изначально определение больших данных дал бизнес-­аналитик, который не имел специального образования в области информационных технологий, но именно это определение в итоге стало самым распространенным. При этом попытки усовершенствовать определение постоянно возобновляются, выходят все новые научные и околонаучные публикации, в которые обосновывается необходимость дополнить определение новыми «V», число которых на 2017 г. превысило сорок15.

Так, ряд ученых выделяет по крайней мере следующие дополнительные признаки Big Data («7-V»)16:

1. «Value» — «ценность». Потенциальная ценность Big Data крайне высока. На ценность влияют указанные выше признаки Big Data: тщательный и точный анализ данных, актуальность информации и полученные в результате визуализации выводы. Наибольший коммерческий и научный интерес представляют те сведения, которые можно использовать для решения текущих задач конкретного пользователя, а также результаты анализа, которые способствуют построению новых идей.

2. «Veracity» — «достоверность». Из-за большого объема и вариативности источников поступающих данных сложно проконтролировать достоверность Big Data. Соответствие, точность и правдивость получаемой информации могут быть подтверждены только в результате тщательного анализа и сопоставления.

3. «Variability» — «вариативность». При обработке и сопоставлении исходное значение полученных данных может меняться, то есть зависит от определенного контекста. В первую очередь данный признак проявляется при работе с речевыми и текстовыми данными. Для понимания точного значения отдельных слов необходима разработка сложных программных продуктов, позволяющих определять смысловую нагрузку исходя не только из прямого значения, но и из контекста.

4. «Visualization» — «визуализация». Полученные в результате сбора данные непригодны для восприятия человеком. Поэтому требуется их обработка в доступной форме — процедура визуализации. Характерным примером визуализации данных является построение графиков и диаграмм, отображающих результаты анализа данных. Важным является возможность самостоятельной настройки визуализации Big Data: самостоятельное определение параметров, которые учитываются при построении итоговых данных. Необходимые параметры пользователи определяют самостоятельно, в зависимости от поставленных целей и задач.

С технической точки зрения, большие данные, характеризуются в первую очередь не объемом, а определенной, основанной на масштабируемости, архитектурой баз данных. Объем, разнообразие и скорость обработки только характеризуют большие данные, но не являются необходимыми и достаточными условиями для их определения. Также понятна и обеспокоенность стандартизирующих организаций отсутствием единого понимания понятия «большие данные»17. Международная организация по стандартизации (ISO) и Международная электротехническая комиссия (IEC), а также Национальный институт стандартов и технологий США (NIST) предприняли серьезные усилия для определения базовой терминологии в сфере больших данных. Согласно принятому определению большие данные представляют собой значительные массивы данных, которые характеризуются объе­мом, разнообразием, скоростью и (или) изменчивостью и требуют масштабируемой технологии для эффективного хранения, обработки, управления и анализа18. При этом специально указывается на то, что термин «большие данные» является, по сути, «модным словом», которое употребляется для обозначения самых различных понятий. Как отмечается в стандарте ISO и IEC: «Революция в технологиях, называемых большими данными, возникла потому, что реляционная модель больше не могла эффективно удовлетворять все потребности, связанные с анализом больших и часто неструктурированных массивов данных. Дело не только в том, что данных стало больше, чем раньше, поскольку данные постоянно увеличивались на протяжении последних десятилетий. На самом деле, революция больших данных — это единовременный фундаментальный сдвиг в архитектуре в сторону распараллеливания, точно так же, как был однократным переход к реляционной модели»19.

При отсутствии единого и общепринятого определения возникает вопрос о том, на какое определение, какое общее понимание больших данных должно ориентироваться право. И стоит ли оценивать отрицательно тот факт, что законодатели и правоприменители различных стран, обычно, не рассматривают отсутствие легального определения больших данных как ­какое-либо значимое препятствие для регулирования.

Представляется, что сложившаяся ситуация является вполне естественной и закономерной. С учетом сферы регулирования и обстоятельств конкретного дела право могут интересовать данные как таковые и (или) то, как данные используются, включая технологии их сбора, хранения и обработки. В любом случае релевантными с правовой точки зрения являются не универсальные технические характеристики больших данных, а лишь те характеристики, которые являются значимыми для регулирования той или иной сферы экономической деятельности. Более того, у законодателя или суда не возникает необходимости в квалификации спорных массивов данных в качестве именно «больших данных» или квалификации алгоритмов с точки зрения их применимости к большим данным. Не случайно, зарубежные законодатели и правоприменители предпочитают избегать термина «большие данные» в нормативных актах и судебных решениях, хотя в программных документах, комментариях и пояснениях данный термин используется достаточно широко.

Такое несоответствие можно объяснить достаточно просто: комментарии имеют в виду роль данных в социальных и экономических связях, на определенных рынках, и для это лучше всего подходит понятие «большие данные» в широком, а не в точном техническом смысле; в нормативных актах использование технического термина требует специальных пояснений, но определение больших данных является «неопределенным» и реальной правовой потребности в определении нет20.

Например, для конкурентного права первостепенное значение имеют не категории и не способы их обработки данных, а их реальная и потенциальная коммерческая ценность. Не случайно авторы опубликованной в 2016 г. монографии «Большие данные и конкурентная политика», рассматривая модель «трех V» настаивают на том, что первостепенное значение имеет четвертое V, а именно Value, т. е. ценность больших данных21. Хотя сами данные могут быть общедоступными, информация, которая из них извлекается с использованием специальных алгоритмов, обладает самостоятельной ценностью. Ценность данных имеет первостепенное значение для конкурентного права, поскольку позволяет понять их роль в увеличении рыночной власти компаний и закреплении доминирующего положения.

Если мы обратимся к персональным данным, то здесь более важными оказываются категории данных, а также технические инструменты, используемые для их сбора и обработки. Уже в Директиве Европейского парламента и Совета ЕС 95/46/ЕС от 24.10.1995 о защите физических лиц при обработке персональных данных и свободном обращении таких данных, т. е. еще до «эпохи больших данных», были предусмотрены определенные ограничения, защищающие субъекта персональных данных от решений, основанных исключительно на автоматической обработке его данных (ст. 15). Сходные нормы содержатся и в Федеральном законе от 27.07.2006 № 152-ФЗ «О персональных данных» (ст. 16). С другой стороны, масштабы и особенности обработки больших пользовательских данных потребовали включения в сферу регулирования профайлинга как новой формы автоматизированной обработки данных, что нашло свое отражение в статье 22 Общего Регламента о защите персональных данных (GDPR)22.

В рамках интеллектуальной собственности, как в России, так и за рубежом, действует общий принцип, согласно которому защита данным как таковым не предоставляется. Однако данный принцип действует с определенными исключениями. Например, во многих странах большие данные можно защищать как торговые секреты, что требует соблюдения тех же условий, которые установлены законом в отношении любой иной информации. Если же речь идет о праве изготовителя базы данных, то для целей установления правонарушения (извлечение и (или) использования материалов из базы данных) правовое значение могут иметь способы сбора данных и используемые технологии их обработки, которые в случае больших данных имеют свои особенности23. Однако и здесь ни объем, ни способ обработки данных именно как больших данных не принципиальны.

1.1. Дилемма между доступом и присвоением

Для правильного понимания и оценки общего подхода к регулированию больших данных важно учитывать преемственность между существующими подходами к регулированию больших данных и общими подходами к регулированию информации и данных, которые сформировались в процессе перехода от индустриального к информационному обществу.

Информационное общество24 фактически является продуктом развития информационных и коммуникационных технологий, благодаря которым информация и знание становятся основным ресурсом для экономического и социального развития. Общество и экономика информации и знания уже в 60–70 гг. ХХ в. становятся предметом научных исследований, а в 90-е гг. занимают прочное место в политическом и правовом дискурсе, в стратегиях развития и в законодательстве25. В российской правовой науке и доктрине сферу правового регулирования, непосредственно связанную с функционированием информационного общества, обычно, называют «информационным законодательством» или «информационным правом». В других стран, в том числе в Европе и США, данные понятия используются не часто, однако мы можем идентифицировать ту же самую область законодательства, которая охватывает регулирование информационно-­коммуникационных технологий (например, телекоммуникаций или электронной торговли), а также оборота информации и данных (включая защиту персональных данных, права и обязанности информационных посредников и т. п.)26. Информационное законодательство, которое формировалось в течение нескольких десятилетий и действует сегодня на международном и национальном уровне, содержит базовые принципы регулирования оборота информации. При этом общий подход к регулированию можно охарактеризовать как приоритет доступа по отношению к присвоению информации и данных.

Например, Руководящие принципы ОЭСР о персональных данных в их первой редакции 1980 г. указывают в качестве цели гармонизацию конкурирующих ценностей неприкосновенности частной жизни и свободного распространения информации, а также «развитие свободного обмена информацией между странами-­членами»27. В новой редакции документа, принятой в 2013 г. и учитывающей риски, связанные с феноменом больших данных, принцип обеспечения свободного обмена информацией (free flow of information) остался неизменным28.

Другим ярким примером является политика ЕС в области данных. Директива 1995 г. об обработке персональных данных уже в своем названии, а также в преамбуле содержала указание на равнозначность защиты персональных данных и их свободного движения на территории ЕС29. В дальнейшем в целях развития единой экономики данных ЕС принял Общий Регламент о защите персональных данных (GDPR)30 и Регламент о свободном движении не-персональных данных31. Данные документы в совокупности образуют нормативно-­правовую базу для свободного движения не только персональных, а всех данных на территории ЕС, и de facto устанавливают так называемую «пятую свободу», которая дополняет экономические свободы движения товаров, людей, услуг и капитала, закрепленные в Договоре о функционировании Европейского Союза (TFEU)32.

Приоритетность доступа также очевидна в случае так называемых «открытых данных» (open data), которые государственные органы предоставляют третьим лицам на условиях неограниченного и бесплатного доступа в целях повторного использования33. В связи с развитием технологий больших данных открытые данные приобретают особую актуальность, о чем свидетельствует принятие Европейским союзом в 2019 г. новой Директивы 2019/1024 «Об открытых данных и повторном использовании информации государственного сектора», отменяющей Директиву 2003/98/EC 2003 г., которая уже не отвечает потребностям цифровой экономики34.

На первый взгляд, принцип открытого доступа к информации и данным касается категорий данных, которые регулируются публичным правом (таких как персональные данные и открытые данные), но в действительности это не так.

Например, в преамбуле Директивы 96/9/ЕС Европейского Парламента и Совета от 11.03.1996 «О правовой охране баз данных»35 (далее по тексту — Директива «О правовой охране баз данных») специально указывается, что наличие права запрещать извлечение и (или) последующее использование всех или существенной части материалов, входящих в базу данных, не является распространением авторского права на факты и данные и не должно приводить к появлению «нового права на такие произведения, данные или материалы как таковые36. Растущая коммерческая ценность больших данных стимулирует компании к использованию как технических, так и правовых средств для обеспечения своего контроля над большими массивами данных. Однако в условиях цифровой экономики контроль над данными и потребность в данных дополняют друг друга. Обладая контролем над одними данными, компании для улучшения своих продуктов или повышения эффективности своей деятельности одновременно нуждаются в дополнительных массивах данных, принадлежащих другим компаниям или государству. В итоге дилемма между доступом и присвоением обостряется, но не приводит к смене приоритетов: в сфере гражданско-­правового оборота больших данных право продолжает отдавать предпочтение предоставлению, обмену данными, а не их присвоению.

Проведенный ОЭСР анализ 200 инициатив по развитию больших данных в 37 странах показал, что использования данных в коммерческом секторе рассматривается в числе наиболее острых. В то же время только 15% от общего числа инициатив содержат конкретные меры по решению данной проблемы, причем большая часть таких мер основана на схемах саморегулирования37.

Европейская комиссия, с другой стороны, обращает внимание на тот факт, что во многих случаях данные могут использоваться повторно без потери качества и конкурентоспособности, поскольку одни и те же данные служить основой для создания или улучшения различных продуктов или услуг. Таким образом, политика и регулирование должны быть направлены на поощрение кооперации между компаниями для максимально эффективного использования данных как можно большим количеством коммерческих игроков. Речь идет не об императивных правилах, а о поощрении обмена данными между компаниями, которое осуществляется посредством мягкого права. Например, компаниям, работающим на рынке интернета вещей, Европейская комиссия рекомендует применять в своих договорах принцип «совместного создания стоимости» (shared value creation), согласно которому если данные производятся как побочный продукт или услуга, то в их создание вносят вклад несколько сторон, интересы которых необходимо учитывать38. Регламент 2018/1807 от 14.11.2018 о свободном обороте не-персональных данных в Европейском союзе предусматривает содействие разработке кодексов поведения, которые должны обеспечить справедливые условия переносимости данных для профессиональных пользователей, у которых возникает потребность в перенесении данных на собственные информационные системы или в смене провайдера услуг39.

Такую же закономерность в развитии регулирования данных мы наблюдаем и в Российской Федерации. Закон о защите информации относит к основным принципам правового регулирования отношений в сфере информации, информационных технологий и защиты информации свобода поиска, получения, передачи, производства и распространения информации любым законным способом, и установление ограничений доступа к информации только федеральными законами (ст. 3). Таким образом, общим принципом является открытый доступ к информации, а не ограничение доступа. Л. К. Терещенко, анализируя общие тенденции, а также Декларацию ООН о принципах развития информационного общества40 приходит к выводу, что «общим правовым режимом информации является режим открытой информации»41.

Косвенно данный вывод подтверждают нормы авторского права, касающиеся информации и данных. Авторское право не защищает не только идеи как таковые, но и информацию, которая не носит творческого характера и сообщает лишь о фактах. Данный принцип отчетливо выражен в ст. 1259 ГК РФ, согласно которой объектами авторских прав не являются, частности, факты, языки программирования, геологическая информация о недрах, сообщения о событиях и фактах, имеющие исключительно информационный характер (сообщения о новостях дня, программы телепередач, расписания движения транспортных средств и тому подобное). Авторские права на базу данных предоставляются на подбор или расположение материалов (составительство), но не на сами материалы (п. 2 ст. 1260 ГК РФ). Смежное право изготовителя базы данных, хотя и предоставляет исключительное право на извлечение и использование материалов из базы данных, однако оно существенно ограничено по сравнению с правами на другие объекты авторского и смежных прав.

Регулирование больших данных стало актуальным вопросом в рамках национальной программы «Цифровая экономика Российской Федерации»42. При этом основной подход заключается в обеспечении доступа, т. е. в создании благоприятных правовых условий для сбора, хранения и обработки данных. Интересно отметить, что Евразийский экономический союз (ЕАЭС) планирует до 2025 г. заключить соглашение об обороте данных43. Поскольку в ЕАЭС, также как и в Европейском союзе, действует принцип свободы движения товаров, людей, услуг и капитала44, есть все основания полагать, что рамочное регулирование сделает своим приоритетом обеспечение свободного оборота данных на эконмическом пространстве союзных государств.

Вывод о том, что базовым принципом регулирования информации и данных, включая большие данные, является приоритетность свободного оборота данных, не означает, что контроль над данными, например, когда лицо самостоятельно осуществляет сбор или производство массивов данных, теряет свою актуальность. Экономическая модель больших данных основана на извлечении коммерческой ценности в результате анализа данных специальными алгоритмами или использования для тренировки и обучения систем искусственного интеллекта. И поскольку распространение и развитие новых технологий приводит к увеличению ценности данных, потребность в их защите, а также в защите тех инвестиций, которые были вложены в их сбор и обработку, также возрастает.

По аналогии с правом собственности в отношении вещей, в сфере нематериальных объектов, к которым относятся данные, самую сильную защиту предоставляет право интеллектуальной собственности. Соответственно, именно интеллектуальная собственность рассматривается бизнесом как наиболее актуальный и привлекательный правовой инструмент для обеспечения контроля над данными. В праве интеллектуальной собственности также присутствует дилемма между доступом и присвоением, но, в отличие от информационного законодательства, в силу абсолютного характера исключительного права приоритетом наделяется не открытый доступ, а присвоение, максимально полный контроль со стороны правообладателя за использованием соответствующего результата интеллектуальной деятельности или средства индивидуализации.

В исследовании ОЭСР 2019 г. отмечается, что текущую неопределенность в отношении владения и распоряжения данными (data ownership) может объяснить «запутанная сеть существующих правовых режимов» в сочетании с вовлеченностью многих сторон в создание данных и их ценности. Но главный вывод исследования заключается в том, что «не существует единого оптимального уровня «открытости» данных; ценность доступа и обмена данными зависит от категории данных и контекста, в котором эти данные повторно используются, включая социальную, экономическую и культурную среду, в которой осуществляется такая деятельность»45.

Действительно, регулирование больших данных только формируется, многие проблемы далеки от своего решения, и по многим вопросам существует правовая неопределенность, поэтому не существует простого ответа на вопрос о применении исключительных прав к большим данным. Поэтому необходимым шагом к решению этой задачи является продуманный и комплексный анализ, касающийся наиболее релевантных объектов интеллектуальной собственности, которые могут использоваться для защиты больших данных; условий и пределов осуществления исключительных прав; рисков и последствий, которые связаны с взаимным пересечением и коллизией различных правовых режимов оборота данных.

Кардинальное отличие в решении дилеммы между доступом и присвоением также осложняет задачу обеспечения защиты больших данных посредством исключительных прав. Возьмем, к примеру, предложение Европейской комиссии о введении нового исключительного права «производителя данных» (data producer’s right), которым могут наделяться производитель устройств, обладатель устройств или оба субъекта одновременно. В отличие от права sui generis новое право планировалось предоставить лицу, которое вложило максимальные ресурсы не в создание базы данных, а в создание самих данных46. По идее, бизнес должен был поддержать введение нового права, тем более что на обсуждение были внесены несколько альтернативных моделей, но этого не произошло47. Сбор, хранение и обработка больших данных в зависимости от бизнес-­модели предполагает участие различных лиц и имеет отраслевые особенности, поэтому простого ответа на проблемы, связанные с распределением прав на данные, видимо, не существует. Так как конечной целью регулирования оборота данных, включая гражданско-­правовой оборот, является не удовлетворение интересов отдельных компаний, которые производят или собирают большие массивы данных, а стимулирование инновационной экономики, в особенности развития искусственного интеллекта и интернета вещей, необходим поиск разумного компромисса между абсолютной защитой и обеспечением доступа к данным.

1.2. Большие данные в контексте права интеллектуальной собственности: краткий обзор

Цифровую экономику нередко называют экономикой данных, а сами данные наиболее ценным ресурсом и даже «новой нефтью» (new oil). Впервые данные сравнил с нефтью британский математик Клайв Хамби, имея в виду, что хотя данные и обладают ценностью, как и нефть, они бесполезны до тех пор, пока они «не очищены», т. е. не подвергнуты анализу48. После выхода в 2017 г. публикации The Economist под названием «Самый ценный мировой ресурс — это больше не нефть, а данные» сравнение данных с нефтью стало использоваться особенно часто49. Однако, любопытно, что интеллектуальную собственность также рассматривают как новую нефть. В 2000 г. The Economist опубликовал статью о Марке Гетти, основателе Getty Images, одного из крупнейших в мире банков фотографий. Статья запомнилась процитированным высказыванием самого Гетти: «Интеллектуальная собственность является нефтью 21-го века. Посмотрите на самых богатых людей сто лет назад: все они зарабатывали деньги, добывая природные ресурсы или перемещая их. Все сегодняшние самые богатые люди сделали свои деньги на интеллектуальной собственности»50.

Представляется, что аналогия с нефтью в случае больших данных и интеллектуальной собственности

...