Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Инновации в науке» № 8(84)

Рубрика журнала: Философия

Скачать книгу(-и): скачать журнал

Библиографическое описание:
Климович А.П. ВОПРОСЫ ФИЛОСОФИИ БОЛЬШИХ ДАННЫХ. // Инновации в науке: научный журнал. – № 8(84). – Новосибирск., Изд. АНС «СибАК», 2018. – С. 30-38.

ВОПРОСЫ ФИЛОСОФИИ БОЛЬШИХ ДАННЫХ.

Климович Александр Павлович

аспирант Липецкого государственного технического университета.

РФ, г.Липецк

QUESTIONS OF BIG DATA PHILOSOPHY

 

Alexander Klimovich

Postgraduate student of Lipetsk State Technical University

Russia, Lipetsk

 

АННОТАЦИЯ

В статье рассмотрена тема развития технологий больших данных в перспективе философского анализа. Приведены примеры, иллюстрирующие масштаб влияния больших данных на нашу жизнь. Показана необходимость философского анализа проблем, связанных с развитием больших данных. Дан краткий обзор направлений, которые начинают формироваться в процессе развития философии больших данных.

ABSTRACT

The development of the big data processing technologies is discussed in the article with the perspective of philosophical analysis. The article draws the examples showing the significant influence of big data on our lives. The study also demonstrates a considerable need for philosophical analysis of the problems associated with big data development. A short overview of the directions being currently taken in the course of big data philosophy development is presented in the article.

 

Ключевые слова: большие данные, каузальность, корреляция, истина, предиктивная аналитика, прогностика, свобода, теория подталкивания, искусственный интеллект, ценности, демократия.

Keywords: big data, causativity, correlation, truth, predictive analytics, forecasting, freedom, nudge theory, artificial intelligence, values, democracy.

 

Технические достижения последних лет открыли совершенно новые возможности для сбора, хранения и анализа цифровых данных. Производство их с каждым днем значительно растет - каждый клик, каждый шаг, каждый «лайк» можно документировать и обрабатывать, связывая с другими данными, получать новую информацию. Стремительно накапливаемый объем данных и связанные с этим возможности его использования в самых разных целях называются популярным термином «Bid Data». С этим понятием многие исследователи связывают много надежд и одновременно много опасностей. Такие влиятельные фигуры в области инноваций, как основатель Tesla Motors Илон Маск, Билл Гейтс из компании Microsoft, а также один из соучредителей компьютерного гиганта Apple Стив Возняк предупреждают об опасности применения суперинтеллигентных технологий, построенных на использовании «Bid Data», как о серьезной угрозе человечеству, возможно, более значительной, чем ядерное оружие [1].

Однако на сегодняшний день уже невозможно представить себе существование современного мира без технологий «Bid Data». Во всех сферах человеческой жизнедеятельности ежедневно генерируются всё большие объемы данных. Частные компании и государственные организации постоянно производят и записывают данные, обработка которых в основном связана с использованием цифровых технологий. Цифровой океан ежедневно пополняется данными, поступающими от контрольно-измерительных приборов, коммуникационных систем, банковского и страхового секторов экономики, диагностики и планирования, медицины, статистических отчетов, публикаций в социальных сетях и новостных лентах, исследований в области науки и образования и т. д.

Понятие «Большие данные» происходит от анг­лийского «Big Data» и обозначает такие наборы данных, которые достаточно сложны, объемны, быстро изменяемы и слишком слабо структурированы для того, чтобы быть обработанными с помощью ручных, традиционных методов.

«Большие данные» часто используется как собирательный термин для обозначения технологий, которые обеспечивают переход в новую эру цифровых коммуникаций и обработку данных. Предполагается, что эти технологии будут ответственны за глобальные изменения, предстоящие обществу в ближайшем будущем [2].

В термине «большие данные» характеристика «большие» относится к трем различным измерениям, таким как: большой объем (volume) данных, большая скорость (velocity) с которой генерируются данные, и большое разнообразие (variety) данных, под которым подразумевается широкий диапазон типов данных, поступающих из разных источников [3] Таким образом, принято говорить, что термин «большие данные» базируется на трех «V» (по‑английски: volume, velocity, variety). Кроме того, к определению в последнее время принято добавлять ещё два «V»: «value» - значение, заимствованное из сферы экономики, обозначающее стоимость данных; и «validity», обозначающее действительность или актуальность данных [4]. Термин «большие данные» подвергается постоянным изменениям. Нередко в профессиональной литературе он обозначает весь комплекс технологий, которые используются для сбора массивов данных, их обработки и интерпретации результатов [5].

Объем, скорость и разнообразие

Рост накапливаемой в масштабах планеты информации впечатляет своими объемами. Количество данных, хранящихся в цифровом формате, к концу XX в. составляло всего лишь 25% от общего количества существовавшей в мире информации. Оставшиеся 75% данных содержались в книгах, печатных изданиях, бумажных документах, фотопленках, виниловых пластинках, аудио- и видеокассетах, и других аналоговых носителях. Уже к 2011 году на долю дигитализированной информации приходилось более 98% накопленной за всю мировую историю данных. К этому времени общее количество собранной в мире информации составило 1,2 зеттабайта (1,2∙1021 байт) [6]. За последние несколько лет темп роста объема данных достиг нового рекорда. Начиная с 2014 г. ежегодно производимое в мире количество информации удваивается. Другими словами, в одном 2015 г. произведено столько же информации, сколько за всю предыдущую историю существования человечества [7]. Поисковая система Google ежедневно обрабатывает информацию объемом более петабайта (1015 байт), что примерно в 100 раз превосходит объем всех печатных материалов Библиотеки Конгресса Соединенных Штатов Америки.

В 2012 г. ежедневное количество сообщений в Twitter превысило цифру в 400 миллионов твитов. Впечатляющая цифра, особенно если учесть, что она ежегодно ещё увеличивается на 200% [8].

Компания Facebook ежечасно производит более десятка миллионов загрузок. Люди оставляют цифровой отпечаток в виде «лайков» и «дизлайков» около трех миллиардов раз в день. Прогнозы предпочтений аудитории, сделанные на основе анализа этих данных, являются источником финансового дохода одной из богатейших компаний мира [9]. Летом 2017 г. команда WhatsApp опубликовала очередной рекорд: специалисты компании заявили, что суточная аудитория приложения достигла миллиарда человек. Таким образом утверждается, что на данный момент каждый восьмой человек на планете использует принадлежащий Facebook коммуникационный сервис. Ежедневно через приложение WhatsApp отправляется более пятидесяти миллиардов текстовых сообщений, около одного миллиарда видео и пяти миллиардов изображений [10].

В ближайшем времени мы соединим окружающие нас предметы в сеть «интернет вещей». По оценкам специалистов, через десять лет количество измерительных датчиков, подключенных к сети достигнет цифры в 150 миллиардов. Это в двадцать раз больше, чем количество людей, живущих на планете. К этому времени количество производимой человечеством информации будет удваиваться каждые 12 часов! [11]

Стоимость и актуальность

Добавление к традиционному, опирающемуся на три «V» определению (volume, velocity, variety) еще двух дополнительных «V» («value» - стоимость, «validity» - актуальность), отражает все возрастающее практическое, а точнее, экономическое значение технологий «больших данных». В качестве одного из примеров можно рассмотреть технологии предсказания потребительского поведения человека. Такие IT-гиганты, как Amazon, Google, Facebook собирают информацию о произведенных покупках населения и на основании анализа большого количества данных могут осуществить высоко таргетированную рекламу, способную в разы повысить эффективность рекламных бюджетов поставщиков товаров и услуг. Благодаря технологиям Big Data, теперь не нужно выбрасывать огромные средства на демонстрацию товара перед телевизионной аудиторией, из которой лишь несколько процентов зрителей нуждаются в рекламируемом товаре. При анализе поведения человека в интернет-пространстве с высокой точностью определяется аудитория потребителей именно того товара, который продвигает продавец. Отныне можно показывать рекламу только тому, кого действительно интересует продаваемый товар. Этот факт не только переворачивает рекламный рынок, но и принципиально меняет отношение к информации о произведенных человеком действиях. Возникает рыночный интерес к этой информации. Записанные о человеке данные приобретают номинальную стоимость, при этом информация превращается в разновидность товара.

Не только потребительский рынок является ареной для применения технологий больших данных. Уже сейчас около семидесяти процентов обменных операций на биржевых торгах производится на основании результатов работы компьютерных алгоритмов, молниеносно обрабатывающих большое количество данных, которые включают не только котировки на товарных рынках и рынках ценных бумаг, но и бесчисленное количество отчетов крупных и мелких компаний, данных государственной статистики, а также анализа политических событий, предсказаний погоды и прочей информации [12].

Ежедневно на фондовых рынках Соединенных Штатов осуществляется около семи миллиардов транзакций, две третьи которых совершается при помощи технологий «Big Data». Компьютеры с помощью динамических алгоритмов просеивают информацию с невероятно высокой скоростью. Математические модели обрабатывают массивы данных, снижая риски инвестиций и увеличивая их эффективность. [13] Таким образом, большая часть решений, определяющих наш завтрашний экономический день осуществляется компьютерами, обрабатывающими стремительно растущий объем информации.

Большие данные все чаще рассматриваются как важнейшее сырье XXI века. Подобно тому, как полезные ископаемые и нефть были стратегическим сырьем XX века, в XXI веке, похоже, их место будет занято технологиями «Big Data». Большие данные могут использоваться для извлечения информации, относящейся к планированию и принятию решений, для достижения конкурентных преимуществ и повышения эффективности, а также для разработки инноваций, новых продуктов, услуг и открытию бизнес-сфер. Тот факт, что постоянно расширяющийся массив данных будет предоставлен для широкого коммерческого использования, безусловно, является вопросом времени. Google была первой компанией, которая систематически осуществляла производство, хранение и использование больших данных. Но уже сейчас существует большой сектор экономики, основанный на использовании технологий «Big Data». Кроме того, во всем мире быстро растет научное сообщество, занимающееся исследованием, использованием и разработкой методов и процедур эффективного использования больших данных.

Мы находимся на пороге научного, технологического и экономического бума. Большинство экспертов убеждены, что «в этой области могут быть найдены настоящие сокровища. Глобальный опрос Оксфордского университета показал, что почти две трети респондентов во всех отраслях уверены, что использование больших данных и их аналитики является конкурентным преимуществом для их бизнеса. Для сравнения, два года назад число ответивших положительно на этот вопрос было всего 37 %» [14].

Тот факт, что большие данные уже сегодня оказывают ощутимое влияние на широкий спектр вопросов повседневной жизни, не вызывает сомнений, равно как и факт того, что это влияние в будущем станет еще более значительным. Чем более ёмким и масштабным будет вклад новых технологий, тем более важным окажется роль философского знания в процессе проникновения этих технологий в жизнь.

Несмотря на то, что термин «Big Data» был выдвинут техническими науками на арену междисциплинарного научного дискурса относительно недавно, уже сейчас можно отметить, что гуманитарное научное сообщество довольно быстро включается в это обсуждение. Многие философы и социологи осознают потенциал развития новых технологий понимая, что влияние больших данных не ограничится лишь очередным этапом технической модернизации. Грядущие изменения, вероятно, окажутся столь значительны, что, скорее всего, потребуют пересмотра многих фундаментальных философских категорий. Чем конкретно может быть полезно философское знание в момент вступления человечества в новую технологическую эпоху? Для ответа на этот вопрос следовало бы обратить внимание на направления, которые начинают формироваться в процессе развития философии больших данных.

Причинность и корреляция. (Теоретическая философия)

В рамках классической теории познания такому понятию, как «каузальность», отводится очень важная, ключевая роль. Значимость этого понятия вполне оправдана и объясняется хотя бы тем, что сам комплекс научного знания объединен в единую, самосогласованную структуру при помощи причинно-следственных связей.

Проблема каузальности имеет давнюю историю, восходящую к средневековым спорам между номинализмом и реализмом (universalienstreit). Еще Фома Аквинский утверждал, что истина состоит в сопоставлении Разумного и Вещественного («Veritas consistit in adaequatione intellectus et rei …»), рассматривая два типа доказательств: прямое – от причины к следствию и не прямое - от следствия к причине [15].

Позднее Юм, лишив индукционный метод фундамента экспериментального обоснования, «пробудил» основателя немецкого идеализма И. Канта «от догматического сна» [16]. Немецкий философ, спасаясь от причинно-следственного пессимизма Юма, вынужден был поместить каузальность в разряд априорных категорий рассудка. Позднее верификационизм, а затем пришедший ему на смену фальсификационизм пополнили рад философских концепций в области теории познания.

В наши дни в контексте анализа больших данных каузальность в философском дискурсе приобретает новое значение. Контрастируя с понятием «корреляция», оно проблематизирует статус результатов алгоритмической обработки больших данных в качестве достоверного знания. Поясним это на примере, который не редко приводится в контексте обсуждения больших данных, представляемых в качестве нового источника знания.

В 2009 году был обнаружен новый штамм вируса гриппа H1N1. Быстро распространяющееся заболевание, против которого не было найдено вакцины вызывало опасения надвигающейся массовой пандемии. Единственная возможность не допустить распространения гриппа состояла в своевременном определении его очагов. В этом случае применение превентивных мер позволяло бы затушить очаг разрастающейся эпидемии в самом начале. Однако люди традиционно обращаются к врачу лишь спустя несколько дней после появления симптомов, кроме того, определенное время занимает обработка данных бюрократической системой здравоохранения, информация о локализации возникающей вновь вспышке гриппа обычно запаздывает на пару недель. Таким образом при обычном развитии событий ситуация грозила перерасти в эпидемию, способную унести десятки тысяч человеческих жертв. В момент, когда ситуация была близка к критической, неожиданно компания Google сделала публикацию в научном журнале Nature, заявив о том, что обладает технологией предсказания распространения гриппа.[17] Специалисты компании Google произвели анализ многочисленных поисковых запросов интернет-пользователей. Ежедневно в поисковую систему Google для обработки попадает более трех миллиардов пользовательских запросов. Сотрудники Google сравнили 50 миллионов наиболее распространенных условий поиска с официальными данными медицинских учреждений о распространении заболевания гриппом в период с 2003 г. по 2008 г.

Начальная интуиция заключалась в том, что людей, заболевших гриппом, можно узнать на основании того, что они ищут в сети. Предполагалось, что подхвативший вирус человек должен искать в интернете информацию типа: «средство от температуры» или «средство от насморка», но какие именно, запросы делаются в этом случае, точно не было известно никому. Специалисты компании разработали систему, которая позволяла обнаруживать связи между количеством определенных поисковых запросов и распространением гриппа во временном и территориальном измерениях.

Поисковая система Google обработала удивительно большое количество информации. Число различных математических моделей, с помощью которых проводился анализ условий поиска, достигло цифры в четыреста пятьдесят миллионов. В результате расчетов программное обеспечение выявило сочетание порядка пятидесяти условий поиска, которые действительно были связаны с распространением заболевания гриппом. Найденные в результате работы алгоритмов значения были сопоставлены с данными медицинских учреждений о зарегистрированных случаях гриппа за 2007–2008 годы. Оказалось, что использование обнаруженных критериев поиска совместно с выработанной математической моделью давало коэффициент совпадения предсказываемого результата с фактическим на уровне 97%.

Таким образом, у компании Google появилась возможность регистрировать появление очагов гриппа, и самое главное, им удалось делать это практически в реальном времени, а не спустя две недели, как это делалось ранее [18].

В результате открытия, сделанного специа­листами Google, появилась система, способная довольно точно определять критическую массу заболевших гриппом в определенной местности людей. Однако механизм, на основе которого делается заключение, в традиционном смысле остается не совсем ясным. Количество отслеживаемых параметров, а тем более множество логических операций сравнения, производимых в процессе работы алгоритма, столь велико, что нет никакой возможности построить четкую цепь причинно-следственных связей, логично объясняющих результат. Наш мозг постигает мир, работая с очень ограниченным количеством данных, организуя которые с помощью каузальных отношений, производит представление о внешней среде и мировом порядке. Применяя технологии больших данных, мы имеем дело с новым способом постижения реальности, основанном на обработке гигантских массивов информации с помощью самообучающийся динамических алгоритмов.

В современном мире сами ученые, добывая новую информацию, нередко игнорируют вопрос о природе ее возникновения. Находя корреляционные отношения между различными данными, они все чаще не ставят перед собой цели установления их причины. Главный редактор американского журнала «Wired», Крис Андерсен, уже в 2009 г. провозгласил тезис «конца теории». Его утверждение заключалось в том, что, если в распоряжении имеется достаточное количество данных, которые описывают тот или иной процесс, совершенно не обязательно иметь теорию, объясняющую причины корреляции отдельных параметров этого процесса. Самой информации о корреляциях вполне достаточно, чтобы предсказывать дальнейшее развитие рассматриваемых явлений [19]. В профессиональной среде ученый был встречен волной критики и негодования, однако, по сути, он всего лишь актуализировал вековую эпистемологическую дискуссию об индукции и дедукции, поставив ее в рамки современного контекста.

Рассматривая проблему каузальность/корреля­ция, значительно интереснее оказываются другое. Во-первых, не стоит забывать фундаментальную роль эксперимента для установления каузальных связей. Не случайно директор по экономике компании Google, Хэл Вэриан (Hal Ronald Varian), в своих воспоминаниях характеризует эксперимент в качестве «королевского пути для установления причинности» [20]. Следуя этой логике, нужно отметить, что данные, собранные, в частности, такими компаниями, как Google или Facebook, вполне оправданно могут считаться достоверным источником для прогнозирования разнообразных фактов и установления нового знания о существующем мире. Ведь сбор таких данных - это и есть не что иное, как проведение множества социальных экспериментов [21].

Изучение больших данных в контексте проблематики природы каузальности открывает новые перспективы. Вполне возможно, что с появлением в нашей жизни технологий «Big Data» философскому анализу откроется новый подход к пониманию таких категорий как каузальность и корреляция, который позволит трансформировать их амбивалентное отношение в диалектический синтез.

Свобода и ответственность. (Практическая философия)

Значительная часть философского анализа больших данных имеет отношение еще к одной фундаментальной категории - понятию свободы. Рассматривая проблему свободы в контексте «Big Data», приведем пример из области предсказательной аналитики.

Полиция некоторых городов США уже на протяжении нескольких лет в своей повседневной работе использует систему «прогностического контроля». В таких городах, как Чикаго, Лос-Анджелес, Ричмонд (Вирджиния) и Санта-Круз (Калифорния), службы безопасности направляют патрули в те районы, где на основании анализа данных ожидается повышенная вероятность совершения уличного преступления [22].

С 2006 г. в Мемфисе (Теннеси) начала работать система «Blue CRUSH» - программа, название которой является аббревиатурой английских слов «Crime Reduction Utilizing Statistical History» (на русский язык можно перевести, как «снижение преступности на основе статистических данных»). Эта программа предоставляет относительно точные предсказания о колебаниях преступной активности в регионе. Компьютер, обрабатывая статистическую информацию о криминальных происшествиях, связывает ее с рядом обстоятельств, таких как: проведение футбольных матчей, выдачей зарплат на крупных предприятиях, погодные условия и множеством других данных. В итоге, сравнивая прошлые обстоя­тельства с будущими событиями система выдает вероятности возникновения криминальной активности на карте с указанием почасовой динамики на предстоящие несколько недель [23].

Нетрудно представить себе следующий шаг развития технологии, когда количество и скорость обработки информации достигнут определенного уровня, можно будет предсказывать не только поведение определенных социальных групп, но и поступки отдельных людей.

При дальнейшем проникновении цифровых технологий в повседневную жизнь человека, информация о его перемещениях, контактах, совершаемых покупках, прослушанных им новостях и прочитанных им текстах будет все больше накапливаться, подвергаясь обработке с помощью технологий датамайнинга и машинного обучения. Растущий банк данных позволит все точнее находить корреляции между совершаемыми криминальными действиями и характером поведения нарушителя. Таким образом, еще до совершения преступления, на основе анализа поведения человека можно будет с достаточно высокой точностью предсказывать вероятность совершения противоправного действия. Для описания такой ситуации в области предиктивной аналитики вводится специальное понятие: «прогностически подозреваемого субъекта».

Можно по-разному оценивать скорость развития области предиктивных алгоритмов, но в любом случае предсказание поведения человека на основании анализа совершенных им действий и сравнении их с информацией о действиях других людей кажется возможным. Точность предсказаний напрямую зависит от объема накопленной и обработанной информации. И как было показано ранее, тенденции развития современных цифровых технологий довольно ясно прорисовывают неизбежность появления таких предсказаний.

Какие сложности возникают при появлении технологий предсказательной аналитики с точки зрения философского анализа? По мнению одного из ведущих специалистов в области философии больших данных Виктора Майера-Шенбергера, одна из значительных проблем связана с вопросом признания индивидуальной свободы и пересекающейся проблемой ответственности субъекта [24].

Что будет, если предположить, что общество вступит на путь отслеживания «опасных» ситуаций и легализует применение мер, направленных на предотвращение прогнозируемых негативных сценариев. В таком случае сам факт воздействия сделает вмешивающуюся сторону частично ответственной за последствия, а с другой стороны, в какой-то мере освободит от ответственности потенциального нарушителя. В развитии такого сценария видятся как минимум две проблемы.

Во-первых, реализация превентивных мер по отношению к субъекту, который еще не совершил преступного действия, нарушает принцип применения наказания, когда ответственность должна наступать только на основании уже совершенного поступка. Наказание, обоснованное вероятностью, вступает в противоречие с фундаментальным принципом традиционного правосудия, в соответствии с которым к ответственности можно привлечь лишь после совершения действия. Это противоречит самой идеи презумпции невиновности, которая лежит в основе правовой системы и отражает наше понимания справедливости.

Во-вторых, система применения превентивного действия по отношению к субъекту, попавшему в категорию «прогностически подозреваемого», открывает перспективу процесса, прямо противоположного процессу просвещения, в его формулировке, предложенной И. Кантом: «Просвещение есть мужество пользоваться своим собственным рассудком» [25]. Ведь, оказывая на человека внешнее воспитательное или ограничивающее воздействие, уменьшаются его возможности в принятии самостоятельных решений.

По мнению автора, перспектива развития предсказательной аналитики должна быть направлена не в сторону усиления внешнего контроля, как это делается, например, в Китае [26], а в сторону развития принципов самоконтроля.

Таким образом, при превышении критического уровня вероятности прогноза противоправных действий со стороны какого-либо субъекта в первую очередь должен быть информирован сам субъект, при этом оповещение должно делаться анонимно. Система предиктивного анализа автоматически оповещает субъекта о том, что на основе данных его поведения имеется информация о высокой вероятности совершения им в ближайшей перспективе преступления. Человеку предоставляется право самостоятельно отреагировать на это предупреждение. Такая стратегия не только не будет уменьшать степень ответственности субъекта, но и, напротив, повысит ответственность за возможный негативный сценарий.

Давая позитивную оценку направлению регулирования, основанному на самоконтроле, необходимо все же отметить о наличии и на этом пути ряда препятствий. Основной сложностью сценария «самоконтроля» видится вопрос, связанный с проб­лемой субъекта, широко обсуждаемой в социально-философской среде как минимум со времени провозглашения М. Фуко «Смерти субъекта» [27]. Вполне возможно, что, попадая под еще большее давление внешне конструируемых дисциплинарных практик, уместно говорить о повышении риска исчезновения человека внутри человека.

Право на информацию. (Философия права)

Немаловажный вопрос, связанный с технологиями «БД», возникает в связи с установлением права собственности на информацию. Пользователь Интернета производит определенные действия, например, делая запросы в поисковых системах или совершая покупки через интернет-магазины, информация об этих операциях в современном мире технологий представляет определенную ценность. Как минимум эти данные можно продавать рекламным компаниям или каким-либо исследовательским проектам, деятельность которых направлена на извлечении прибыли из анализа собранной информации. На сколько эти данные могут предоставлять из себя вполне конкретную стоимость, хорошо иллюстрирует следующий пример.

В 2011 г. средняя цена одной акции Facebook составила цифру порядка 40 долларов США. Из этого следовало, что суммарная рыночная стоимость компании на тот момент оценивалась приблизительно в сумму более ста миллиардов долларов США. Одновременно, по данным официальной финансовой отчетности за тот же год, балансовая стоимость активов предприятия составила лишь 6,6 миллиардов долларов США. В эту стоимость были включены аппаратные активы компании, стоимость патентов и прочее имущество предприятия [28].

Как можно объяснить такую огромную разницу между рыночной оценкой предприятия и данными бухгалтерской отчетности? Однозначного ответа на этот вопрос не существует, однако обращает на себя внимание тот факт, что при подсчете стоимости активов компании были учтены компьютеры предприятия, но никак не оценивалась информация, хранимая на их винчестерах. При этом ни для кого не секрет, что именно данные составляют главный ресурс крупнейшей в мире социальной сети. Напрашивается предположение, что разрыв между рыночной ценой и формальными материальными активами, превосходящий сумму этих активов более чем в 20 раз, должен как минимум частично компенсироваться стоимостью данных, хранимых на серверах компании.

Но если данные представляют из себя такую значительную ценность, напрашивается естественный вопрос - кому они принадлежат? На первый взгляд кажется, что если эти данные отражают информацию о поведении людей, то собственниками этой информации должны быть пользователи, так как они сами являются ее производителями. Одновременно верно и то, что как минимум частично к созданию ценности этой информации имеет отношение службы сбора и хранения данных. Ну и наконец, система, извлекающая полезные знания из глобального массива данных, тоже должна рассматриваться как участник создания стоимости информации.

На данный момент система, регулирующая права собственности на глобальную информацию, остается недостаточно разработанной. Основной принцип, регулирующий конфиденциальность исходил из предоставления людям права самим решать, как использовать принадлежащую им личную информацию. Компании формально получают права на использование индивидуальной информации на основе так называемого «лицензионного соглашения». Перед загрузкой нового приложения или обновления человеку предлагается обязательное условие пользования приложением - подписание нескольких десятков страниц плотно начиненного юридическими терминами текста. На практике подписание сводится к простой формальности, так как большинство пользователей принимают условия, даже не читая документа.

Формальность подписания усиливается тем фактом, что лицо, подписавшее соглашение, передает права на использование своих данных на условиях, в которых цели использования заранее не оговорены. Отсутствие прописанных целей обусловлено тем, что основная ценность данных возникает в процессе их многократного использовании, причем зачастую заранее невозможно предугадать для каких целей будут использованы данные. Как правило держатель данных не знает, кому эти данные будут впоследствии проданы, а уж тем более, с какой целью они будут использованы покупателем. Таким образом, записанные данные хранятся на серверах компаний, и заранее не известно, для каких исследований они еще будут употреблены. Запрашивать разрешение пользователей на применение их данных в каждом конкретном случае не представляется возможным быть реализуемым на практике. В конечном итоге не остается другой альтернативы, кроме как в стандартном договоре использования данных максимально расширить границы их дальнейшего применения.

Найти компромисс между защитой прав и извлечением полезных свойств информации - задача не простая и требует серьезной работы специалистов целого ряда областей, важный вклад в которую должны внести ученые в области философии права. В частности, кажется, что акцент юридического контроля должен делаться не на этап подписания лицензионного соглашения, а на этап использования данных в каждом конкретном случае. Один из видных специалистов в области философии больших данных В.Майер-Шенбергер так описывает эту ситуацию: «Разумнее было бы отменить практику индивидуального управления конфиденциальностью и заменить ее расширенной подотчетностью, которая предъявлялась бы к пользователям данных, повышая их ответственность за свои действия. Компании, работающие с данными, больше не смогли бы приводить в свое оправдание то, что человек разрешил их использовать. Напротив, им пришлось бы оценивать потенциальные опасности, с которыми могут столкнуться люди при вторичном применении их данных» [29].

То есть контролем должны заниматься авторизованные независимые инстанции, проверяющие как цели использования собранных данных, так и алгоритмы поиска результатов. Они должны стоять на стороне пользователей и в первую очередь защищать их индивидуальные права.

Солидарность и патернализм. (Социальная философия)

Используя технологии «БД», люди вместе с удобствами получают дополнительные риски, связанные с раскрытием персональной информации. Так, например, экспериментальные модели современных автомобилей снабжаются электронным блоком, который позволяет в онлайн-режиме отслеживать все возможные дефекты и неисправности транспортного средства. Это понижает риск выхода из строя технических систем в самый «неподходящий» момент времени, например, при езде на автобане или при движении в интенсивном потоке городского транспорта.

Одновременно с информацией о техническом состоянии автомобиля поставщик этой услуги получает данные непосредственно о водителе: куда и когда он перемещается, с какой скоростью движется, как часто нарушает правила дорожного движения. Такие данные вполне могли бы быть использованы, например, страховыми компаниями для определения риска наступления страхового случая индивидуально для конкретного человека. При наличии таких данных вполне ожидаемо, что «законопослушные» водители не захотели бы оплачивать страховку на одних и тех же условиях с любителями «быстрой езды». Существует немало примеров, показывающих, что сбор и анализ информации с помощью технологий больших данных может приводить к возникновению настроений, направленных на сегментацию общества и размежеванию отдельных социальных групп.

Проблемы, возникающие в области страхования автомобилей существуют и в области медицинского страхования. Современная индивидуальная медицина опирается на обработку огромного количества персональных данных, собираемых при помощи специальных мобильных устройств. По данным, полученным от браслета, закрепленного на руке пациента, можно судить о его физическом состоянии на протяжении длительного времени. Система анализа данных фиксирует малейшие колебания пульса, давления, температуры… По этим данным можно судить о физических нагрузках, характере движений, питании, принятию алкоголя и многих других обстоятельствах поведения человека. Аналитические системы довольно четко смогут предсказывать стоимость медицинских услуг для каждого отдельного пациента. Даже отвлекаясь от проблем, связанных с рисками делить людей на категории по здоровью (это может быть преодолено этическими принципами самой сути медицинского страхования), возникает проблема в рамках поля этического стандарта. Человек, ведущий здоровый образ жизни, следующий медицинским предписаниям, вполне возможно, не захочет быть застрахованным на одинаковых условиях вместе с человеком, привыкшим «ни в чем себе не отказывать».

По мере дигитализации нашей жизни количество таких примеров будет расти, а проблемы, связанные с социальным размежеванием и общественной десолидаризацией будут становиться все значительнее и острее.

Социальную опасность представляет не только риски снижения общественной солидарности, но и риски, связанные с возникновением нового уровня государственного патернализма. Концепция оценки гражданина, которая в настоящее время внедряется в Китае, дает представление об этом. Оценка граждан по шкале ранжирования реализуется в виде всеобъемлющего мониторинга. Количество набранных пунктов зависит от кликов в Интернете и устанавливает степень политической благонадежности граждан, что в свою очередь определяет условия их кредитования, возможность получения ими рабочих мест и виз для путешествий. Кроме того, в присвоении пунктов учитывается и поведение друзей и знакомых. Это в свою очередь формирует клановые структуры, в которых каждый становиться защитником «добродетели» и своеобразным сетевым надзи­рателем. Инакомыслие изолируется и подавляется. Такой социальный контроль противоречит идеалам сообщества свободных и ответственных граждан, способствуя возникновению социального строя «феодализма 2.0» [30].

В этом контексте предупреждение эксперта в области ИИ, Ивонн Хофштеттер, директора компании Teramark Technologies GmbH, разрабатывающей системы управления искусственного интеллекта для оптимизации потоков городских поставок и алгоритмического управления валютными рисками, звучит настораживающе. В одном из своих интервью она высказала опасение, что за изобретением самоуправляемых машин и автоматизацией производств последует автоматизация общества [31].

Заключение

Заканчивая обзор концепций и вопросов, связанных с философским осмыслением феномена «больших данных», следует обратить внимание на то, что исследование явлений, связанных с развитием технологий «Big Data», вызывает большой научный интерес. Нет ничего удивительного, что, прокладывая дрогу познания, возникнет необходимость создания новых социально-технических категорий и научных понятий. Многовековая традиция философской мысли содержит в себе большой потенциал осознания приходящих технологий и связанных с ними возможностей и проблем. Безусловно, должны получить всестороннюю философскую оценку и такие понятия, как «прогностика», «корреляция», «теория подталкивания», «повсеместное вычисление», «окружающий интеллект» …

Научный интерес вызывает и обратное направление - поиск новых смыслов и значений традиционных понятий на фоне стремительно расширяющихся технологических перспектив. Возможно, что на основании новых данных, еще раз переосмыслив классические философские категории, удастся углубить понимание и высвободить еще не раскрытый потенциал таких понятий, как «свобода», «ответственность», «истина», «бытие», «причина» и «следствие».

Отметим, что целью статьи не было перечисление всех возможных точек пересечения больших данных с философским знанием. Задачей было лишь еще раз обратить внимание научного сообщества на то, что область исследования больших данных важна не только для программистов и математиков. В настоящий момент требуется дать ей глубокую и всестороннюю оценку с точки зрения гуманитарного, этического, аксиологического и социально-философ­ского знаний.

В заключение хочется привести слова директора Берлинского Института человеческого развития Общества Макса Планка, Герда Гигеренцера:

«Мы находимся на распутье. Большие данные, искусственный интеллект, кибернетика и поведенческая экономика будут формировать наше общество - к лучшему или к худшему. Если такие масштабные технологии окажутся не совместимы с основополагающими человеческими ценностями, то рано или поздно они неизбежно нанесут непоправимый ущерб человечеству. Например, они могут привести к автоматизации обществ с тоталитарными режимами, а в худшем случае, централизованный искусственный интеллект угрожает контролировать то, что мы будем знать, о чем мы будем думать и как мы будем действовать. Сейчас исторический момент, чтобы выбрать правильный путь и получать выгоды от возможностей, которые стоят перед нами» [32].

 

Список литературы:

  1. Dirk Helbing. Digitale Demokratie statt Datendiktatur S.7.  Интернет: https://www.spektrum.de/news/wie-algorithmen-und-big-data-unsere-zukunft-bestimmen/1375933
  2. R. Reichert: Big Data: Analysen zum digitalen Wandel von Wissen, Macht und Ökonomie. Transcript Verlag, Bielefeld 2014, S. 9.
  3. Gartner IT Glossary: „Big data is high-volume, high-velocity and high-variety in formation assets that demand cost- effective, innovative forms of information processing for enhanced insight and decision making“. 15.01.2016 Интернет: http://www.gartner.com/it-glossary/big-data
  4. R. Bachmann, T. Gerzer, D. G. Kemper: Big Data – Fluch oder Segen? – Unternehmen im Spiegel gesellschaftlichen Wandels. Mitp Verlag, Heidelberg/ München/ Landsberg/ Frechen/ Hamburg 2014, S. 23ff, 2014, S. 27ff.
  5. [5] Edd Dumbill: What is big data? An introduction to the big data landscape. auf: strata.oreilly.com, 11. Januar 2012.
  6. Hilbert, M., & López, P. (2011). The World’s Technological Capacity to Store, Communicate, and Compute Information. Science, 332(6025), 60 –65.
  7. Dirk Helbing. Digitale Demokratie statt Datendiktatur S.6  Интернет: https://www.spektrum.de/news/wie-algorithmen-und-big-data-unsere-zukunft-bestimmen/1375933
  8. Geron, Tomio. Twitter’s Dick Costolo: Twitter Mobile Ad Revenue Beats Desktop On Some Days // Forbes. — June 6, 2012.
  9. Facebook IPO prospectus // Facebook. — Form S-1 Registration Statement, US Securities And Exchange Commission. — February 1, 2012.
  10. О.Илюхин. Нitech vesti 08.02.2018 Интернет: https://hitech.vesti.ru/article/762466/
  11. Dirk Helbing. Digitale Demokratie statt Datendiktatur S.6. Интернет: https://www.spektrum.de/news/wie-algorithmen-und-big-data-unsere-zukunft-bestimmen/1375933
  12. Mark Buchanan Finanzmärkte und Technologie. Börsenhandel in Lichtgeschwindigkeit Kommentar 11.02.2015 Интернет: https://www.spektrum.de/kolumne/boersenhandel-in-lichtgeschwindigkeit/1331927
  13. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим / Виктор Майер-Шенбергер, Кеннет Кукьер ; пер. с англ. Инны Гайдюк. — М. : Манн, Иванов и Фербер, 2014. — 240 с.  c. 15.  ISBN 978-5-91657-936-9
  14. So der Leiter der Konzernforschung der Siemens AG: Wolfgang Heuring, Warum Big Data zu Smart Data werden muss!, 1.10.2014, (24. 2. 2015).  Интернет: https://www.siemens.com/innovation/de/home/pictures-of-the-future/digitalisierung-und-software/von-big-data-zu-smart-data-warum-big-data-smart-data-werden-muss.html
  15. Thomas von Aquin: Summa theologiae I, 21, 2]
  16. Immanuel Kant. Prolegomena zu einer jeden künftigen Metaphysik, Vorrede
  17. Nature: Jeremy Ginsburg et al. Detecting influenza epidemics using search egine query data // Nature.  2009. Vol. 457. P. 1012–1014. Интернет: http://www.nature.com/nature/ journal/v457/n7232/full/nature07634.html
  18. Dugas et al. Google Flu Trends: Correlation with Emergency Department Influenza Rates and Crowding Metrics // CID Advanced Access. — January 8, 2012. — DOI 10.1093/cid/cir883.
  19. Anderson, Chris: "The end of theory. The data deluge makes the scientific method obsolete". Wired 16 No 7. Интернет: http://archive.wired.com/science/discoveries/magazine/16-07/pb_theory.
  20. Varian, Hal R. : "Beyond Big Data". (Paper aus dem Jahr 2013).
  21. Christopher Olk. Das Datenmonopol Ökonomische Tendenzen von Big Data. Seminararbeit „Das Netz und die Digitale Revolution“  35 S. S.8
  22. Элина Асфаганова, Антон Бут. 18.09.2015 Большие данные VS Государство.  Интернет: https://echo.msk.ru/blog/rusbase/1624826-echo/
  23. Vlahos, James. The Department Of Pre-Crime // Scientific American. — January 2012.
  24. Майер-Шенбергер, В. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим / Виктор Майер-Шенбергер, Кеннет Кукьер ; пер. с англ. Инны Гайдюк. — М. : Манн, Иванов и Фербер, 2014. — 240 с. c. 182  ISBN 978-5-91657-936-9
  25. Immanuel Kant: Beantwortung der Frage: Was ist Aufklärung? In: Berlinische Monatsschrift 4 (1784), S. 481–494.
  26. Digitale Demokratie statt Datendiktatur. Интернет: https://www.spektrum.de/news/wie-algorithmen-und-big-data-unsere-zukunft-bestimmen/1375933
  27. Foucault, M. Die Ordnung der Dinge. Eine Archäologie der Humanwissenschaften / M. Foucault. – Frankfurt am Main: Suhrkamp, 2003. – 470 s.
  28. Laney, Doug. To Facebook You’re Worth $80.95 // WSJ. — May 3, 2012. Интернет:  http://blogs.wsj.com/cio/2012/05/03/to-facebook-youre- worth-80-95/.
  29. Майер-Шенбергер, В. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыс- лим / Виктор Майер-Шенбергер, Кеннет Кукьер ; пер. с англ. Инны Гайдюк. — М. : Манн, Иванов и Фербер, 2014. — 240 с. c. 179 ISBN 978-5-91657-936-9
  30. Digitale Demokratie statt Datendiktatur. Интернет: https://www.spektrum.de/news/wie-algorithmen-und-big-data-unsere-zukunft-bestimmen/1375933
  31. Там же.
  32. Там же.

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.