Вопросы конфиденциальности

Потенциально технология извлечения данных позволяет собрать массу полезной и нуж- ной информации практически в любой области. В тоже время она чревата угрозой нару- шения конфиденциальности. Рассмотрим извлечение данных в контексте этой книги: вы ищете характерные структуры в тех данных, которые собираете из мнений и запросов своих заказчиков, а также потоков щелчков (определяющих закономерности поведения заказчиков).

Сбор информации о пользователях нередко создает опасность нарушения конфиденци- альности заказчиков. Откуда вы можете знать, беспокоит или нет заказчиков факт сбора информации из их потоков щелчков? Тревожит ли их, что вы наблюдаете за тем, на ка- кое рекламное объявление они обратили внимание и на каких страницах задерживались? Извлекая данные, вы нарушаете их конфиденциальность еще сильнее. Отыскивая харак- терные структуры на основе анализа поведения заказчиков, вы обобщаете все данные о них с целью более полного удовлетворения их же нужд.

К счастью для тех заказчиков, данные о которых вносят вклад в результаты поиска ха- рактерных структур, извлечение данных фактически усиливает защиту конфиденциаль- ности существующих данных. Почему? Потому что результаты извлечения данных представляют собой ряд обобщений обо всех ваших заказчиках. Например, результаты гласят, что большинство покупателей составляют мужчины возрастом 25 - 34 года, а среди женщин наибольшим спросом пользуются товары синего цвета. Мужчины возрас- том 18-24 года реже изучают технические статьи по использованию товаров, чем посе- тители групп новостей по техническим вопросам. Хотя потенциально сбор статистиче- ских данных для формирования этих обобщений и нарушает личную конфиденциаль- ность, конечные результаты измерений не позволяют проследить ни одного человека.

Конечно, этот аргумент не принимает во внимание постоянство, устойчивость данных, которые привели к обобщениям.

Кроме того, озабоченность вызывают несколько случаев «увода» информации о потоках щелчков, которые всплыли в прошлом году. Вспомним, например, случай с сайтом ToysRUs.com, о котором сообщал сайт Wired.com 8 августа 2000 года (статья «EPrivacy's Foggy Bottom» (Обратная сторона конфиденциальности в электронной коммерции) Кри- са Океса (Chris Oakes) http://www.wired.eom/news/business/0,1367,38041,00.html). Посе- тители сайта были взбешены, решив, что сайт ToysRUs.com и его вспомогательная служба Coremetrics подвергли угрозе их конфиденциальность и личную безопасность путем передачи данных о потоках щелчков без уведомления или явного согласия поль- зователей. И хотя сайт Coremetrics заявлял, что он всего только обрабатывал данные, посылаемые ему другими сайтами, эта публикация породила бурные споры о взаимоот- ношениях между компаниями и связанными с ними проблемами конфиденциальности.

Хотя подобные проблемы - дело обычное, мораль такова: высший приоритет имеет взаимодействие с заказчиками. Если вы используете вспомогательные службы, ясно со- общите об этом в своей политике защиты конфиденциальности и позвольте своим заказ- чикам отказываться от участия в работе этих служб.

Извлечение данных имеет свои достоинства и недостатки, но если вы ответственно от- несетесь к обработке собираемой информации и научитесь правильно обращаться с ши- рокими кругами покупателей, вы добьетесь большего успеха в защите своих заказчиков и сумеете увеличить их число.

Продолжение темы:

Полезная информация