КРУПНЫМ ПЛАНОМ Вы можете быть не знакомы с большими базами данных, зато они знают про вас очень многое. Почти каждый раз, когда вы заполняете официальные документы, делаете покупки, ходите на прием к врачу или едете в отпуск, информация о вас попадает в один из крупных банков данных, размещенных по всей стране. Хотя индустрия добычи данных еще молода, ее ждет большое будущее. Постоянно возрастают сложность и объем информации, поступающей с камер наблюдения, биометрических приборов, подкожных чипов-имплантантов и официальных документов. Эти данные, в свою очередь, проверяются на различных уровнях на наличие ценной информации. В результате на свет появляется одно или несколько «электронных досье», которое становится продолжением вашей личности. Эта информация довольно точно определяет, с какой вероятностью вы откликнетесь на голосовое сообщение или рекламу в журнале. Досье поможет определить, какая партия обратится к вам за поддержкой, каков будет размер страховки, будут ли вас подвергать обыску в аэропортах и сколько денег вы сможете взять в кредит. Электронное досье хранит «следы», которые позволяют вести постоянное наблюдение за вашими потребительскими привычками, историей болезни, участием в политической и религиозной жизни, а также анализировать и хранить всю эту информацию. ТЕНДЕНЦИИ: Поиск информации в базах данных «Добыча данных представляет собой метод автоматического поиска информации в крупных хранилищах данных. Добыча данных использует методы компьютерного моделирования и статистической обработки. Конечно, с точки зрения технологии баз данных этот метод вполне безобиден. Однако у него есть более широкое и простое применение, которое подразумевает наложение моделей (и предположений о причинных связях) на имеющуюся информацию, хотя их там может и не быть. Добычу данных можно определить как «нетривиальное извлечение скрытой, ранее не известной и потенциально полезной информации из имеющихся данных» или как «науку 9 получении информации из крупных массивов или баз данных». Wikipedia ТЕНДЕНЦИИ: Связывание разных досье «При добыче данных проводится сканирование информации на предмет наличия любых взаимосвязей, а затем, когда такие взаимосвязи найдены, они интерпретируются. Но проблема состоит в том, что в больших массивах данных всегда присутствуют взаимосвязи, характерные только для этого набора данных. Поэтому любой вывод, к которому нас приводит добыча данных, сомнителен. Например, аналитики страховых компаний выясняют, что люди с хорошей кредитной историей чаще других подают страховые заявления на возмещение убытков от автомобильных аварий, и поэтому они решают увеличить размер страхового взноса для этой категории людей. Хотя это кажется вполне логичным, американские политики усомнились в законности такого решения, поскольку, исходя из здравого смысла, кредитоспособность отдельно взятого человека никак не связана с тем, как он водит машину. Таким образом, верный с точки зрения статистики вывод может быть неверен с позиции здравого смысла». — 76 —
|