Классика баз данных - статьи




Добыча данных


Добыча данных — это автоматическое извлечение информации из необработанных данных, хранящихся в компьютерных системах. Она может использоваться для обнаружения нелегитимного использования кредитных и телефонных карт, поддельных страховых требований, прогнозирования покупательского спроса, определения категорий клиентов и т.д. Учитывая, насколько некорректны данные, имеющиеся в базах данных, и необходимость решения задачи обеспечения государственной безопасности, методы добычи данных следует модернизировать и определить для них новые цели. В частности, устойчивость к ошибкам в данных должна стать важным критерием при выборе алгоритмов добычи данных. Более того, поскольку алгоритмы добычи данных, как правило, используются для выявления скрытых тенденций и шаблонов, поиск источников угрозы безопасности, лиц, подозреваемых в террористической деятельности и движения денежных средств, скорее всего потребуют выявления нестандартных или необычных шаблонов (исключений). В силу этого, возможно, наиболее приемлемыми будут алгоритмы добычи данных, ориентированные на выявление и анализ исключительных ситуаций. Более того, необходимо сделать допущения для некорректных данных при определении объема данных для обучения моделей добычи данных. Без этих допущений результаты добычи данных могут оказаться ненадежными.




Содержание  Назад  Вперед