Skip to content
SidorovMiha edited this page May 8, 2022 · 31 revisions

Понятия и методы извлечения, очистки и обогащения данных


Реферат к лекции 16 (32). Технологии хранилищ данных.

Выполнил: Сидров Михаил ИДБ-18-05

Проверил:

Извлечение данных - Совокупность алгоритмов и компьютерных методов обработки информации, используемых для выборки данных из специальных хранилищ или баз знаний. Часто включает в себя процедуры анализа данных. В отличие от процедуры поиска термин “извлечение данных” характеризует применение сложных алгоритмов сопоставления и оценки данных. Процесс извлечения данных из источников данных должен обеспечивать следующие важные возможности: 1. возможность планировать извлечения по времени, интервалу или событию; 2. набор правил для выбора данных из источника и 3. возможность выбирать и объединять записи из нескольких источников. Ряд коммерческих инструментов, таких как Informatica и Data Integrator, предоставляют большую часть этих функций извлечения

Clone this wiki locally