Read and translate the terms and word combinations into Russian. Explain the meaning of the following terms in English. 1
Explain the meaning of the following terms in English.
Translate into English using phrases from the text.
Translate into English. ПРОБЛЕМА «ГРЯЗНЫХ ДАННЫХ» ПРИ ВНЕДРЕНИИ СРЕДСТВ DATA MINING
Data Mining объединяет в себе технологии и средства, которые имеют одну цель: поиск скрытых зависимостей в разнородных массивах данных. Данные — это результат фиксации некоторой информации. Сами данные, в свою очередь, могут выступать как источник новой полезной информации. Средства Data Mining позволяют извлекать такую информацию. Действительно ценная информация должна удовлетворять следующим требованиям [1]: · информация должна быть ранее неизвестна; · информация должна быть не тривиальна; · информация должна быть практически полезна; · информация должна быть доступна для интерпретации. Эти требования определяют суть методов Data Mining. Потребность в подобных средствах очевидна, ведь знание некоторых закономерностей позволяет с лихвой окупить затраты на их поиск. По этой причине, применение средств Data Mining становится все более популярным среди крупных компаний, которые заинтересованы в привлечении новых клиентов. Внедрение Data Mining на производстве — весьма дорогостоящий и трудоемкий процесс. Существует ряд нетривиальных проблем, для решения которых требуется индивидуальный подход для каждой конкретной задачи. Одной из таких проблем является поддержание высокого уровня качества данных, на основе которых будет формироваться модель поиска взаимосвязей. Качество данных (data quality) — это критерий, определяющий полноту, точность, своевременность и возможность интерпретации данных [2, c. 237]. Данные могут быть высокого качества и низкого качества, последние — это так называемые «грязные» или «плохие» данные. Для повышения качества данных их «очищают». Под очисткой данных (data cleaning, data cleansing или scrubbing) подразумевается выявление и удаление ошибок, несоответствий и конфликтов в данных [2, c. 240]. Очистка необходима для повышения качества данных, что, в свою очередь, повышает скорость и качество анализа данных методами Data Mining. На сегодняшний день проблема очистки данных весьма актуальна и интерес к ней продолжает расти. Проблемами, связанными с очисткой данных, занимается целый ряд исследовательских групп. Не удивительно, ведь от качества подготовленных данных напрямую зависит результат Data Mining. Цена ошибок может быть очень высокой в финансовом плане, поскольку внедрение средств Data Mining на производстве стоит недёшево. Но успешный результат Data Mining может принести крупной компании прибыль, на порядок превышающую затраты. Потому очистка данных играет важнейшую роль при внедрении средств Data Mining. TEXT 3
Популярное: Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы... Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней... Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (733)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |