Этап 2. Проектирование. Разработка структуры РХД
Отчёт по домашнему заданию по управлению данными Гаевая Дарья Курганский Максим Стручкова Анастасия Хондак Лилия Группа 161 Этап 1. Подготовка данных Данные были найдены на сайте www.cms.gov/openpayments/explore-the-data/dataset-downloads.html, которые содержат информацию по выписыванию рецептов на лекарства пациентам в медучреждениях (больница, аптека, фармацевтическая компания) враче. У каждой больницы есть несколько врачей, у каждого врача может быт несколько пациентов и несколько выписанных им рецептов. Найденные данные представляют собой архив рецептов, которые были выписаны врачами для своих пациентов в определённых больницах и связывают между собой больницу, пациента, врача, лекарство. Эти данные были разделены на два массива: один в формате xlsx, другой — csv. Цель интеграции данных — быстрое формирование отчёта медучреждениями в простом и понятном виде, а также его упрощение даже при большом объёме данных. Помимо этой задачи на основе наших данных могут быть сформированы отчёты по покупкам каждого пациента или по рецептам каждой больницы/врача. Кроме того, с помощью нашего проекта можно проанализировать информацию о выписанном рецепте(поиск по дате, пациенту, врачу, больнице). Источник содержит всю нужную информацию для создания трёх справочников с нетривиальными структурами, которые будут именоватьсяRecipient (включая RecipientAddress), Physician (включая PhysicianSpecialty, PhysicianType), Manufactory (включая ManufactAddress), а также справочникаDrug (включая DrugType) и таблицу фактовRecord. Транзакцией являются данные по рецептам на лекарства (таблица фактов Recordв базе данных), а анализ снимков состояния позволяют сделать атрибуты DateStartи DateFinish.
Часть первоначальных данных в xslx:
Этап 2. Проектирование. Разработка структуры РХД Ниже подробное описание каждого элемента РХД. Уровень гранулярности с точностью до дня, поскольку наша цель — сформировать отчёты по покупкам лекарств и выписыванию рецептов на каждый день.
Для буферной области мы создали ещё один xlsx-файл, где размечены названия столбцов, куда происходит заполнение. База данных построена в третьей нормальной форме. Для справочника Physician были вынесены в отдельную таблицу PhysicianTypeи PhysicianSpecialty, для справочника Drug — DrugType, для справочника Manufactory —ManufactAddress, для справочника Recipient —RecipientAddress. Витрина данных представлена в формате «снежинка»:
Ниже представлены stagingareaдля основных таблиц: 1) Staging area для Record 2) Staging area для Physician 3) Staging area для Manufactory 4) Staging area для Recipient
В витрине данных представлена таблица фактов — Record.В хранилище содержатся следующие меры: record_total_ammount, record_total_price:
:
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (280)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |