Мегаобучалка Главная | О нас | Обратная связь


Этап 2. Проектирование. Разработка структуры РХД



2018-07-06 280 Обсуждений (0)
Этап 2. Проектирование. Разработка структуры РХД 0.00 из 5.00 0 оценок




Отчёт по домашнему заданию по управлению данными

Гаевая Дарья

Курганский Максим

Стручкова Анастасия

Хондак Лилия

Группа 161

Этап 1. Подготовка данных

Данные были найдены на сайте www.cms.gov/openpayments/explore-the-data/dataset-downloads.html, которые содержат информацию по выписыванию рецептов на лекарства пациентам в медучреждениях (больница, аптека, фармацевтическая компания) враче. У каждой больницы есть несколько врачей, у каждого врача может быт несколько пациентов и несколько выписанных им рецептов. Найденные данные представляют собой архив рецептов, которые были выписаны врачами для своих пациентов в определённых больницах и связывают между собой больницу, пациента, врача, лекарство. Эти данные были разделены на два массива: один в формате xlsx, другой — csv.

Цель интеграции данных — быстрое формирование отчёта медучреждениями в простом и понятном виде, а также его упрощение даже при большом объёме данных. Помимо этой задачи на основе наших данных могут быть сформированы отчёты по покупкам каждого пациента или по рецептам каждой больницы/врача. Кроме того, с помощью нашего проекта можно проанализировать информацию о выписанном рецепте(поиск по дате, пациенту, врачу, больнице).

Источник содержит всю нужную информацию для создания трёх справочников с нетривиальными структурами, которые будут именоватьсяRecipient (включая RecipientAddress), Physician (включая PhysicianSpecialty, PhysicianType), Manufactory (включая ManufactAddress), а также справочникаDrug (включая DrugType) и таблицу фактовRecord. Транзакцией являются данные по рецептам на лекарства (таблица фактов Recordв базе данных), а анализ снимков состояния позволяют сделать атрибуты DateStartи DateFinish.

 

Часть первоначальных данных в xslx:

 

Этап 2. Проектирование. Разработка структуры РХД

Ниже подробное описание каждого элемента РХД. Уровень гранулярности с точностью до дня, поскольку наша цель — сформировать отчёты по покупкам лекарств и выписыванию рецептов на каждый день.

Таблица Атрибут Тип данных Описание Комментарий
Recipient recipient_id int Идентификатор пациента Primary key
  recipient_name nvarchar(255) Штат, где живёт пациент  
  recipient_phone nvarchar(255) Город, где живёт пациент  
  recipient_address_id int Идентификатор адреса, по которому проживает пациент Foreign Key
  DateStart date Атрибут для отслеживания изменений  
  DateFinish date Атрибут для отслеживания изменений  
RecipientAddress recipient_address_id int Идентификатор адреса, по которому проживает пациент Primary Key
  recipient_state nvarchar(255) Штат, в котором живёт пациент  
  recipient_city nvarchar(255) Город, в котором живёт пациент  
  recipient_address_name nvarchar(255) Улица и дом, в котором живёт пациент  
  recipient_full_address nvarchar(255) Полный адрес, по которому проживает пациент  
Physician physician_id int Идентификатор врача Primary key
  physician_first_name nvarchar(255) Имя врача  
  physician_middle_name nvarchar(255) Отчество/среднее имя врача  
  physician_last_name nvarchar(255) Фамилия врача  
  physician_speciality_id int Идентификатор специальности врача Foreign Key
  DateStart date Атрибут для отслеживания изменений  
  DateFinish date Атрибут для отслеживания изменений  
PhysicianSpecialty specialty_id int Идентификатор специальности врача Primary key
  type_id int Идентификатор типа врача Foreign Key
  specialty­_name nvarchar(255) Название специальности врача  
PhysicianType type_id Int Идентификатор типа врача Primary key
  physician_type_name nvarchar(255) Название типа врача  
Manufactory manufactory_id int Идентификатор медучреждения Primary key
  manufactory_name nvarchar(255) Название медучреждения  
  manufactory_address_id int Идентификатор адреса медучреждения Foreign Key
  manufactory_phonenum nvarchar(255) Телефонный номер медучреждения  
  DateStart date Атрибут для отслеживания изменений  
  DateFinish date Атрибут для отслеживания изменений  
ManufactAddress manufactory_address_id int Идентификатор адреса медучреждения Primary key
  manufactory_country nvarchar(255) Страна, где находится медучреждение  
  manufactory_state nvarchar(255) Штат, где находится медучреждение  
  manufactory_full_address nvarchar(255) Полный адрес, где находится медучреждение  
Drug drug_id int Идентификатор лекарства Primary key
  drug_name nvarchar(255) Название лекарства  
  drug_type_id int Идентификатор типа лекартсва Foreign Key
  drug_shell_life int Срок годности лекарства, измеренный в годах  
  drug_price float Цена лекарства  
  DateStart date Атрибут для отслеживания изменений  
  DateFinish date Атрибут для отслеживания изменений  
DrugType drug_type_id int Идентификатор типа лекарства Primary key
  drug_type_name nvarchar(255) Тип лекарства  
RecordDate full_date int Полная дата записи Primary key
  year int Год записи  
  month int Месяц записи  
  day int День записи  
Record record_id int Идентификатор записи Primary key
  record_date int Дата записи Foreign Key
  record_total_amount int Количество купленного лекарства  
  recipient_id int Идентификатор пациента, купившего лекарство Foreign Key
  manufactory_id int Идентификатор больницы, продавшее лекарство Foreign Key
  physician_id int Идентификатор врача, продавшего лекарство Foreign Key
  record_total_price int Общая стоимость лекарств, которое было продано  
  drug_id int Идентификатор лекарства, которое было продано Foreign Key
  drug_price int Цена лекарства, которое было продано  

 

Для буферной области мы создали ещё один xlsx-файл, где размечены названия столбцов, куда происходит заполнение.

База данных построена в третьей нормальной форме. Для справочника Physician были вынесены в отдельную таблицу PhysicianTypeи PhysicianSpecialty, для справочника Drug — DrugType, для справочника Manufactory —ManufactAddress, для справочника Recipient —RecipientAddress.

Витрина данных представлена в формате «снежинка»:

 

Ниже представлены stagingareaдля основных таблиц:

1) Staging area для Record

2) Staging area для Physician

3) Staging area для Manufactory

4) Staging area для Recipient

 

В витрине данных представлена таблица фактов — Record.В хранилище содержатся следующие меры: record_total_ammount, record_total_price:

 

:

 



2018-07-06 280 Обсуждений (0)
Этап 2. Проектирование. Разработка структуры РХД 0.00 из 5.00 0 оценок









Обсуждение в статье: Этап 2. Проектирование. Разработка структуры РХД

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе...
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (280)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.011 сек.)