医疗数据之数据仓库解决方案

医疗数据仓库:为数字化医院的科学管理和科学决策提供有价值的信息资源!
了解咨询

雷达评级

AA

用户规模

-

产品上线

-

0、 方案背景

整个医疗数据是一个庞大而又复杂的数据集,对于管理者来说,想要从这个繁琐的原始数据找到决策的依据,是比较困难的!所以,创建数据仓库,是一个有效的解决方案。数据仓库:将现有HIS、LIS、PACS、OA、病案系统、资产管理系统等多种业务和管理系统的数据应用联机业务、数据的清洗,转换,数据仓库、多维数据、数理统计和数据挖掘等技术,以生动友好的界面形式展现数据分布特征,发现数据中的显性或隐性的规律和知识,实现医院对业务和管理状态的监督、追踪、评价、预测,为数字化医院的科学管理和科学决策提供有价值的信息资源。

以下是我在一家三甲医院实施BI系统的时,关于创建数据仓库一套完整的解决方案:


1、 序言

1.1、项目背景

经过多年的信息化建设,在临床业务、财务、统计信息等领域均建立了信息系统,支撑了医院业务的正常运行。在系统建设的过程中,由于各种原因,并未建立统一的数据仓库,这给数据的整合利用、统一带来问题。

(一)各信息系统现状分析

目前,医院使用的各个信息系统的基本情况见下表。

医疗数据之数据仓库解决方案

各信息系统基本情况

(二)创建数据仓库存在的主要问题

1.数据存储分散,未建立统一的数据仓库。

2.没有统一的数据代码规范与标准,数据字典与术语定义存在不一致的问题。

3.同一系统由于升级、切换运行等原因,存在数据割裂、历史数据缺失等问题。

4.各系统采用的数据库类型不同,有的系统数据表结构定义不明。

1.2、方案目标

(一)将医院分散在各处的数据通过数据集成技术(ETL)实现自动传输、清洗、转换,建立数据仓库和若干专题数据库。

(二)采用大数据分析、BI(商业智能)技术建立医院管理决策支持系统,通过业务报表、统计图表、仪表盘等形式综合展现医院业务运行情况,为管理与决策提供支持。

(三)采用统计分析和数据挖掘技术,在建立专题数据库的条件下,开展医院管理与临床方面的项目研究,为科研项目提供辅助与支持。

1.3、方案原则

医院的系统是由多家厂商共同来完成的,完成数据源的确定、数据仓库的建立,需要各个系统厂商、数据仓库建设方、院方共同协商、协调、配合来完成:

(一)成立项目建设小组,由院领导挂帅,各部门(包括各职能科室与业务管理科室)参与,有效推进项目的建设与实施。

(二)重点参与科室包括:院办、党办、计算机中心、信息统计科、财务科、物价医保科、人事科、医务科、门诊部等。各部门需提出业务与管理需求,配合完成数据采集、基础信息维护、分析报表设计等各项工作。

(三)各系统厂商需协调目前使用的各信息系统开发商提供数据接口支持,以顺利完成数据仓库建设。


2、需求分析

2.1、技术现状

2.1.1、ETL工具

ETL,Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

2.1.2、ETL的必要性

针对医疗决策支持系统,院长、医院科主任级别的人都关心的是昨天收入、挂号量、发药量、住院患者数量等一些基本指标;并针对这些指标的同比、环比、趋势预测等分析;这就要求决策支持系统需要每天凌晨把业务数据抽取到数据仓库中。

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析的依据,而ETL是BI(Business Intelligence)项目最重要的一个环节。

2.2、用户需求

(一)建立基础信息数据库

建立人员、科室及各种属性和基本信息字典库,遵循新的数据协议,建立统一的代码与名称定义。建立字典数据即时更新机制,保证基本信息的准确性。

(二)建立业务统计数据仓库(只列举了部分信息,后期设计再提供详细文档)

1.数据仓库包括:

(1)门诊科室业务生产数据库

每天门诊医生工作量及分项收入情况(分社保、自费)

(2)医技科室业务生产数据库

每天医技科室工作量及收入情况

(3)住院科室业务生产数据库

每天住院科室出入院及病床占用情况、每天住院科室分项收入情况(分社保、自费)

(4)住院病人结算数据库

每天住院病人结算情况(分社保、自费)

2.数据仓库建设策略:

(1)对各系统历史数据,尽可能地提取所需的基本数据,经过清洗、转换,一次性导入数据仓库。

(2)对各系统新生产的数据,从各系统数据库提取需要的汇总数据,经过清洗、转换后每天定时传送到数据中心。

(3)对于无法通过数据接口获得的数据,可以采用excel等平面文件方式采集,然后通过集成系统导入数据仓库。

(三)建立专题数据库(只列举了部分信息,后期设计再提供详细文档)

1.体检信息数据库;

2.门诊病人信息数据库;

3.住院病人信息数据库;

4.手术信息数据库;

5.大型检查病人信息数据库(MR、CT、超声、动态心电图等);

6.顾客满意度调查数据库。

。。。。。

针对建立的专题数据库,利用统计分析与数据挖掘技术,结合管理与临床科研需求,开展专题信息利用和专题分析(只列举了部分信息,后期设计再提供详细文档):

(1)体检信息分析

针对健康、亚健康人群,了解体检人员总体情况、异常情况,运用相关分析、风险模型等统计分析方法,对特定人群进行分析与评估。结合专题随访调查,开展行为医学研究。开展中医“治未病”相关研究。

(2)门诊病人信息分析

开展门诊病人排队分析、流向分析、就诊时间分析。开展门诊病人费用分析。开展门诊医生工作强度分析。

(3)住院病人信息分析

开展住院病人病种分析、死亡病例分析。开展住院病人费用分析。开展临床专题研究。

(4)手术信息分析

开展手术分类、分级分析,手术效果评价。开展手术费用分析。

(5)大型检查病人信息分析

分析大型检查使用情况,了解设备与人员负荷、设备利用效率、检查阳性率等,开展设备效益评价。

(6)顾客满意度调查数据分析

通过收集满意度评价器、满意度调查数据,了解顾客满意度情况,分析医院运营与服务方面存在的问题。

。。。。。。。


3、技术解决方案设计

3.1主体方案设计

3.1.1 设计原则

A)各个业务系统厂商根据医院的需求,提供业务系统生产数据的接口方案(可以是视图、表、Excel文档等形式)。

B)通过ETL工具或代码从各业务提供的接口(可以是视图、表、Excel文档等形式)将数据抽取到数据仓库中;

C)遵行可靠性高、安全性好、高性能和可管理性四项原则。

3.1.2 设计要点

A)各个业务系统厂商提供生产数据库的数据接口(可以是视图、表、Excel文档等形式)。

B)通过接口(可以是视图、表、Excel文档等形式)从生产数据中抽取数据到数据仓库中。

C)整体数据流:业务生产数据库 --> 数据仓库--> 医疗决策支持系统。

整体数据流层次详细方案图:

医疗数据之数据仓库解决方案

整体数据流层次设计


3.1.3 方案设计

A)主体设计:通过接口从各业务的生产库获取数据;

医疗数据之数据仓库解决方案

数据仓库搭建设计

B)方案拓扑结构图;

医疗数据之数据仓库解决方案

网络拓扑图设计

C)数据共享数据图:

医疗数据之数据仓库解决方案

ETL数据共享设计图

3.1.4 方案描述

A)参与项目的业务(HIS、CIS、HERP等)厂商或各分院、社康等,建立自己的生产数据库,并根据需求提供相应的接口文档;

B)医院制定时间,使用ETL工具或根据需求编写数据迁移代码,按照新的数据协议,通过接口把数据抽取到数据仓库中进行集中。

C)数据共享:通过ETL工具将数据仓库相关数据迁移到其他类型的数据库中,达到数据共享的效果。

3.1.5 方案特点及优势

主要优势有以下几点:

A)可靠性高;

B)实时性好;

C)安全性高;

D)完整性好。

3.2 数据仓库设计

3.2.1 设计原则

根据医院实际需要的信息与数据,结合数据仓库以及各个厂商涉及到的业务数据,以最优方式设计数据迁移接口,然后从生产库中获取决策支持系统需要的数据放在数据仓库中。

3.2.2 设计依据

设计的依据主要从三方面进行考虑:

A)医院所需要的数据;

B)数据仓库的结构设计;

C)各业务厂商接口设计。

3.2.3 总体设计图

数据仓库主体设计图:

医疗数据之数据仓库解决方案

数据仓库主体设计图

说明:

1、生产库:业务厂商的生产数据库;

2、接口设计:根据医院的需求,各厂商根据自身系统的情况,提供数据接口(可以是视图、表、Excel文档等形式);

3、决策支持系统:通过数据接口从生产库获取系统需要的数据,并利用ETL工具或重新编写的ETL代码,按照新的数据协议,将有价值的数据保存在数据仓库中,最后通过“决策支持系统”展现给用户;

4、各个业务系统(主要各厂商负责):各个厂家的任务是提供接口、访问形式、接口文档说明等相关信息给医院;如果是通过视图或表的形式提供数据,需要提供相关业务表(视图)结构说明,协助解释相关数据内容。

3.2.4 数据仓库详细设计

根据医院的实际需求,主要从两方面的设计来创建数据仓库:

1、 基础字典表及业务信息表;

基础字典表根据医院的实际需求,可以进行修改或重新设计,下面只是列出部分的表名称(提供部分列表,具体表结构后期设计再提供详细文档):

医疗数据之数据仓库解决方案

字典表

2、 主题定义,根据医院后期的需求,可以针对现有的主题进行修改或新增主题(提供部分,具体表结构后期设计再提供详细文档):

医疗数据之数据仓库解决方案

主题列表

3.2.4职责说明

1、 各厂商(分院、社康等)需要提供数据接口支持,以顺利完成数据仓库建设;

2、 医疗决策支持厂商提供创建数据仓库所需要数据的结构说明;

3、 根据医院的实际情况,遵循新的数据协议,通过ETL技术,创建数据仓库。

4、 数据仓库创建后,采用大数据分析、BI(商业智能)技术建立医院管理决策支持系统,通过业务报表、统计图表、仪表盘等形式综合展现医院业务运行情况;

5、 数据正确性的核对由医疗决策支持厂商和医院进行,各业务系统厂商配合。