实时动态,深度解析,把握行业脉搏
实时动态,深度解析,把握行业脉搏
一、背景及市场状况
2010年至2020年的十年间,我国在医疗系统信息化建设方面投入巨资,产生和积累了大量医疗数据。迫切需要通过人工智能、大数据等技术挖掘和实现数据的价值,需要整合更先进的公司技术基础设施,以更高效的方式进行数据整合、数据标准化和数据分析方式,最终实现医疗大数据更有效的应用。2020年新冠疫情的爆发,进一步推动了国内医疗健康行业的数字化革命。人工智能、大数据等技术的不断融合,
同时,来自不同方面的因素也在推动医疗大数据产品市场的发展。医院方面,公立医院转型压力加大,需要引入数字化医疗管理解决方案,发挥电子病历(EMR)的潜力,提高临床研究效率,降低人力成本,提高疾病诊疗水平质量,更好地管理患者。
医院逐步推出创新业务模式,聚焦学术研究、临床治疗、转化医学和患者管理,推动了医疗数据集成应用需求;许多大型三级医院引进了先进的医疗系统,以提高医院管理效率,缓解我国医疗资源短缺和分布不均的问题。政府投资将进一步流入医院领域,支持它继续升级系统并改善与多个监管机构平台的数据互连。
在区域卫生健康方面,国家信息卫生平台建设初期,积累了大量数据。这些数据如何产生更大的应用价值,区域内如何互联互通,跨区域互联互通,都有明确的要求。而对于每年管理数万亿医保“钱包”的医保局来说,如何利用数据更好地管理医保资金存在强烈需求。在疾控方面,随着全球疫情的频繁爆发,如何利用数据更快速、更精准地管控疫情风险存在强烈需求。
从市场情况来看,据相关研究报告显示,2019年中国是全球第二大医疗市场,国内医疗大数据解决方案整体市场规模将从2019年的105亿元增长到2024年的577亿元,复合年增长率为40.5%[1]。
二、场景与需求分析
我们可以从数据流向分析医疗大数据不同类型的应用和场景。在医疗行业,大部分数据是在医疗机构产生的。比如我们去医院检查、检查、门诊、住院、医保结算等数据都是在医院产生的。最直接的数据流在医疗机构。除医院使用数据外,数据还将以数据上报或采集的形式流向相应的政府机构,包括国家卫健委、医保局、疾病预防控制中心等。
因此,医疗大数据平台的主要场景包括医疗机构(各类公立、私立医院和医疗集团)、卫健委、疾控中心和医保局。对于不同的场景,数据的处理方式会有一些差异。下面分析四种情况。
1. 医疗机构场景
在医疗健康大数据、电子病历评级等政策的推动下,各级医院对医疗大数据平台的采购有着更加现实的需求。信息化程度高的三级医院(尤其是排名前三的医院)利用大数据平台满足电子病历评级、科研论文发表和临床应用等需求。对于医院而言,在数据治理和使用方面关注以下三个问题[2]。
数据质量有待提高,数据标准化有待加强。医院业务系统直接生成的原生数据往往不符合数据应用的模型标准。因此,需要利用相应的数据平台,将原始数据处理加工成符合数据应用需求的标准模型。院内系统的数据壁垒还没有被打破,院外系统对数据的渴求,数据共享需要加强。院内不同分院或不同科室之间存在系统和数据壁垒,院内数据共享和互通程度低,缺乏统一的数据平台。线上线下医疗数据持续增长,海量数据等待挖掘和利用。随着数据的海量增长,传统平台和工具的使用已经不能满足大数据下的数据挖掘和利用。需要采用更先进的技术和理念。2. 区域健康情景
2016年,国家印发《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,明确要实施国家卫生安全信息化工程,并全面构建国家、省、市、县三级互联互通、共享共享。人口健康信息平台。
同年,国家卫生计生委计信司、国家卫生计生委统计信息中心发布《省协调地区人口健康信息平台应用功能指南》 ”,明确了综合健康信息平台的核心功能,包括建立数据采集与交换、数据标准报告、大数据应用支持、健康档案服务等。2020年,国家卫健委发布了医院信息互联标准化成熟度评价方案。
目前,全国区域医疗卫生信息化平台在各地已完成一些基础建设,如完成了三大数据库的一轮数据采集、初步协同服务、综合监管、健康等数据应用。记录。但是整体上还是有一些问题。
使用数据时数据质量不高。数据采集后,业务应用没有数据标准,数据治理缺乏深度,数据处于谁用谁管的阶段。在协同服务层面,虽然已经开放了部分共享服务接口,但新接口的扩展仍需重新开发,服务整体配置和数据服务商业化尚有欠缺。数据准备周过长,导致数据应用较少。一方面,缺乏统一的面向数据应用的标准。.
针对上述问题,医疗大数据平台要解决三个主要问题:数据治理、数据协同和更快的数据洞察。
3. CDC 场景
新冠疫情的爆发,为数据在疾控场景中的应用开辟了新战场,也将医疗健康行业带到了数据应用的新阶段。比如我们日常的健康码、核酸检测、疫苗、医院就诊都会产生大量的数据。这些数据需要在疾控中心、卫健委等系统中进行上报、整合、标准化、管理、匹配和合并。处理操作,这些操作是在相应的大数据平台上进行的。
在疾控场景中,数据处理和应用具有独特的特点。
更多数据源。在疫情防控中,需要整合多源数据,解决不同源数据标准不一致的问题。对实时数据的高要求。疫情防控必须日夜奋战,是一个对数据有效性要求非常高的场景。多源数据需要分钟级获取,完成多源数据的整合,对外提供快速高效的数据查询接口。对大数据处理的引擎和效率有更高的要求。需要更快、更准确、更智能的数据洞察和分析。疫情防控对数据的需求不仅是更快的整合,而且还可以更快地从数据中获取洞察力。此外,在防疫等需要快速决策和响应的场景中,这些数据洞察力应尽可能准确。对于海量多源数据的融合和分析,可以通过AI算法模型等更智能的能力,让数据洞察更快速、更准确、更智能。例如,疾控场景下基于AI算法模型的数据分析洞察和疫情检测预警。4. 医保场景 例如人工智能算法模型,可以让数据洞察更加快速、准确和智能。例如,疾控场景下基于AI算法模型的数据分析洞察和疫情检测预警。4. 医保场景 例如人工智能算法模型,可以让数据洞察更加快速、准确和智能。例如,疾控场景下基于AI算法模型的数据分析洞察和疫情检测预警。4. 医保场景
2018年5月31日,国家医疗保障局正式挂牌。2020年7月,国家医疗保障局发布了《医疗保障信息平台数据采集技术规范》等四项规范的通知。其中,《医疗安全信息平台数据中台建设与应用指南》对数据中台建设标准进行了规范。进行了详细的定义。建设内容包括医保数据仓库建设、数据采集建设、数据模型管理、数据质量管理、数据共享管理、数据分析等服务。
与医疗机构、区域、疾控等医疗场景相比,由于国家医保局的统一规划,医保信息平台和大数据平台建设更加先进。建设指引出台前,阿里巴巴、腾讯等互联网企业参与其中。建设指南的输出,从指南名称中包含“数据中心”这一点,就体现了互联网公司大数据平台建设的烙印,建设范围和模式与互联网更加紧密相关。公司的大数据平台。因此,在医保大数据平台上,更有利于互联网企业。
对于省级医保数据中心的建设,主要要求如下:
业务应用程序和数据中心是分开构建的。《建设指南》明确要求14个业务子系统由国家统一下发,数据中心由各省建设。收集医保业务所有新旧数据,形成优质数据资产。由于业务和数据中心同时建设,业务数据可能存在历史数据和增量数据标准不一致的情况,医保数据中心需要对历史数据和增量数据进行统一存储、管理和处理。数据治理和报告的标准化需要紧跟国家评估要求。由于新建设计划下各省业务系统数据结构统一,省级通过数据中心向全国上报数据,全国采用统一规则对数据质量进行评分。因此,数据治理和报告需要标准化。省级数据中心的数据质量控制需要与国家接轨,确保符合省级数据上报要求。以主题为导向,分层数据仓库建设,赋能数据应用。在医保数据中台建设的指导意见中,国家医保局对部分业务课题进行了划分,也明确了医保数据仓库建模的一些规范。因此,省级医保数据中心需要支持数据仓库和数据主题的统一建设,以方便上层数据应用的数据调用。三、产品构建实践1.产品洞察分析
基于以上四个目标场景的分析,我们可以得出以下见解和相应的产品和服务解决方案。
(1)四种场景的基本数据治理场景大同小异,上层数据应用存在场景差异
上述四种不同场景的总体需求有相似之处和相似之处,可以概括为底层大数据引擎、医疗数据治理层、数据应用支撑和上层数据应用部分。
数据治理的功能与以下章节类似,不同场景的内容和配置方法可能有所不同。比如数据仓库建模工具可以复用,数据质量控制平台工具可以复用,数据处理工作流工具可以复用,但是针对不同场景的数据建模方法和数据质量控制的内容和数据处理的流程逻辑是不同的。
上层的数据应用部分,由于是针对特定场景的,所以有自己的不同。例如,医保场景包括基金收支洞察,医院和区域医疗场景包括健康档案,疾病控制场景包括重点人群控制。这些应用都是基于数据的应用,使用的数据仍然是底层治理的数据。因此,可以通过结合下层数据和一些应用构建工具来组装上层应用。当然,有些应用也需要定制开发。一些数据应用的快速开发和配置可以通过数据服务模块和可视化报表构建工具来完成。
因此,整个医疗大数据产品的产品矩阵分为四个部分:大数据引擎、医疗数据治理套件、数据应用支撑、数据应用。
(2)大部分医疗机构缺乏数据相关的人力储备,需要提供产品+内置规则+服务的模型
在以上四种场景中,大部分医疗机构都没有数据部门。一些医院逐渐开始在信息部门承担一些数据开发和分析的角色,而另一些医院则没有相应的角色来运营大数据平台。在这种情况下,用户需要的产品不仅是平台和工具,还包括基于平台和工具的场景化数据服务。有一个形象比喻叫做“交钥匙工程”。提供数据质量控制工具只是服务的一部分。提供数据治理服务,提升数据治理效果,更符合实际需求。
因此,它提供基于平台外不同场景的内容和对数据的长期运营和服务。例如,在医保场景中,我们需要提供医保数据访问、质量控制和报告的工作流模板。这些模板需要生态伙伴协调完成配置并继续运行。随着信息化、云化的深入渗透,一些医院开始组建相应的数据运营团队,一些医美、民营医院也逐渐采用了公有云模式。政府也在设立相关数据运营公司,运营医疗数据。未来,医疗数据运营将逐步规范化、服务化。
(3)抽象医疗数据处理流程并产品化
由于要提供大数据平台+规则+服务的模式,通用大数据平台主要提供代码和流程的编辑工具,对于医疗数据规则的积累并不能很好的商业化。将医疗数据处理过程抽象为可配置的、面向场景的医疗数据处理步骤是一个很好的解决方案。从更直观的角度来看,这种配置可以称为医疗数据处理的操作员。每个算子不仅仅是一般的数据过滤、数据关联等操作,而是一个具有业务意义的数据处理过程。
例如,将数据质量控制抽象为一个算子,在工作流中配置一个算子,完成对整个表格的质量控制;将患者主索引抽象为算子,配置患者主索引算子,完成数据合并的主索引配置;将医保数据抽象转码为算子,在工作流中使用一个算子完成医保数据从地方码到国标码的转换。这种抽象的可视化配置算子,一方面在产品层面沉淀了医疗数据处理的方法,另一方面降低了产品实现和维护的成本。
(4)综合大数据平台
因为医疗数据的处理是基于上游数据采集标准和面向数据应用的数据应用标准。标准的变化会影响整个数据处理过程的变化。例如,标准变更后,显示层对应的数据模型表、数据工作流、数据指标、BI报表等都需要变更。
在这种情况下,碎片化的数据平台和工具会带来高昂的数据治理和运维成本,给医疗数据的使用带来不必要的束缚。因此,提供一体化的大数据平台,可以更有效地降低数据治理和运维成本。例如,数据标准的变化可以自动通知下游数据工作流、数据指标,并借助数据资产计算的血缘关系上报变化,进一步降低数据治理成本,提高数据可用性。
2. 核心模块特性
基于以上具体项目的分析和实践,医疗数据中心提供了四层产品,分别是以下模块。
(1)大数据处理引擎层
大数据处理引擎:腾讯集团已经拥有一套比较成熟的大数据能力和平台产品,包括云Spark、Flink、Hive和基础数据湖能力。
(2)医疗数据治理套件
数据工作流:将医疗数据处理抽象成具体的可视化配置算子(如数据质控算子、患者主指标算子、医保转码算子等),通过表格和算子的向导配置完成数据工作流。时间,根据 TBDS 调度和任务运行的能力,生成相应的 Spark、Shell 和任务,并发送到 TBDS 执行。
此外,为数据工作流提供更全面、更详细的监控功能。比如每个算子每个实例的数据条数,每个算子的任务运行状态等。在内容沉淀方面,数据工作流的模板是针对具体场景的沉淀,方便一键配置在具体项目实施稍后。
标准管理平台:提供医疗数据标准的管理和维护能力。连接下游数据工作流程和数据质量控制。定义好的数据标准可以直接用于质量控制规则的生成,避免了多重配置,保证了规则的一致性。在内容沉淀方面,积累了特定场景下的数据标准,积累了各种医疗数据标准。
数据质量平台:连接数据标准和数据工作流。建表后会自动创建默认质量规则,并提供多种规则模板。配置的质量控制规则可以在数据工作流中以算子的形式调用,从而可以在工作流中的任意节点以任意频率启动数据质量控制。
同时,由于医疗场景中的很多数据并不是直接从业务的备库中读取的,所以有专门的厂家将数据整理到前端电脑,然后再从前端电脑同步数据,这样就可以不可避免地会造成数据不一致,因此数据一致性对账尤为重要。因此,数据质量平台从数据访问对账,到数据访问趋势监测,再到医疗机构质量评分三个阶段提供数据质量保障。
基于标准的自动生成QC规则配置
在数据质控展示层面,提供了针对不同场景的质控,可以根据场景的需要,以不同的方式展示一个质控数据。在内容沉淀方面,沉淀和内置面向场景的质量控制规则。比如国家医保的数据质量控制规则。
医疗机构场景下的源表-访问表对账监控
疾控场景下源表-访问表对账监控
数据资产平台:从数据工作流、指标管理平台、数据服务平台获取元数据,通过元数据计算生成全链路血缘关系。为数据变化影响分析提供有利的依据。同时,数据资产提供基于不同场景的资产分类,沉淀出基于场景的数据资产目录。
指标管理平台:指标管理平台提供原子指标、维度、派生指标的定义。同时,指标的运行将与数据工作流相互关联。指标管理平台的核心是积累各种场景下的常用指标。比如结合医保数据仓库,沉淀出医保运营检测等数据应用的指标。
(3)数据应用支持层
数据服务平台:数据服务平台除了提供最常用的数据查询服务外,还提供医疗场景常用的XML数据写入服务,支持共享文档等可通过数据服务配置的内容。同时,数据资产还可以采集数据服务的内容,分析潜在的数据变化对数据服务的影响。此外,作为数据应用的开发方式之一,数据服务平台积累了健康档案等数据应用中常用的数据查询服务。
数据可视化平台:数据可视化平台包括数据分析平台和3D可视化数字孪生平台。数据可视化平台结合医疗数据中心的能力,为政府监管、医疗运行分析可视化等提供模板。基于领先的3D可视化能力,3D可视化数字孪生平台结合医疗数据中心数据和智能AI算法,提供医疗场景下的3D可视化产品能力。
(4)数据应用层
数据应用面向不同场景,结合数据应用支撑层开发面向行业的数据应用。比如360患者浏览器、医保基金收支洞察等。
四、未来规划
目前,医疗数据中端产品已经在一些大型医疗项目中逐步落地,产品能力也在随着项目的落地而逐步得到补充。未来的产品规划大概会集中在以下几个方面:
提高产品标准化能力。由于在医疗大数据赛道的积累时间不是很长,部分产品功能有项目定制。对于同类产品能力,需要沉淀可以沉淀为场景化功能的功能。根据不同的场景配置,会提供不同的场景。功能,进一步使能力可配置和标准化,提高产品的标准化能力。标准化交付和实施。在产品标准化的同时大数据平台,根据在项目中的实践积累,沉淀出标准化交付能力,相应的标准交付包上架。除了安装部署的标准化,数据采集规范、医疗健康数据仓库建模规范、不同场景下的医疗数据指标配置,都可以沉淀为标准产品能力和标准交付实施工作。规范这些交付任务,进一步降低自研能力的投入,培养更多的医疗数据交付和运营人才。引入更适合的场景和更先进的技术能力,增加产品的适用性。医疗行业大数据所采用的技术,离互联网行业还有很远的距离。在某些场景下,数据量也在急剧增加。数据更新和查询的需求非常突出,但对计算资源的投入并不多。因此,在这种情况下,一方面,一方面要引进互联网行业成熟先进的技术,另一方面要根据医疗行业的独特情况进行评估。例如,目前正在尝试在医疗保险的背景下尝试数据湖来解决数据更新问题,并在疾病控制的背景下引入数据湖以满足更快的查询服务。完善产品生态。医疗大数据平台的建设是一个比较漫长的过程,涉及的角色很多。在产品交付和实施中引入生态合作伙伴,可以降低大规模产品交付的成本。此外,医疗大数据最终服务于面向业务的数据应用,业务应用趋于定制化和多元化。所以,需要引入面向业务应用的合作伙伴,让大数据平台更加开放,让合作伙伴共同参与数据应用的开发,保证产品更长久、更健康的成长。加强医疗数据安全产品建设。医疗数据涉及患者的很多敏感信息,对数据的敏感性和安全性提出了更高的要求。因此,平台遵循国家卫生健康保障发布的《国家健康医疗大数据标准、安全与服务管理办法(试行)》进行产品建设,内置符合分类和标准的产品功能模块。医疗数据的分类,并根据不同的数据分类有针对性。
参考:
[1,2] 安信证券。从医度科技香港上市看,医疗大数据解决方案行业潜力何在?