老王小说

手机浏览器扫描二维码访问

第二节 核心技术(第2页)

对照图5-1的数据管理和处理体系,关系型数据库属于结构化数据库,NoSQL数据库和实时数据库属于其中的灵活存储范畴。

医疗大数据并不能采用单一的存储方式,而是需要根据数据特点及应用的需要综合运用关系型数据库、NoSQL数据库、实时数据库、分布式文件存储等多种存储技术。

2.大数据处理技术

针对不同数据类型及应用要求,大数据需要不同的处理技术。

例如:在医疗领域,有对时效性要求不高的居民诊疗和健康管理数据,也有高流量的医院信息系统日志,也有可以实现医保诈骗分析的实时数据。

针对这些数据就可以分别采用图5-1所示的大数据处理层的批量计算、流计算和实时计算技术来处理:

(1)批量计算:

2004年谷歌公司提出的MapReduce以及目前最流行的HadoopMapReduce是最具代表性的批量处理模式。

(2)分布式流处理技术:

分布式流处理是主要适用于日志类流数据处理的技术。

(3)实时计算处理技术:

实时计算最重要的一个需求是能够实时响应计算结果,一般要求为秒级。

3.大数据整合技术

目前国际主流做法是基于HL7和IHE等标准进行医疗大数据共享整合。

其中,HL7基于消息的交换,实现医疗信息系统或医疗机构之间的信息共享和系统协同;基于文档的交换和整合,实现电子病历和健康档案。

IHE定义为在医疗信息系统之间进行信息共享和系统协同的流程规范和数据格式。

4.大数据挖掘技术

大数据时代下的信息具有体量大、复杂性高、更新速度快的特点,从具有如此复杂特性的信息中挖掘出用户所需的情报,难度较以往有了很大的提升,需要对传统的数据分析与挖掘技术进行改进。

(1)数据挖掘算法:

常用的数据挖掘算法主要有关联规则算法、分类算法和聚类算法等,这些数据挖掘算法的分类及其在医疗领域的应用示例见表5-1。

表5-1常用的数据挖掘算法

(2)数据挖掘工具集:

目前,大数据的数据挖掘工具集主要有R语言体系、机器学习体系和挖掘开发包等,这些工具包对一些数据挖掘算法分别进行了并行化改进。

(3)文本挖掘算法:

在医疗大数据领域,文本挖掘算法是一项非常重要的技术。

医疗数据包括各种结构化、非结构化和半结构化的数据。

要想对这些海量数据进行有效的处理,必须先对非结构化和半结构化的数据进行处理,使其能够被系统快速地识别和应用。

医疗领域面临的非结构化和结构化数据主要包括:医生医嘱、出院小结和各种描述性质的分析报告。

针对这些数据,首先需要进行分词,之后再利用医学领域的知识库对分词结果进行概念的识别,最终形成一个机器可读的数据。

在这个过程中,所用的技术包括中文分词、文本挖掘和语义分析。

热门小说推荐
逆隋

逆隋

杨天阿摩,你记住,哥哥的东西是哥哥的,我不给,你不能抢。杨广可我要是喜欢呢?杨天那也不行,否则就会天下大乱,你会留下万世骂名,别人会骂你不忠不孝,骂你惨无人性,骂你总之,最后还会死无葬身之地。杨广半响,杨广怯生生的道哥哥,我吃一个苹果,会有这么严重么?推荐老茅自己已完本的书闯王李自成新传书号93534...

天师上位记

天师上位记

卫瑶卿一睁眼,就从张家的掌上明珠变成了一位因为未婚夫太过出色而被嫌弃的平凡少女放个书友群号215715120,欢迎大家进群玩耍...

武极神王

武极神王

惊世妖瞳乱天地,绝世神体破乾坤。天道沉沦,万世无神帝。诸圣并起,神王执寰宇。乱世争雄,唯我掌天!十大旷世圣体称雄,谁敢与之神体争锋?一个身怀惊天秘密的少年始于蝼蚁群,崛起天才林,傲苍穹,踏九霄!至尊归来星河动,武极神王战诸天!!...

上门女婿是土豪

上门女婿是土豪

作者摩八零的经典小说上门女婿是土豪最新章节全文阅读服务本站更新及时无弹窗广告小说上门女婿是土豪那些踩我的人,可知有一天我也会将你们践踏?我爱的人,我会让你得到无上荣光!...

情深赋流年艾天晴

情深赋流年艾天晴

不要叫我后妈,我没你那么大的儿子!艾天晴一直以为自己要嫁的人是一个快六十的老头,直到某天晚上那个邪魅冷血的男人将她抵在了门上,从此她的日子就...

每日热搜小说推荐