动脉网知识库

登录动脉网

账号密码登录

忘记密码?

手机账号登录

获取验证码

忘记密码

获取验证码

新用户注册

获取验证码

绑定手机号

获取验证码

感谢您使用“动脉网”的产品和服务。 我们尊重并保护所有使用动脉网用户的个人隐私权。
第1条 协议内容及生效
1.1 本用户协议是用户与“动脉网”之间就相关事宜所订立的契约,即包括本用户协议所有正文及“动脉网”已经发布或将来可能发布的各类规则。用户在“动脉网”注册前,必须事先认真阅读本用户协议,特别是本协议中关于限制、减轻或者免除“动脉网”责任的全部协议内容以及含有限制用户权利的协议内容。
1.2 如果用户同意本用户协议,或者存在包括下载、注册和使用及连接“动脉网”服务的行为,将被视为完全接受并同意遵守本用户协议的所有内容,包括接受“动脉网”对用户协议随时所做的任何修改,本协议即构成对双方有约束力的法律文件。如不同意本用户协议,用户不得使用或应主动停止使用“动脉网”提供的服务。
1.3 用户应当为具有完全民事行为能力的自然人,或者是具有独立承担法律责任能力的其他合法主体。若用户属于无民事行为能力、限制民事行为能力人的,或是不具有独立承担法律责任能力的其他主体的,您应在监护人监护下或是得到有权主体授权后使用“动脉网”。
第2条 用户信息
2.1 用户个人信息。用户个人信息包括真实姓名、手机号码、微信号、所属行业、所在公司,现任职位、常驻城市、本人照片、身份证号、微信支付账号、电子邮箱、个人简介等。
2.2 非用户个人信息。用户在“动脉网”上,包括阅读、评价、操作状态、使用记录、使用习惯等在内的全部记录信息。除本条第1款所列用户个人信息范围外的所有信息,均为非用户个人信息。
2.3 第三方平台记录信息。用户通过腾讯微信等第三方平台账号注册、登录、使用“动脉网”服务的,将被视为用户完全理解、同意并接受“动脉网”已包括但不限于收集、统计、分析等方式使用其在腾讯微信等第三方平台填写、登记、公布、记录的全部信息。用户一旦使用第三方平台账号注册、登录、使用“动脉网”服务,“动脉网”对该第三方记录信息的任何使用,均被视为已经获得了用户本人的完全同意并接受。
2.4 用户自行向“动脉网”提供个人信息、教育经历、工作经历、课程主题和介绍以及其他信息,所提供的信息必须在合法基础上保证真实、准确、完整,并保证及时更新以上信息。如因提供的信息存在非法、抄袭、错误等问题,用户需承担因此引发的相应责任以及后果,且“动脉网”保留终止用户使用“动脉网”各项服务的权利。
2.5 用户应维护个人“动脉网”帐户和密码安全,并对此帐户在“动脉网”的所有行为负完全责任,不得将帐户借给他人使用,否则应承担由此产生的全部责任,并与实际使用人承担连带责任。当遇到账户或者密码未获授权使用,或者发生任何安全问题时,用户有责任及时有效地通知到“动脉网”并向公安机关报案。
2.6 用户信息使用,用户在使用过程中发现任何不妥或者不满意之处,有权向“动脉网”提出申请,要求进行相关信息删除等处理;“动脉网”不承担主动删除、销毁用户信息的责任。
2.7 为向用户提供服务,“动脉网”将在合理范围内使用用户个人信息、非用户个人信息以及第三方平台记录信息。用户一旦注册、登录、使用“动脉网”服务,将被视为“动脉网”已包括但不限于收集、统计、分析、商业用途等方式使用用户信息。“动脉网”对用户信息的使用无需其他意思表示,无需向用户支付任何费用。
第3条 服务条款的修改及终止
3.1 “动脉网”的服务范围非常广泛,因此有时还会适用一些附加条款或产品要求(包括行业要求)。附加条款将会与相关服务一同提供,并且在用户使用这些服务后,成为您与我们所达成的条款的一部分。
3.2 “动脉网”始终在不断更改和改进服务。一旦条款及服务内容产生变动,将会在重要页面上提示修改内容。如果不同意我们对条款内容所做的修改,用户可以主动、随时停止使用我们的服务,尽管我们对此表示非常遗憾。
3.3 “动脉网”也可能随时停止向您提供服务,或随时对我们的服务增加或设置新的限制。
3.4 “动脉网”认为用户拥有自己数据的所有权并保留对此类数据的访问权限,这一点非常重要。如果我们停止某项服务,在合理可能的情况下,“动脉网”会向用户发出合理的提前通知,并让用户有机会将信息从服务中汇出。
3.5 如果用户继续使用“动脉网”的服务,则视为接受服务条款的变动。我们保留随时修改或中断服务的权利。我们行使修改或中断服务的权利,不需对用户或第三方负责。
第4条 服务的中断和终止
4.1 在未向用户收取相关服务费用的情况下,“动脉网”可自行全权决定以任何理由 (包括但不限于“动脉网”认为用户已违反本条款的字面意义和精神等) 终止对用户的服务。同时“动脉网”可自行全权决定,在发出通知或不发出通知的情况下,随时停止提供全部或部分服务。服务终止后,“动脉网”没有义务为用户保留原用户资料或与之相关的任何信息,或转发任何未曾阅读或发送的信息给用户或第三方。
4.2 如存在下列情况,“动脉网”可以通过注销用户的方式终止服务: 在用户违反本条款相关规定时,“动脉网”有权终止向该用户提供服务。“动脉网”将在中断服务时通知用户。但如该用户在被“动脉网”终止提供服务后,再一次直接或间接或以他人名义注册为“动脉网”用户的,“动脉网”有权再次单方面终止为该用户提供服务; 一旦“动脉网”发现用户注册资料中主要内容是虚假的,“动脉网”有权随时终止为该用户提供服务; 用户出现作弊行为,网站可根据情况作出处理,甚至注销用户; 其它“动脉网”认为需终止服务的情况。第三方,但基于交易纠纷、技术原因等因素,“动脉网”保有复制、审查服务过程中录音内容的权利。
第5条 用户言行
5.1 用户同意在使用“动脉网”服务过程中,必须严格遵守以下规则: 1) 遵守中国法律法规、行政规章以及规范性文件; 2) 遵守“动脉网”的所有用户协议、通知、协议等文件; 3) 不得为违法、犯罪等目的使用“动脉网”网站及其移动客户端; 4) 不得在“动脉网”上传输及发布以下内容:煽动抗拒、破坏宪法及法律法规实施的言论;煽动颠覆国家政权、破坏国家统一的言论;违背社会风俗和社会道德的言论;煽动民族仇恨、民族歧视,破坏民族团结的言论; 5) 不得使用任何侮辱或毁谤他人,性骚扰,或对未成年人有不良影响的内容; 6) 不得散布淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪的行为; 7) 不得利用本站从事洗钱、窃取商业秘密、窃取其他用户个人信息等违法犯罪活动; 8) 不得侵入本站及国家计算机信息系统,不得传播病毒、特洛伊木马、定时炸弹等可能对“动脉网”造成伤害或影响其正常运转的恶意病毒或程序; 9) 不得在“动脉网”平台从事非经“动脉网”同意的所有牟利性经营活动; 10) 不得侵犯第三方权利,特别是他人著作权、商标权等知识产权或者合法权利。
5.2 若用户有发布违法信息、严重违背社会公德、以及其他违反法律禁止性规定的行为,“动脉网”保有删除各类不符合法律政策或者不真实信息内容而无须通知用户的权利。若用户未遵守以上约定,“动脉网”有权立即终止对用户提供服务,采取暂停或者关闭用户账户等措施。用户须对自己的言论和行为负法律责任。
第6条 知识产权协议
6.1 对于用户通过“动脉网”发布的任何公开信息,用户同意“动脉网”在全世界范围内具有将此等内容编入当前已知的或以后开发的其他任何形式的作品、媒体或技术中的权利。
6.2 除法律规定外,未经“动脉网”书面等任何形式明确许可,任何单位或个人不得以任何方式非法地全部或部分复制、转载、引用、链接、抓取或以其他方式使用“动脉网”的信息内容,否则,“动脉网”有权追究其法律责任。
6.3 用户在“动脉网”所发布的内容,必须保证已经拥有必要权利或授权以进行该内容的提供、发布、提交等行为。
6.4 本用户协议已经构成《中华人民共和国著作权法》及相关法律规定的著作财产权等权利转让书面协议,其效力及于用户在“动脉网”上发布的任何受著作权法保护的作品内容。
第7条 隐私声明
“动脉网”非常重视对用户个人隐私的保护。 “动脉网”在必要时候需要某些信息才能为您提供所请求的服务,本隐私声明针对这些情况下的数据收集和使用情况。作为“动脉网”用户,如果同意接受“动脉网”用户协议及隐私声明,表明您授权“动脉网”对任何您所提供的、或者“动脉网”所收集到的信息有权进行处理、传播、使用。 本隐私声明适用于“动脉网”的所有服务,随着服务的变化,“动脉网”有权对隐私条款不时进行修改更新,且不再另行通知。更新后的隐私声明一旦公布即有效代替原来的隐私声明,您在访问和使用“动脉网”时,即表示您已同意遵守并接受最新的隐私政策。建议您及时关注隐私条款的变更。
7.1 “动脉网”隐私信息范围,通常情况下,在“动脉网”注册、获取服务时所提交的个人信息,包括姓名、联系方式、通讯地址、第三方帐户信息等。
7.2 信息隐私的保护
“动脉网”严格保护您个人信息的安全。我们使用各种安全技术和程序来保护您的个人信息不被未经授权的访问、使用或泄露。 当用户对网站或者移动客户端的服务表示兴趣时,或者向用户提供服务出现问题或者困难时,我们使用这些信息来联系用户。 未经用户同意,“动脉网”不会向第三方提供用户信息,也不会在用户之间传递这些信息。未经用户同意,“动脉网”不会对用户之间的交流信息,包括评价、交流文本和图片内容进行编辑、筛选、篡改。
如果有明确证据表明您所提供的信息存在不符合法律政策或者不真实情况,我们有权无须通知您对信息进行删除、更改等处理。
第8条 免责说明
8.1 就下列相关事宜的发生,“动脉网”不承担任何法律责任: 1)用户应遵守国家的有关法律、法规和行政规章制度。如有用户违反国家法律法规或本用户协议,“动脉网”有权停止向用户提供任务而不需要承担任何责任,如导致“动脉网”遭受任何损害或者遭受任何来自第三方的纠纷、诉讼、索赔要求等,用户须向“动脉网”赔偿相应的损失,用户需对其违反用户协议所产生的一切后果承担全部法律责任。 2)由于您将用户密码告知他人或与他人共享注册帐户,由此导致的任何个人信息的泄露,或其他非因“动脉网”原因导致的个人信息的泄露; 3)根据法律规定或政府相关政策要求提供您的个人信息; 4)任何通过黑客攻击、电脑病毒侵入等非法截取、访问等方式从我们网站上获取的信息; 5)因台风、地震、海啸、洪水、停电、战争、恐怖袭击等不可抗力因素导致的任何后果;
8.2 本服务涉及到互联网及移动通讯等服务,可能受各个环节不稳定因素的影响,比如不可抗力、计算机病毒或者黑客攻击等造成的服务中断或不能满足用户要求的风险,用户须理解和认可,并承担以上风险。“动脉网”对服务的及时性、安全性、准确性不作担保,对因此导致用户不能接收信息,或者传递错误等问题不承担任何责任。
8.3 如“动脉网”的系统发生故障影响到本服务的正常运行,“动脉网”承诺第一时间内与相关单位配合,及时处理进行修复。但用户因此而产生的经济损失,“动脉网”不承担责任。此外,“动脉网”保留未经事先通知为维修保养、升级或其他目的暂停本服务任何部分的权利。
第9条 适用法律框架以及纠纷解决途径
9.1 本协议的订立、执行和解释及争议的解决均应适应中国法律。
9.2 如双方就本协议内容或其执行发生争议,双方应尽量友好协商解决;协商不成时应任何一方均可向有管辖权的中华人民共和国大陆地区法院提起诉讼。
第10条 其他
10.1 如果您在中国大陆以外的国家或地区访问或使用“动脉网”,您有责任遵守所在辖区内有关在线行为和可接受内容的法律。
10.2 本服务的所有权、运作权和一切解释权归“动脉网”所有。“动脉网”有权在必要时修改用户协议,并通过网站或者客户端发布修改变更,且不再另行通知。如果在更改生效后用户继续使用服务,则视为您接受用户协议的变动并遵守最新用户协议。
如果您对用户协议有任何疑问,请联系客服(微信同号):13627682184

尊敬的用户,为了提供更全面的服务,动脉网官方域名正式升级为vcbeat.top,原域名即将停止服务,感谢您的支持!

中文电子病历数据挖掘标准化时代,医渡云如何抢坐头把交椅?

作者:郝雪阳 2018-10-08 08:00

{{detail.short_name}} {{detail.main_page}}

{{detail.description}} {{detail.round_name}} {{detail.state_name}}

{{detail.province}}-{{detail.city}}
{{detail.setup_time}}
融资金额:{{detail.latest_event_amount}}{{detail.latest_amount_unit}}
投资方: · {{item.latest_event_tzf_name}}

近日,为全面实施健康中国战略,落实《国务院办公厅关于促进“互联网+医疗健康”发展的意见》,国家医政医管局发布了《关于进一步推进以电子病历为核心的医疗机构信息化建设工作的通知》。

 

《通知》中提到,要发挥临床诊疗决策支持功能。鼓励医疗机构在电子病历信息化建设工作中,将临床路径、临床诊疗指南、技术规范和用药指南等嵌入信息系统,提高临床诊疗规范化水平。并且指出目标,到2020年,要达到分级评价4级以上,即医院内实现全院信息共享,并具备医疗决策支持功能。

 

要发展临床决策,电子病历的数字化、智能化成为了必然。其中,为实现数据的结构化可计算,可推理,命名实体识别(Named Entity Recognition, NER)等自然语言处理任务的重要性凸显。

 

据悉,电子病历的NER,是通过对既定电子病历纯文本文档,识别和抽取出与医学临床相关的实体提及,结合数据源“现病史记录”的内容及特点,将它们归类到预定义类别。

 

它不仅是文本挖掘的第一步,还是生物医学领域的重要工具,可被应用于诸多方面,如医学文献、在线医疗社区和电子医疗记录上。所以构建电子病历NER的公开数据集,能达到的效果可谓是“一箭多雕”——有助于使医疗实体结构化和标准化,并完成医疗实体关系抽取和医疗知识图谱构建等任务。

 

国际上,已有一批面向英文电子病历的的NER公开评测及标注数据集,包括I2b2、ShARe/ CLEF eHealth和SemEval等,但在国内,此测评尚处空白。

 

为了促进中文电子病历相关研究的发展,填补国内面向电子病历NER评测竞赛及标注数据集的空白,医渡云联合清华大学知识工程实验室和哈尔滨工业大学,共同组织了“面向中文电子病历的命名实体识别”项目的测评。

 

>>>>

NER评测竞赛的初衷


据医渡云首席人工智能科学家闫峻介绍,通常情况下,医疗数据不是医院里有了就可以直接用于临床应用。临床病历设计的初衷是面向记录,而不是面向研究。换句话讲,医生会把临床的所有的情况原原本本地记录下来,但却并没有针对信息做面向研究和应用的加工处理。


这样一来,临床电子病历大部分都是自然语言。而这种文本信息放到计算机里无法进行任何形式的计算,所以首先要做的是数据结构化。


国内信息化系统厂商繁多,不仅采用的标准,且每个医院医生的书写习惯和表达习惯也不同。一些疾病的名称,医院里甚至有上百种表达方式。所以,要从整段的自然语言文本里提出数据,如果没有技术支撑,需要巨大的人力投入。


“医渡云举办‘面向中文电子病历的命名实体识别’项目的测评,初衷也在于此。”闫峻说。


为了攻克难点,医渡云首先对数据进行了“去粗取精”:一方面,在预定义类别中直接将本次测评的关键点——医疗实体提及、起止位置识别和预定义类别等三项进行梳理,使海量数据的“站队”有条不紊;另一方面,在细节之处“精益求精”,单在预定义类别中就设置了五个方面:独立症状、症状描述、解剖部位、药物和手术。具体数据信息如下:

 

图片1.png 

 

为了保障测评专业性和权威性,医渡云在项目的测评的数据整理和标注环节,还组织专业的医生团队做后盾。且为了确保数据安全,向报名参赛的118个队伍明确指出,数据仅限CCKS 2018 竞赛评测。


为何这样一项评测在我国要到今天才能展开?对于这一问题,医渡云人工智能实验室自然语言处理专家焦增涛也给出了解释:“这与其中的技术难点不无关系。其难点一般有两处:一是由于症状类型实体大多表现为结构化形式;二是一些医学术语特有的表达方式,使电脑在识别并读取中经常“卡壳”,这给医学术语的整理和分门别类,产生了难度。”


因此,如果能够克服上述难点,解决当前中文电子病历NER可供使用的公开资源匮乏问题,其价值就能得到更大程度的体现。虽然这次评测任务由于医疗数据的敏感性所有数据都是专业医生团队模拟撰写,但无论从感观数据仿真度还是统计学意义数据分布情况均经过严格科学测试。

 

>>>>

如何形成行业认可的标准?


NER评测的背后,反映出医疗数据标准化的重要性。除了命名问题,数据的质控也同等重要。


在对医院文本进行结构化处理的过程中,医渡云发现医疗数据的质量其实并不高。虽然医渡云合作的医院都是国内排名前150名的三甲医院,但它们的数据依然有很多质量不达标、不准确的地方。


为了解决这些问题,医渡云用三年半的时间专注开发出一个整合性极强的“医学数据智能平台”(DPAP),能把原始零散的不可计算数据变成高质量可计算可应用数据,平台上聚集了大量知识图谱、300种以上的智能处理模块以及二十余种专病库。


DPAP通过对散落的数据整合,构建患者的时间轴模块,以诊疗事件时间为主线,完成疾病数据建模;从疾病的角度来看,DPAP还能够提供疾病数据模型。而无论是疾病数据模型,还是患者诊疗模型,这都是临床科研、路径挖掘、疗效评价、辅助诊断应用的基础。


在此过程中,医渡云还对整个数据的生产进行强力的质控,通过建立医学常识的知识库和归一化处理,将医院内不同的说法,映射到同一个标准。


但问题在于,标准如何制定?


现阶段,在医疗行业,包括政府、学术、民间和企业在内的各种组织,都在尝试定义各种标准。但难题在于,标准制定出来之后,如何让行业遵从它。


闫峻表示:“医渡云不愿意去等待标准的产生,所以我们与很多的专家、医院去尝试制定数据标准。另外,我们觉得更行之有效的方式是,先不通过市场去推广标准,而是与上百家三甲医院合作,按照每家医院自己的习惯,帮助其数据质量提升。”


这意味着,不管是哪一家医院,用什么样的标准,都会跟医渡云自己的标准形成映射。只要映射关系存在,医渡云就可以实现临床多中心的研究,只需在医院授权前提下开放一个接口,所有合作的医院都可以在一个平台上协同合作。


只有把数据服务做好,才有机会在潜移默化中形成大家认可的标准。


标准的好坏的界定,闫峻认为可以从两个途径来看:一能否真正能带来实际价值的落地,二是是否有人愿意追随。医渡云希望能够把自己在科研领域的专业化产品,不仅为临床科室赋能,还要推动医院信息科与临床之间产生共识和共鸣。


此外,从人才结构来看,如果真的想要形成标准,闫峻认为一定要包含医学专家和计算机专家。


以知识图谱为例,专家的知识和经验,便是知识图谱的基础,而数据得出的规律,就是机器学习的范畴,所以两大学派的融合,不仅是大数据和人工智能企业追求的人才结构组合,也是最终形成行业标准的必然融合。

 

>>>>

专病数据价值多多


标准化的结果,是帮助医院产生高质量的专病数据,这也是医渡云这样的大数据公司的重要价值体现。在很多的医院的专病库建设的过程中,医渡云并不是医院提供了数据,就单只作为数据的加工处理方完成交付。


工作中,会经历很多专病库的生产,经历多次迭代。医渡云先要根据医生对数据的解释进行加工生产,回过头来,还要把产出的数据与医生进行对接和修正。高质量专病数据的生产需要经历非常多道工序。“医生对数据有了更深刻的认知,企业也从这个过程中学到很多医学知识,这是一个共同进步的过程。”闫峻说。


在不少项目中,医渡云还要更多做一步。例如某专病库,在医学学术界有着大量的论文文献。医渡云除了评价数据质量、结构化的程度的高低,还要看这份数据能否重现之前的一些科研论文,达到其表述的效果。通过这样的方式,医渡云来验证其交付水准。


>>>>

医渡云的核心:“医疗大脑”


“这些年,医渡云的核心是‘医疗大脑’的建设,一方面是人工智能技术,另一方面是医疗知识图谱的建设。人工智能离不开真实世界数据和最新的医学论文的研究成果的支持,它们结合形成的知识点,是构建医疗大脑的关键。”医渡云CTO徐济铭告诉记者。


据了解,目前医渡云已与700余家医疗机构建立战略合作,其中包括全国top150 中的100家顶级医疗机构,为医院集成融合3亿多患者、13亿人次的医学数据。另外,医渡云还建立了近30个高质量专病库,且每年仍在不断增加中。


在全国,医渡云已与医疗机构产出近20篇国内/国际期刊论文。通过强大的技术处理数据,医渡云为合作机构提供理论依据,通过建立标准、整合数据、培养医学大脑、提供科研灵感来辅助临床诊疗决策、提高效能。


注:文中如果涉及动脉网记者采访的数据,均由受访者提供并确认。如果您有资源对接,联系报道项目,寻求合作等需求请填写 需求表

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

还没有评论,快来抢沙发吧!

分享

微信扫描二维码分享文章