OCR助力全明细、全自动理算系统,谐筑打造医疗数据与商业保险深度结合的科技运营平台

作者:蔡傲雪 2019-05-24 18:00

{{detail.short_name}} {{detail.main_page}}

{{detail.description}} {{detail.round_name}} {{detail.state_name}}

{{detail.province}}-{{detail.city}}
{{detail.setup_time}}
融资金额:{{detail.latest_event_amount}}{{detail.latest_amount_unit}}
投资方: · {{item.latest_event_tzf_name}}
企业数据由提供支持
查看

1992年,在美国求学的吴军和唐澍在打工时相识于一家餐馆。异国他乡,志趣相同的二人,很快成为了要好的朋友。毕业后,二人分别进入了美国的健康险行业,吴从产品的精算起步,唐从IT架构起步。

 

“中国人是非常勤奋的。”吴军将自己和唐澍在美国的经历一句带过。也正是勤奋,2004年,吴被友邦(彼时还隶属于AIG——美国国际集团)从美国派到香港担任友邦亚太区健康险的总精算师。2008年,唐作为总架构师被当时美国最大的健康险公司Wellpoint,从美国派到中国筹备成立一家第三方理赔服务公司。

 

二人先后回国,开始深入研究中国商业健康险。在原有美国专业健康险的知识视角下,吴军发现虽然中国的商业健康险发展的速度非常快,但还存在两点核心问题:

 

第一,中国商业健康险的作业方式较粗放。以理赔为例,保险公司在处理理赔的时候,会面临大量的医疗单据,每张单据都包含了大量的医疗明细数据,但这些明细数据不会在保险公司的系统上留存,这样就错失了大量的有价值的医疗数据。

第二,中国商业健康险的作业模式较原始,多数是手工作业。且手工作业主要依靠理赔员的人工经验,错误率较高,效率较低。

 

在吴军看来,要解决这些问题,就需要借助美国商业健康险的管理经验和先进的系统。而彼时,唐澍正在做这项“搬迁”工作,但实践发现,美国的系统到中国以后会面临“水土不服”的问题。唐澍解释道,从结构上来看,中国的医保是广覆盖、低保障,多数理赔是由医保先赔付,然后再由商业保险介入,存在两个支付方。而美国只是单一的支付方。双方系统的底层架构并不一致。

 

吴军和唐澍看到了这块商机,“我们既有美国的底层技术知识,又对国内的商业健康险有充分的了解,就可以自主打造一套适合国情的健康险系统。”

 

为商业健康险提供自动化、高效理赔服务,在这一愿景下,2011年,吴军和唐澍创立谐筑信息科技有限公司(以下简称“谐筑”),聘请了一支十几人的研发团队,开始研发一款100%自主知识产权的全明细、全自动理算系统。

 

全明细、全自动理算系统


谐筑的理算系统是依据医疗发票进行保险理赔的底层技术。目前我国的医疗发票,左联是大项,如西药费、诊疗费等有限的几个大项科目,右联是明细,会详细的列出每项药品、检查等,如阿莫西林、CT等。

 

中国传统的理算方法是,工作人员手动查看理赔单据,理算后对顾客赔付费用,在这个过程中保险公司系统只会留存有限的几个大项科目,不会将明细数据录入系统并作结构化处理。由于明细数据并不在系统中直接参与理算,风控只能依赖人工经验,有时会出现错误,如诊断与诊疗不符(看感冒开降压药),全部依赖人工判断,极易漏判。

 

为解决理算服务时由手工操作产生的错误,谐筑以底层系统为依托,搭建其系统化、明细化的知识库。吴军说道:“这真的是一项很复杂的工作,以药品为例,我国有25万种药品加剂型,我们首先要对其统一编码,如阿莫西林在中国就有二三十家厂商生产,每一家的名字可能还不一样。”用了四五年的时间,谐筑将药品、器械、检查、手术等诊疗信息编制成标准的知识图谱与编码,并与各地的医保规则加以匹配。

 

为实现自动理赔,首先,系统会对保单进行解析,将保单中的文字规则像搭乐高积木一样转化为系统配置,然后,系统会根据事先的配置自动对病人提交的费用进行分解,确定好哪一部分是由保险公司来赔付,哪一部分由个人支付。

 

为了保证其正确性,谐筑增添了人机协作的功能。谐筑的系统会自动提示风险(如诊断和诊疗不相符),并弹出页面悬挂到审核人员面前,经过审核人员进一步审核过后,方赔付费用。吴军告诉记者,这样做的效率会提高五到十倍,且对人员技能的要求也会有所下降。

 

值得一提的是,谐筑的全明细、全自动的理算系统是一套通用系统,可以对市面上所有的保单进行自动化的理算。

 

随着理算系统在各个保险公司的落地,业务量也逐渐加大。吴军发现整套系统还存在一个问题:明细数据是需要人工的方式录入。

 

OCR技术在医疗发票中的应用


“目前国内的OCR技术(图片转换文字技术)已经比较成熟,但在医疗发票识别领域却只有30%的准确率,几乎不具实用性。”吴军解释道,目前我国的医疗发票为机器打印,存在很多问题,如:纸张上有水印、发票上盖着各种章、印刷会出现错行现象等等。且国内不同医院的医疗发票格式是不同的。

 

这些因素都导致了医疗数据OCR识别准确率较低。由此,在第一套自动理算系统研发五年之后,谐筑开始研发其第二套基于深度学习的人工智能OCR系统。

 

微信图片_20190524170729.jpg

谐筑识别效果(图片来源:企业提供)


该OCR系统经过两年时间的研发,已累计学习了百万张发票影像和百万条清单明细,扫描和拍照影像的识别准确率都达到90%以上。且单张票据单线程可实现秒级识别,一台四显卡服务器一年可识别上千万张发票。

 

在实际生产中,为保证录入信息100% 正确,谐筑采用自动识别+人工复核的模式。值得一提的是,生产过程中被人工修正过的错误数据都得以沉淀,参与识别引擎再次学习,系统的识别能力不断被加强,人工参与率也随之降低,目前已经达到了“机器录入为主,人工校验为辅,错误数据加强学习”的良性循环。

 

目前,谐筑的两套系统相互配合。赔付对象通过微信小程序或APP上传医疗单据图片,OCR系统识别,识别过后通过人机协作系统完成复核工作,之后发票上的明细数据就以一种结构化的方式进入自动理算系统,最终实现赔付。

 

下步规划方面,谐筑会继续深化机器学习,并与各大保险公司建立合作。

 

据了解,谐筑目前正在进行B轮融资。

如果您想对接动脉网所报道的企业,请填写表单,我们的工作人员将尽快为您服务。


注:文中如果涉及企业数据,均由受访者向分析师提供并确认。如果您有资源对接,联系报道项目,可以点击链接填写基本信息,我们将尽快与您联系。

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

分享

微信扫描二维码分享文章

企业
对接
商务
合作
用户
反馈