“保险、医疗、养老是目前大健康产业的支柱,而它们的发展和国际上科技发展的趋势与利用密切相关。”泰康保险集团科技中心科技研究院院长刘岩在接受记者采访时表示,“泰康的战略重点在医养板块,所以医学知识图谱和医学自然语言处理是泰康未来发力的重点。”
从理赔这个痛点说起
理赔是最重要的保险场景,也是保险客户和保险公司打交道最生动的一个场景。
一般而言,由于理赔流程长,影响保险客户的体验。
在传统的流程里,保险公司受理被保险人的理赔申请时,一般要求提供较为详细的理赔文档材料,然后保险理赔人员将资料信息录入到IT系统,最终形成电子记录文档。
但在资料提交阶段,由于客户对流程不熟悉,经常出现提交的理赔资料残缺和资料不完整等现象。等到了理赔受理阶段,客户要反复提交补充资料,理赔审核人员也要不断地进行审核,耗时耗力,最终导致理赔周期被拉长,影响客户体验。
对于保险公司来讲,随着理赔业务量的增加,公司会不断增加运营成本。
截至2020年底,泰康保险集团累计服务个人客户超3.56亿人,服务企业客户超42万家。每年要处理的理赔案件数以百万计,因此,迫切需要医疗健康数据的自动化采集。
目前,全国二级以上医院接近4万家,使用的各种票据有34大类,而且每一家医院使用票据的版式、各个字段的名称都不一样,这就对票据的数字化构成了一个极大的挑战。
泰康与百度智能云合作,将OCR技术应用于理赔业务,并以key-value的方式输出结构化结果,解决百万级不同模版的医疗理赔票据结构化场景。刘岩说:“该产品一方面释放员工潜力,另一方面为客户带来智能化理赔新体验。”
OCR技术的应用
OCR技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
OCR技术其实是影像结构化的一个简称,从技术上来看,OCR属于影像结构化中的关键一步。OCR技术一般就是把里面的字识别出来,但识别完之后多少字能合成一个字段,以及字段与字段之间是什么关系,这叫结构化。结构化之后,人工只要看一眼对错就可以,至少减少了70%的工作量。
综合来看,医疗保险理赔智能化为保险公司带来的价值主要体现在两方面:首先,在降低问题件比率方面,通过上线理赔影像分类与质检能力,在客户上传的过程中提示客户影像缺失和不清晰等问题,辅助客户完成理赔资料的上传;另一方面,在提升录入效率方面,通过对理赔资料的结构化解析,减少理赔人员的手工录入,让理赔人员由录入资料转为复核资料,极大的提升理赔效率。
以费用录入清单为例,以前人工录入一张单据40分钟才能完成,采用智能化解决方案后,10分钟之内就能完成,采集能效提升了4倍。通过OCR技术,泰康不仅实现了理赔票据的结构化信息提取,还实现了智能化理赔业务的升级。
“新冠肺炎疫情之后,健康险投保量增长迅猛,按照以前传统的方式保险公司肯定无法承载那么大的工作量,运用了这项技术之后,原来审核人员和录入人员加班都可控了。”刘岩介绍说。
共建医学知识图谱
保险公司在理赔过程中会收集到大量单据。比如客户住院,会有大量的票据产生。传统的人工录入方法不能录入全部信息,只能挑拣和保险业务强相关的数据录入下来。但是,其他数据其实也非常重要,都是和客户健康相关的,比如客人得了什么病,吃了什么药和住院周期多长等等。这些其实和大健康战略联系紧密,因为现在的健康险服务已不满足于事后的理赔,而倾向于成为管理式健康保险。未来的健康管理,就将以这些传统理赔没有录入的数据作为重要的依据。“从管理式健康保险角度看,客户医疗健康数据的自动化采集至关重要。”刘岩说。
为了践行科技驱动的企业战略,泰康于2016年成立了科技研究院,2017年和百度签署了战略合作协议,2019年又成立了联合创新实验室。
“这几天我们正在和百度沟通如何共建医学知识图谱的问题,这是医学里面最核心的基础组件和基础设施。我们预计花5年时间建成医学知识图谱。建成之后,我们就可以开展一系列线上的健康医疗服务,如智能问诊、导诊、医生端患者端的辅诊、药品的推荐和风控,我们可以建立起一个互联网医疗体系。”刘岩表示。
据介绍,医学知识图谱是实现智慧医疗的基石,有望带来更为高效、便捷和精准的医疗服务。记者 王方琪