近日,第二十六届ICONIP国际神经信息处理学术会议(The 26th International Conference on Neural Information Processing, ICONIP)在澳大利亚悉尼召开,平安科技自动化机器学习平台(AutoML)----奥卡姆Occam平台研究成果《On Probability Calibration of Recurrent Text Recognition Network》正式亮相,并受邀在大会上进行主题演讲。这是继在斯坦福大学深度学习推理DAWNBench竞赛获得冠军、获得2019年CCF科学技术奖科技进步杰出奖后,平安科技奥卡姆平台的又一项重大突破。
ICONIP会议是由亚太神经网络协会APNNS(Asia-Pacific Neural Network Society)主办的人工智能神经网络领域最重要的会议之一。本次会议特别邀请到了神经网络领域权威专家David Powers 和 Bao-Liang Lu等嘉宾出席并进行主题分享,并汇聚了来自世界各地从事人工智能理论和应用研究的顶尖研究人员,共同分享国际人工智能研究领域的最新理论和技术成果。会议共收到1200+篇来自世界顶尖学府和科研机构的论文投稿,最终录用337篇,会议录用率仅为27.4%,而受到邀请进行主题演讲的文章更是屈指可数。
图1 第26届ICONIP
平安科技奥卡姆平台研究成果发布
平安科技奥卡姆平台研究成果《On Probability Calibration of Recurrent Text Recognition Network》是由平安集团首席科学家肖京博士指导,平安科技副总工程师王健宗博士作为论文的通讯作者,在会议录用的337篇论文中脱颖而出,并受邀成为口头报告论文。
奥卡姆平台这篇论文针对OCR识别中未分段文本识别模型中的校准异常问题,创新性地将顺序文字识别网络(SRN)与校准卷积神经网络(Calibration CNN)相结合,提出了一种将未分段文本转化为单个字符并进行识别校准的新型算法。不同于传统算法针对一段文字中所有样本均采用相同的模型参数的方式,奥卡姆采用的算法将未分段文本中的每个文字提取出来,虽然仍采用相同的识别模型,但是凭借奥卡姆平台计算能力极强的优势,可以并对不同的个体文字自适应地选择不同的校正参数,调整每个文字识别结果的置信度输出,从而降低置信度的误差。而在此论文成果的真实应用中,通过使用奥卡姆平台,高效、快速地在三个样本集中试验了五种不同的CNN参数校准方式,并得出了以DenseNet结构的为基础的最佳识别校准算法。
图2 奥卡姆论文提出的校准方式
本论文的研究成果可利用在金融、保险、医疗等领域对卡证、财务票据等信息进行智能识别录入。以智能投保场景为例,用户可利用论文中的技术,对驾驶证、行驶证等证件上的未分段信息进行识别,实现车主信息的自动识别和录入。在手机移动投保、信息核实等过程中有效提升运营效率,优化用户体验。
定义全新的AI开发模式,Occam平台屡获殊荣Occam平台是平安集团研发的搭建在大规模GPU集群上的一站式AI开发平台,为用户提供了从数据处理、算法开发、模型训练、模型优化到模型推理的全周期AI工作流,并且包含数据标注、数据增强、多元模型自动搜索、超参优化、模型自动压缩、图神经网络、联邦学习、难例自动发现等多种特色工具和服务。
图3 奥卡姆平台概览
2019年,Occam平台的多项优秀成果得到国内计算机领域权威学术团体的肯定。不仅首次荣获"2019年CCF科学技术奖科技进步杰出奖",还在斯坦福大学深度学习推理DAWNBench竞赛中,力压由康奈尔大学和谷歌组成的豪华联队,以7.579毫秒的惊人成绩勇夺冠军。
当前Occam平台已落地平安产险,并为平安声纹、AI音乐、智能视觉等多个AI团队项目提供平台支持。例如:Occam平台实现了首个基于神经架构搜索的声纹识别模型Auto-Vector,只需要30GPUh就可以在VCTK数据集搜索一个高精度声纹识别模型,其效果远超过如Xvector、LSTM-GE2E等最先进的顶级专家设计的声纹模型,并且声纹模型训练最高可达到90%的训练提速。