4月22日,声纹识别产业发展与创新研讨会于清华大学成功举行。本次研讨会由中国计算机协会(CCF)语音对话于听觉专业组、得意音通信息技术研究院主办,清华大学人工智能研究院听觉智能研究中心协办。亿欧作为特邀媒体参加了本次会议。

  会上,CCF常务理事、语音对话与听觉专业组副组长、中科院模式识别国家重点实验室副主任陶建华进行了CCF致辞。中科院语言声学与内容理解重点实验室主任、中科信利创始人颜永红,中国互联网金融协会业务三部副主任陈则栋,陆军工程大学副教授徐明星,CCF语音对话和听觉专业组组长、清华大学人工智能研究院听觉智能研究中心主任、得意音通创始人郑方分别进行了相关主题演讲。

  声纹识别为何得到如此高的认可?

  2018年5月,国家互联网信息办公室发布了《数字中国建设发展报告(2017年)》,其中特别提到现在信息资源共享开放面临着线上身份认证的瓶颈。

  徐明星表示,在线身份识别除了存在管理上的问题外,还会有用户被不法分子胁迫或在不知情时“被动”进行身份验证的情况。他认为,“真实身份+真实意图”将是一种很好的解决方案,即除了确定用户的真实身份外,还需要通过情感计算(如恐惧检测)来确定用户是否受到胁迫。真实的身份加上真实的意图的验证,将有效防范来自暗里、明里的***。

  在应用方面,语音可以和其他模态实现浑然一体的多模态融合。2015年初,为了顺应国际国内移动金融发展趋势,×××印发了《关于推动移动金融技术创新健康发展的指导意见》。徐明星表示,在×××发布的标准中提到认证的手段必须是多种形式、多通道,而声音在说话的同时就能进行表情等图像验证,这也是语音在实现方面的特别优势。

  在隐私安全方面,徐明星认为,意图辨认与声纹结合将是一个更加安全、更加智能的一种认证系统。在声纹识别的认证层面,认证包含三个阶段:先录音,然后进行计算机比对,最后将结果呈现。结果呈现本身就是用户想要的,不存在隐私问题。而中间声纹比对的计算过程,由于它的数据不可解释,超越了人类记忆理解的能力范围,相当于这一过程的信息和数据是天知、地知、计算机知。因此在比对中也和隐私没什么关系。而输入的语音,这里分成三种类型的信息:有声学环境、传输通道、用户语音。很显然,环境如何,话筒怎么样与隐私的相关性不强。传输通道和用户语音跟个体的隐私也没什么关系。其中,用户的语音内容是验证中需要的内容,亦和隐私关系不大。

  陈则栋在演讲中讲到,声纹有唯一性和独一性,并且声音一般不涉及用户的隐私,相对来说不会那么敏感,更容易采集到,也更容易达到国家网络安全法以及信息安全技术、个人信息安全规范等要求。声纹识别作为一种基于动态行为的身份认证方式,可以结合动态声纹密码实现双向交互。相对于指纹识别等生物技术,声纹识别在个人隐私保护、安全度具有优势。

  基于此,近年来,声纹识别技术在金融领域的应用得到了相关监管部门的鼓励。2015年、2016年相继出台了关于改进个人账户服务、加强账户管理的通知,以及关于落实个人银行帐户的通知,明确指出开立个人账户的可以将探索声纹识别作为辅助手段。为了引导声纹识别技术应用规范发展,2018年10月,×××正式颁布了《移动金融基于声纹识别的安全应用技术规范》金融行业标准,这是第一个声纹识别的标准,也是我国首个生物特征识别安全应用技术标准。这在一定程度上反应了声纹识别已得到相对较高的认可。