“语音侦探”识破绽，武大学生开发“伪造语音识别系统”

栏目：教育教学时间：2023-01-21

　　长江日报大武汉客户端1月6日讯当语音消息被伪造，如何识破？近日，武汉大学学生们研发出“伪造语音检测系统”，如语音识别领域的福尔摩斯，帮助人们迅速识别骗子的“伪造语音”，减轻损失与危害。

　　据介绍，声纹识别系统的应用已非常广泛，尤其是在手机支付等金融领域，已经有了较多的应用实例。然而，目前的声纹识别系统的安全性并不高，使用一些简单的伪造语音攻击技术，就能够轻易“骗”过声纹登录及声纹认证系统，防不胜防。

　　武汉大学国家网络安全学院2022级博士生、伪造语音检测队队长刘武洋告诉长江日报记者，语音伪造检测的相关研究越来越多，但是现有方法网络结构单一，而且模型检测训练集外样本的能力较差。课题组长期研究语音信号隐写分析相关领域，发现伪造语音在合成时，更注重与真实语音听感相似，不会关注信号和特征上的相似性，在信号微观层面可能会具有生成方法的固有特征，与真实语音存在较大差异。

　　针对现有声纹认证系统对于伪造语音攻击的脆弱性，团队提出了基于信号微观相关性的伪造语音检测系统。

　　刘武洋介绍，“伪造语音检测系统”的关键技术在于信号微观相关性特征的提取，思路源于图像信息隐藏。作为声纹识别系统的前置模块，该系统可从语音中提取多尺度、不同层次的语谱图帧间、帧内的微观相关性特征，从而在进行声纹认证之前先对语音的真伪进行判断，在抗伪造攻击的综合性能、实时性和可移植性上都取得了较好的结果。

　　伪造语音检测系统的工作流程图。

　　“就像拿着不同放大倍率的放大镜，捕捉不同层次的特征。”刘武洋说，“如果把语谱图想象成一幅画，我们的检测系统就是拿着放大镜去比较画上每个像素之间的相关性。真实的语音笔触连贯、浑然一体；伪造的语音虽然远看相似，但在放大镜下就可能断断续续、有算法生成的痕迹。”

　　相较于其他算法，这套“武大造”伪造语音检测算法从隐写分析的思路出发，提出了基于语音信号相关性的伪造语音检测方法，通过分析微观信号帧内与帧间的相关性，判别样本的真伪，平均错误率低于5%，优于大多数现有算法。

　　“这套系统可以应用于声纹识别系统的防护，常见场景如智能家居、移动支付认证和安保系统等。本系统可以作为声纹识别系统的一道前置防线，在语音进入系统前先验证其是否为伪造，从而保护系统不受伪造语音攻击。”刘武洋说。

　　据悉，武汉大学国家网络安全学院伪造语音检测队由任延珍教授担任指导老师，成员均为武汉大学国家网络安全学院的研究生，2022级博士生刘武洋担任队长，其他成员分别为2021级硕士生邓俊龙、彭荔、朱洪承。在不久前落幕的“华为杯”第一届中国研究生网络安全创新大赛中，他们这一“基于信号微观相关性的伪造语音检测系统”项目斩获创意作品赛一等奖。

　　团队成员，从左至右：刘武洋、彭荔、朱洪承、邓俊龙。

　　“无论是从技术层面还是商业层面，伪造语音检测系统都具有良好的应用前景。期待未来可以将检测模块移植到各大语音助手或声纹识别系统中，保障系统安全。”（长江日报记者陈晓彤通讯员武柳青张华）

　　【编辑：赵可】

　　更多精彩内容，请在各大应用市场下载“大武汉”客户端。

　　举报/反馈

上一篇：「最适合家长的复习材料」语文二年级上册《黄山奇石》复习方法
下一篇：@白云区家长，一文汇总白云区优质初中最全特色班信息！

“语音侦探”识破绽，武大学生开发“伪造语音识别系统”

最近更新教育教学