只需3秒就能复制你声音的AI,是全新的AI蓝海吗?
2022年属实是AI大年。
从年初年中的AI绘画,到年尾的AI作者,好像这个AI已经实实在在的刷了一整年的存在感了。
先是画图——画好图——画黄图,再到写文——写好文——写黄文,我不知道AI的制作者们抱着什么样的伟大信念制作出来这些新颖的好东西,但只要落到网友们的手里,这些数据模型肯定会被灌满奇怪的东西。
就拿我群里最近疯狂转发的AI绘画最新训练成果来说,在我不知不觉间,这小机器人已经可以精准的拿捏我的XP了。
不过今天要介绍的并不是这两个已经被玩坏的AI,而是微软最新出品的AI成果——语音合成模型VALL·E。
它可不是那些影视剧讲解里的那些“注意看,这个男人叫小帅”的固定语气语调的AI念稿人,而是号称“3秒钟”就可以复制你的声音的赛博卡卡西。
根据我查来的说法,VALL·E相比传统的AI语音模型采用“梅尔频谱”提取特征,它转换了思路与赛道,将语音合成这个步骤改为“语言模型”的任务。
以前走音素→梅尔频谱(mel-spectrogram)→波形的流程,被VALL·E改变成了音素→离散音频编码→波形。
——当然,尽管这些东西是我写出来的,但我完全看不懂官方说的是什么,我放张图也只是显得文章没有那么空而已。
在我能看懂的介绍里,让我觉得最值得发出来给大家讲讲的,就是这个VALL·E,不只是能用过数据模仿出采样人的音色,它连语气和语速都模仿的非常到位。
也就是说,你录个几句话给这个AI听一听,他就能通过这些数据来识别你的语气语速,并可以在接下来你制作的“作品”中使用这套数据——约等于,你不张嘴就把话说了。
除此之外,包括采样者的背景音和话语中的情绪,VALL·E都能通过学习慢慢掌握。
一个音色、语气、语调、语速、情绪甚至是背景里的环境音被训练到极致的语音AI,说出的话可能真的和本人差别不大了。
搭配上“AI作者”和“AI绘画”,好家伙,已经可以组织起一个公司会议上的赛博PPT了,等哪天“AI动画”出来了,我们没准还能看见机器人自己拍的电影。
不少网友也评论,继画家和作者失业后,这股海克斯狂潮终于轮到配音演员身上了。
像其他 AI 新技术一样,这个尚未开源的VALL-E在安全、伦理等方面也引发不少人的担忧,尽管微软发布了关于使用 VALL-E 的道德声明,但未来的事儿谁又说得准呢。
怎么样各位,这么看下来,你觉得这个VALL-E会不会是新的一年里的AI蓝海?
最近更新汽车资讯
- 哲学沙龙
- 高原痛风临床研究
- 快播插件(SPSS无法启动因为应用程序的并行配置不正确)
- 教育部2021年工作要点:加强普通高校毕业生就业工作
- 【陪你母乳喂养】 哎哟喂,没生孩子也能泌乳?
- 重组家庭没有血缘关系的兄妹可以结婚吗
- 非现役人员生活待遇经费保障与管理探析
- 《发展心理学·从生命早期到青春期》基础理论读书笔记--结合教育动画的相关研究
- 2023届河南省郑州市(二模)高中毕业第二次质量预测语文试题及答案.docx
- 《那片星空那片海》全集剧情简介 分集剧情介绍
- 给6-15岁男孩女孩的精选主题书单(分性别,暑假必备)
- 优秀家长家庭教育经验分享5篇
- 郭洪雷:汪曾祺小说“衰年变法”考论
- 章子怡汪峰吵架原因 章子怡与汪峰吵架事件详情
- 情感故事:不回家的女人
- 道德伪善的教育学思考
- 2018级高职医学影像技术专业人才培养方案
- 以国家之名的罪恶——评德国影片《窃听风暴》
- 影视传播范文10篇
- 九天揽月一一敢峰证明四色定理之谜
- 挪威流产或人工流产后妊娠的妊娠间隔和不良妊娠结局(2008-2016 年):一项
- 好看的美剧排行榜(12部高分高质美剧推给你)
- 解放思想大讨论心得体会
- 长谈 | 内蒙古电影新浪潮:现实的结构与质感
- 美国《国家性教育标准》及其启示(下)