仅需3分钟视频,自动训练5小时,得到高质量数字人,效率10倍提升!看小冰技术框架

栏目:娱乐资讯  时间:2023-08-13
手机版

  作者|格林? ? ?出品?|?新芒X

  

  让你分分钟造出一个自己的数字人来。

  之前听到这样的宣传口号,其实是不怎么相信的。但是也有可能,要么是那种捏出来的卡通虚拟人,要么是只会动动嘴眨眨眼的"一眼假"数字人。

  直到最近,使用了由小冰数字人框架驱动的技术方案,并从0到1生成出自己的专属数字人后,真切地打破了笔者的认知。

  

  一方面感受到现有数字人技术的成熟度,另外也享用着自己真身数字人带来工作效率的提升。

  我们不妨通过以下原创视频来感受下。

  接下来,我们试图从生成的全过程,和小冰技术能力角度,来进行详细分享,如果你也想拥有自己的专属数字人,最后我会附上联系方式。

  ▌

  从0到1生成自己的数字人总共分几步?

  不知大家有没有这种发现,我们在刷直播间,短视频,甚至网上购物时,时不时的就会碰见数字人的形象。现在已经是遍地开花的状态和节奏。

  

  微软公司CEO萨提亚·纳德拉认为,数字人技术具有帮助人类提高工作效率、创新和包容性的巨大潜力。但也需要开发人员秉持高道德标准和社会责任感来使用它。

  那么如此高能的数字人,到底是怎么创作生成的?我们以笔者用小冰框架的数字人来做一个详细讲解。看完之后你会直呼原来定制自己的数字人真的一点也不难。

  最开始,我们需要有数字人制作平台的权限,如果你也想开通制作属于自己的数字人,我后面会讲到。有了权限后,就会有一个数字人制作的后台,如下(在手机或电脑上均可操作)。

  

  整个定制过程,就是需要我们准备形象和声音素材数据。形象,即我们真人出镜的视频。

  先看形象定制,需要录制视频、制作形象、配置入驻三个步骤。

  

  其中录制视频过程,平台会给到你很详细的指引和注意事项提示,看懂后,即可开始录制,也可以使用已经录制好的视频,直接上传,视频质量越高越好(1080p-4k)。所需时长在3分钟左右,不算长。

  

  录制完成并提交上传后,先有一个常规的初审,审核通过后,即可进入训练过程,所需时长在5个小时左右。

  经过训练后,你就会得到一个专属的高度复刻还原的数字人形象。当笔者看到自己的数字人出炉后,虽然见识过很多数字人,但依旧很激动。

  

  形象定制完成后,就可以按照几乎同样的步骤来定制声音了。

  

  完成形象和声音的录制和训练,就完成后整个数字人定制的过程。就可以来进行入驻的工作,也只需要一个步骤就能搞定。

  看完之后,是不是就会察觉到制作一个专属数字人,也没有那么复杂和高深?

  

  升级后的AI数字员工,基于小样本学习,用智能手机采集3分钟音视频数据,经过数小时训练,就能复现真实人类的容貌?与声音。且视觉声音完全依靠CPU运行,能有效缓解市场上GPU算力供给不足和成本高昂的痛点。

  笔者的数字人前后录制也就花了半个小时时间,其他的就交给后台自动训练和生成就行了,整个过程还是比较丝滑的。

  ▌

  更进

  一步,直接生成数字人播报视频成片

  有了数字人的形象之后,我们就需要来安排他干活了。数字人,原则上可以做诸多事情,比如视频内容生产、资讯播报、电商直播,导购推荐、任务助理,品牌大使等。但用小冰的数字人框架,目前赋予了播报和语音生成,两项基础的能力。

  

  操作界面也比较简单,就是输入需要播报或生成语音的文案,在编辑相关的模版、字幕、背景、音乐等元素,完成后点击提交即可生成任务。最后即可一键下载到本地。

  

  可以根据需要分发至各大平台。

  以上正是小样本数据即可定制专属数字人,并制作输出视频的整个过程。在笔者看来,整个过程是非常容易上手的。

  ▌

  如此高质量数字人,小冰是怎么做到的

  在之前的印象中,定制数字人需要很专业的采集设备,专业的人员,很长的时间,以及高昂的费用。但是笔者使用的小冰框架的数字人解决方案,几乎将各项成本拉至极低,打破了有需求的普通人制作使用的门槛。

  关于小冰公司,这里有一个背景是绕不开的,一个是网红数字人ip小冰,打出了“在亿万?之中,我只属于你”的口号,另外一个是微软背景。

  小冰公司,源于微软亚太研发集团,2020年从微软完整分拆独立。2021年7月完成A轮融资,AI行业成长最快独角兽。

  2022年11月完成A+轮10亿元战略融资,继续高速发展。拥有自然语言处理、计算机视觉、计算机语音、AIGC、大模型全栈能力。国内首倡AIBeing和AIGC,研发应用最早,已落地、可体验的商业价值案例最多。

  

  据了解,小冰的数字人具有不同的性格特征、态度观点、生物学特征、创造力、知识和技能,兼具情感交互能力、专业能力和内容生产能力,已被大众熟知,并应用在多个行业场景。

  在真实的落地场景中,我们注意到,短视频播报和数字人带货直播领域,已经被广泛应用。

  

  通过AI电商主播,可以7*24小时讲解产品,轻松讲解海量SKU,准确回答留言区问题,沉淀和提炼最佳运营实践;更重要的是,从价格促销型直播带货,升级为品牌价值型直播带货,让品牌主不再被头部主播绑架。

  

  此外,还有这样一个案例,笔者印象深刻。那就是万科集团引入的数字人形象崔筱盼,作为财务部催收专员,数字员工,基于流程和数据建模,结合小冰框架的整体能力,由她催办的预付应收逾期单据核销率达到91.44%。由于业绩突出,万科集团董事会主席郁亮在2021年底,颁给她“万科集团总部2021年度优秀新人奖”。

  在今年4月份,小冰公司宣布了AI数字员工SaaS产品线最新进展。升级后的AI数字员工,采用大模型小样本技术,支持线上自助创建,以及真实人类的声音和形象复刻,能进行内容生产与实时交互。

  升级后的AI数字员工,基于小样本学习,用智能手机采集3分钟音视频数据,经过数小时训练,就能复现真实人类的容貌与声音。且视觉声音完全依靠CPU运行,能有效缓解市场上GPU算力供给不足和成本高昂的痛点。

  小冰的大模型技术也在此次升级中获得公开。升级后的AI数字员工能进行语音和文本实时交互,有多种对话模式,最佳效果与ChatGPT无异。可在网页(PC端+移动端)、公众号、APP、直播间、VoIP、线下装置落地,几乎覆盖了企业全部应用场景。

  ▌

  如何即刻拥有同款小冰框架数字人?

  数字人的价值不言而喻,并且后期更会呈现井喷式发展。谷歌CEO桑达尔·皮查伊表示数字人技术的影响将是渐进和长期的,它能够辅助人类工作?而不是替代人类,让人类专注于更创造性的工作。

  笔者对使用小冰框架打造的数字人分身是很满意的。看完后,如果大家也需要用同款技术能力来创造自己的数字人,提高自己工作效率和业务想象力的话,我们公司和小冰的所属公司签订了战略合作协议,为数字员工标准化产品提供营销渠道和推广,为数字人的进一步普及,和客户效率的提升贡献一份自己的力量。

  

上一篇:明晓溪作品
下一篇:聊起范冰冰,李治廷说:食得咸鱼抵得渴,那些绯闻没什么!

最近更新娱乐资讯