仅需3分钟视频,自动训练5小时,得到高质量数字人,效率10倍提升!看小冰技术框架
作者|格林? ? ?出品?|?新芒X
让你分分钟造出一个自己的数字人来。
之前听到这样的宣传口号,其实是不怎么相信的。但是也有可能,要么是那种捏出来的卡通虚拟人,要么是只会动动嘴眨眨眼的"一眼假"数字人。
直到最近,使用了由小冰数字人框架驱动的技术方案,并从0到1生成出自己的专属数字人后,真切地打破了笔者的认知。
一方面感受到现有数字人技术的成熟度,另外也享用着自己真身数字人带来工作效率的提升。
我们不妨通过以下原创视频来感受下。
接下来,我们试图从生成的全过程,和小冰技术能力角度,来进行详细分享,如果你也想拥有自己的专属数字人,最后我会附上联系方式。
▌
从0到1生成自己的数字人总共分几步?
不知大家有没有这种发现,我们在刷直播间,短视频,甚至网上购物时,时不时的就会碰见数字人的形象。现在已经是遍地开花的状态和节奏。
微软公司CEO萨提亚·纳德拉认为,数字人技术具有帮助人类提高工作效率、创新和包容性的巨大潜力。但也需要开发人员秉持高道德标准和社会责任感来使用它。
那么如此高能的数字人,到底是怎么创作生成的?我们以笔者用小冰框架的数字人来做一个详细讲解。看完之后你会直呼原来定制自己的数字人真的一点也不难。
最开始,我们需要有数字人制作平台的权限,如果你也想开通制作属于自己的数字人,我后面会讲到。有了权限后,就会有一个数字人制作的后台,如下(在手机或电脑上均可操作)。
整个定制过程,就是需要我们准备形象和声音素材数据。形象,即我们真人出镜的视频。
先看形象定制,需要录制视频、制作形象、配置入驻三个步骤。
其中录制视频过程,平台会给到你很详细的指引和注意事项提示,看懂后,即可开始录制,也可以使用已经录制好的视频,直接上传,视频质量越高越好(1080p-4k)。所需时长在3分钟左右,不算长。
录制完成并提交上传后,先有一个常规的初审,审核通过后,即可进入训练过程,所需时长在5个小时左右。
经过训练后,你就会得到一个专属的高度复刻还原的数字人形象。当笔者看到自己的数字人出炉后,虽然见识过很多数字人,但依旧很激动。
形象定制完成后,就可以按照几乎同样的步骤来定制声音了。
完成形象和声音的录制和训练,就完成后整个数字人定制的过程。就可以来进行入驻的工作,也只需要一个步骤就能搞定。
看完之后,是不是就会察觉到制作一个专属数字人,也没有那么复杂和高深?
升级后的AI数字员工,基于小样本学习,用智能手机采集3分钟音视频数据,经过数小时训练,就能复现真实人类的容貌?与声音。且视觉声音完全依靠CPU运行,能有效缓解市场上GPU算力供给不足和成本高昂的痛点。
笔者的数字人前后录制也就花了半个小时时间,其他的就交给后台自动训练和生成就行了,整个过程还是比较丝滑的。
▌
更进
一步,直接生成数字人播报视频成片
有了数字人的形象之后,我们就需要来安排他干活了。数字人,原则上可以做诸多事情,比如视频内容生产、资讯播报、电商直播,导购推荐、任务助理,品牌大使等。但用小冰的数字人框架,目前赋予了播报和语音生成,两项基础的能力。
操作界面也比较简单,就是输入需要播报或生成语音的文案,在编辑相关的模版、字幕、背景、音乐等元素,完成后点击提交即可生成任务。最后即可一键下载到本地。
可以根据需要分发至各大平台。
以上正是小样本数据即可定制专属数字人,并制作输出视频的整个过程。在笔者看来,整个过程是非常容易上手的。
▌
如此高质量数字人,小冰是怎么做到的
在之前的印象中,定制数字人需要很专业的采集设备,专业的人员,很长的时间,以及高昂的费用。但是笔者使用的小冰框架的数字人解决方案,几乎将各项成本拉至极低,打破了有需求的普通人制作使用的门槛。
关于小冰公司,这里有一个背景是绕不开的,一个是网红数字人ip小冰,打出了“在亿万?之中,我只属于你”的口号,另外一个是微软背景。
小冰公司,源于微软亚太研发集团,2020年从微软完整分拆独立。2021年7月完成A轮融资,AI行业成长最快独角兽。
2022年11月完成A+轮10亿元战略融资,继续高速发展。拥有自然语言处理、计算机视觉、计算机语音、AIGC、大模型全栈能力。国内首倡AIBeing和AIGC,研发应用最早,已落地、可体验的商业价值案例最多。
据了解,小冰的数字人具有不同的性格特征、态度观点、生物学特征、创造力、知识和技能,兼具情感交互能力、专业能力和内容生产能力,已被大众熟知,并应用在多个行业场景。
在真实的落地场景中,我们注意到,短视频播报和数字人带货直播领域,已经被广泛应用。
通过AI电商主播,可以7*24小时讲解产品,轻松讲解海量SKU,准确回答留言区问题,沉淀和提炼最佳运营实践;更重要的是,从价格促销型直播带货,升级为品牌价值型直播带货,让品牌主不再被头部主播绑架。
此外,还有这样一个案例,笔者印象深刻。那就是万科集团引入的数字人形象崔筱盼,作为财务部催收专员,数字员工,基于流程和数据建模,结合小冰框架的整体能力,由她催办的预付应收逾期单据核销率达到91.44%。由于业绩突出,万科集团董事会主席郁亮在2021年底,颁给她“万科集团总部2021年度优秀新人奖”。
在今年4月份,小冰公司宣布了AI数字员工SaaS产品线最新进展。升级后的AI数字员工,采用大模型小样本技术,支持线上自助创建,以及真实人类的声音和形象复刻,能进行内容生产与实时交互。
升级后的AI数字员工,基于小样本学习,用智能手机采集3分钟音视频数据,经过数小时训练,就能复现真实人类的容貌与声音。且视觉声音完全依靠CPU运行,能有效缓解市场上GPU算力供给不足和成本高昂的痛点。
小冰的大模型技术也在此次升级中获得公开。升级后的AI数字员工能进行语音和文本实时交互,有多种对话模式,最佳效果与ChatGPT无异。可在网页(PC端+移动端)、公众号、APP、直播间、VoIP、线下装置落地,几乎覆盖了企业全部应用场景。
▌
如何即刻拥有同款小冰框架数字人?
数字人的价值不言而喻,并且后期更会呈现井喷式发展。谷歌CEO桑达尔·皮查伊表示数字人技术的影响将是渐进和长期的,它能够辅助人类工作?而不是替代人类,让人类专注于更创造性的工作。
笔者对使用小冰框架打造的数字人分身是很满意的。看完后,如果大家也需要用同款技术能力来创造自己的数字人,提高自己工作效率和业务想象力的话,我们公司和小冰的所属公司签订了战略合作协议,为数字员工标准化产品提供营销渠道和推广,为数字人的进一步普及,和客户效率的提升贡献一份自己的力量。
上一篇:明晓溪作品
下一篇:聊起范冰冰,李治廷说:食得咸鱼抵得渴,那些绯闻没什么!
最近更新娱乐资讯
- 获奖影评赏析|《阿丽塔·战斗天使》
- 人生必看十部好看的纪录片(十部必看的现实主义纪录片)
- 日本十大禁欲动漫盘点:唯美霸道下的污镜头
- 墨西哥大麻即将合法化,美媒:美国夹在两个“卖大麻的邻居”之间
- “和合”文化背景下昭君文化的价值生成
- 马来酸阿法替尼片人体生物等效性试验
- 原创《满城尽带黄金甲》:喧哗与沉静的戏台,道德与伦理的悲歌
- 裴旖旎
- 隐适美附件又掉了,从第一天掉了2颗,第二天掉了1颗,今晚我还戴牙套吗?
- 电视剧《最美的青春》:好作品是如何炼就的
- 狗头萝莉出摊卖煎饼大家怎么看?
- 记者的职业伦理:我该何时放下相机
- 绝命毒师电影,「蚁人」改造DNA,首部Netflix华语剧...10月流媒体片单
- 这是一部非常独特的「成人动画」,少儿不宜
- 高分电影推荐!六部直击人性黑暗面的韩国片!部部引人深省!
- 2022天津解放军464医院整形美容中心整形价格表(价目表)全新发布
- 精 [电影推荐]一再婚女人因拯救女儿,让两个家庭面临人性考验,此电影令人感动
- 缓冲晶体溶液与生理盐水对重症监护病房患者急性肾损伤的影响:SPLIT随机临床试验
- 未成年人千万别看这部片子,简直太变态了!!!
- 生态在文学中的位置
- 与3800多名女性发生过关系,世界小电影之王,终于那啥了
- 新加坡电影《爸妈不在家》爆冷获多项金马奖
- 调查称52%受访者认为国产电影色情暴力问题严重
- 红楼梦初中读书笔记
- 家庭伦理剧,小品剧本《家庭矛盾》