播音员会被人工智能取代吗?揭开“AI合成主播”的神秘面纱

智能硬件
2018
12/05
网信江苏
分享
第五届世界互联网大会期间,新华社联合搜狗公司发布了全球首个合成新闻主播——“人工智能合成主播”(以下称“AI合成主播”),引起了国内外媒体的关注。目前“AI合成主播”已经实现日常新闻播报的量产。“AI合成主播”的算法原理是什么?它的出现是否会取代真人主播?对此,新华社新媒体中心副总编辑齐慧杰接受访谈,为你揭开“AI合成主播”的神秘面纱。

▲“AI合成主播”正在播报新闻

Q:第五届世界互联网大会上“AI合成主播”表现抢眼。当初萌发“AI合成主播”的创意灵感是什么?开发过程是怎样的?开发过程中遇到了哪些困难?

齐慧杰:“AI合成主播”的雏形是搜狗公司研发的一款可以从图像表情、声音语言等层面进行拟人化训练的AI产品。我们看到这款AI产品以后,发现它有很多地方可以和媒体的内容生产相结合,最终我们决定和搜狗公司联合开发这款“AI合成主播”。

在开发过程中,最大的困难是保证“AI合成主播”在工作时,表情、唇动和声音完全地自然合一。在此之前国外已经有一些虚拟的主播形象了,但是无法做到表情、唇动和声音的吻合。因此我们在这方面下了大力气,最终攻克了这一技术难点,这也是我们的“AI合成主播”在技术层面上最独特的地方。目前这个“AI合成主播”在世界上是独一无二的,现在很多海外媒体对我们的“AI合成主播”很感兴趣。

▲AI合成主播通过语音播报介绍自己

▲“AI合成主播”播报新闻《(珠海航展)燃 红鹰飞行表演队发布宣传片秀特技》

Q:“AI合成主播”背后的算法机制是怎样的?如何实现音频和表情、唇动保持自然一致?

齐慧杰:“AI合成主播”最难的地方是实现表情、唇动和声音的自然一致。为了实现这一点,我们使用了大量的前沿技术,比如人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等,在此基础上结合语音、图像等多模态信息进行联合建模训练后,生成与真人无异的AI分身模型。该项技术能够将所输入的中英文文本自动生成相应内容的视频,并确保视频中音频和表情、唇动保持自然一致,展现与真人主播无差别的效果。

Q:“AI合成主播”未来有可能会取代真人主播吗?

齐慧杰:目前“AI合成主播”可以代替真人主播做一些基础性的工作,提高了新闻视频的制作效率。但是在一些互动性较强的栏目,或一些需要应变和评论的场合,还是需要真人主播来完成工作,这是“AI合成主播”一时半会儿无法取代的。

“AI合成主播”可以完成真人主播的部分工作,这也对真人主播的综合能力提出了更高的要求,未来的真人主播应该是一个集记者、编辑等多重媒体人身份于一身的多面手。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表新Q科技的观点和立场。

相关热点

2月26日,努比亚官方开启开学特惠活动(活动工夫是2月26日-27日),多款新机降价促销,其中努比亚Z17mini 6GB+64GB版售价1299元。努比亚Z17mini是努比亚在2017年推出的中端手机,其亮点是拍照。它搭载了索尼1300万像素后置摄像头,其中一颗为黑色镜头,搭载真颜色RGB Sensor,担任采集丰厚的颜色信息,另一颗为彩色镜头,搭载索尼定制全透光MONO Sensor,进光
通信/计算
iPhone 7发布时,苹果做出了一项严重决议,那就是丢弃了耳机孔在iPhone上呈现的时机,开端全力拥抱无线耳机,这样做的益处不言而喻。剔除3.5mm耳机孔可以让苹果借机赚取更多的钱,当然更深层的一点是,为寸土寸金的外部设计留出空间,既然行业的领头羊都曾经做出表率,其他厂商跟进也是必定。随后我们看到不少手机厂商开端摒弃3.5mm耳机孔,而谷歌和高通也在一定水平上减速了这个状况的发作,不过关于全
通信/计算
  还有几天,你们就要正式和2017年说拜拜了。而在这一年里,有哪部手机让你映像深刻呢?可能有些让你映像深刻的手机本身在市场上
数码产品
  今年苹果发布了iPhone 8/8Plus/X三部手机,但恐怕连库克自己都没想到iPhone8/8Plus命途多舛,市场的不认可、设备本身的不完善
数码产品
  北京时间2017年11月22日,中国铁路正式宣布,从11月23日起(,中国铁路客户服务中心12306网站将正式上线微信支付功能。也就是
业界动态
  现在提起电商大佬,可能你们第一时间就会想到马云和刘强东,对吧?但在小智还年轻的时代,这两个名字还不存在,那个时候听到最
数码产品

相关推荐

1
3