泰山区:“大数据”赋能农业,撑起农民致富梦
近日,加州大学伯克利分校的研究人员表示,他们正在使用无声语言和收集肌肉活动的传感器来训练人工智能。其中,无声语言是用肌电图(EMG)检测的,电极则放在脸和喉咙上。研究人员表示,该模型的重点是研究被称之为“沉默语音”的模型,该模型将能够有效地检测到人们想说、但没说出声的话。这将对失语者实现交流具有重大的意义。
据了解,该项研究人员们相信,他们这项技术能够帮助失语者提供大量的应用,并且可以支持人工智能助手或其他对语音命令做出响应的设备进行沉默语音检测。但从理论到实践,从生产到应用这期间还有更多的路要走,有更多的困难需要攻克。
首先,在收集数据时,研究者会先在实验者的脸上等部位贴8个贴片,每个贴片都是一个“监视肌肉变化”的传感器。随后,研究人员需录制一段实验者的有声语音,并与肌电图进行对应这种方法能够将肌肉的变化情况、和语音的类型对应起来。然后使用WaveNet解码器生成音频语音预测。在记录数据的过程中,还要再录制一段“对口型”的肌电图,但不需要发声,也就是“沉默语音”。
据介绍,该项技术的实现能够有效地提高单词的正确率,虽然还会存在一定的误差,但经过研究人员的不断收集数据,将会帮助失语者更精准的表达出自己的想法,实现面对面交流。
据悉,该项题为“无声语音的数字发声”的研究论文,在近日举行的自然语言处理经验方法活动上获得了最佳论文奖。这一技术的实现,也将为失语者带来自由交流的希望,为更多的失语者打开另一扇窗。