动动嘴就知道你在说什么搜狗中文唇语识别秒杀乌镇一众黑科技-科技-博观网

“床前明月光，疑是地上霜。”

“今天天气怎么样啊？”

机器通过语音识别得出准确的文字内容，早已不新鲜。

但是和机器沟通一定要发声吗？

搜狗展台的黑科技“中文唇语识别技术”打破了这个常规：当央视记者来到搜狗展台体验时，就默声说出了这两句话，而机器准确地识别了出来。换句话说，仅通过识别说话人唇部动作，搜狗中文唇语识别就得到了用户的讲话内容，而这也是业内首个中文非特定人唇语识别技术的公开演示。

乌镇大会“互联网之光博览会”开展以来，搜狗展台的中文唇语识别系统已经吸引了大批的参观者驻足参观，不少人在体验后大呼“太神奇了！”“厉害厉害，我动动嘴它就知道我说的是什么”。CCTV4前来体验的记者，在机器识别了她说出的两句话后，也表示“很准确”。
搜狗展台的工作人员介绍到，这项中文唇语识别技术主要有三大应用场景。“一是噪音较大对语音识别产生干扰的环境里；二是安保领域；三是服务于听障、失语人士，帮助他们更好地理解和表达自己。”

比如在车载环境中，周围过大的噪音很容易使得用户的一些语音指令无法被准确捕获、识别，从而影响人车交互。唇语识别则可以帮助规避这一影响，确保输入的准确率，保证交互的稳定性。在安保领域中，目前很多监控场景，如电梯、马路中只有摄像头，并没有麦克风，通过唇语识别技术，则可以获取重要的用户讲话信息，为公共安全提供有效支持。

在央视《人工智能改变生活》系列访谈中，搜狗CEO王小川也同样提及了这项技术。他解释说，搜狗研发唇语识别的初衷是因为“搜狗搜索和输入法其实都是在和语言打交道。一方面是帮助人们用语音表达，另一方面是通过语言获取互联网上的信息。”语音正逐渐成为主流的人机交互方式，但是在一些嘈杂，甚至无声的环境里，语音所能发挥的作用是有限的，王小川表示“这种情况下，我们就需要发展基于视觉的识别能力。”

据了解，在业内大多唇语识别技术实用性尚待考证的环境下，搜狗的中文唇语识别系统是国内首个公开演示的唇语识别系统，基于数千小时真实唇语数据，首创了复杂端到端深度神经网络技术进行中文唇语序列建模，在搜狗的自然语言处理技术的指导下，最终取得了业界领先的唇语识别效果。

本文地址：http://bloguan.com/?id=461
温馨提示：文章内容系作者个人观点，不代表博观网对观点赞同或支持。
版权声明：本文为转载文章，来源于太平洋电脑网，版权归原作者所有，欢迎分享本文，转载请保留出处！