2016百度世界大会开幕 百度语音输入法首次亮相
9月1日,2016百度世界大会在京盛大举行,大会以“AI is the new Electricity”为主题,向外界全面展示百度人工智能成果——“百度大脑”。大会主论坛上,百度创始人、董事长兼CEO李彦宏展示了百度人工智能全貌,展现语音、图像、自然语言处理和用户画像四大前沿能力。在语音识别方面,依托人工智能语音识别技术,百度推出最新产品百度语音输入法,拥有语意识别自动匹配表情,及语音指令查找拨打电话功能。百度首席科学家吴恩达表示,百度语音输入法是基于Deep Speech系统献给用户的第一份礼物,两个月后将在安卓平台正式上线。
自动匹配语音表情 满足聊天趣味体验
伴随人工智能的发展,语音技术作为人机互动的重要接口也不断进行着功能的提升。在语音输入1.0时代,手机输入法只能简单地将声音识别转换为文字。但如今语音输入2.0时代,百度语音输入法结合手机用户语音,分析语气、语调、语意,判别用户输入意图,为之自动匹配想要的表情,弥补语音输入转换成文字过程中缺失的情感表达。比如说,和男友约定9点到公园见面却迟迟不见人影,语音输入“这都几点了?你怎么还没来”,百度语音输入法将自动识别你的愤怒情绪,匹配“生气”关键词类别下的相关表情,读懂你的内心想法。
事实上,百度语音输入法通过智能语音识别技术可以从三个维度来识别用户需求。首先是,当用户有明确表情检索意图,直接询问表情时,百度语音输入法通过语意分析依据指定关键词,为用户提供相关表情;其次是在用户无检索目的进行语音输入时,百度语音输入法通过内容识别关键词实现自动匹配,推荐聊天表情;此外,更值得一提地是,百度语音输入法还可以根据用户语音实时语境,通过分析用户语音上的语气、语调、语意判断相关情绪,实现相关表情匹配。
语音指令调出通讯录、电话拨打卡片实现快速通话
除语意识别自动匹配表情外,百度语音输入法还可在语音输入时直接下达指令,用户对着巨大的麦克风按钮,说出想要通话的联络人姓名或电话号码,即可进行号码查询及拨打电话的操作。例如当用户说出“给张洁打电话”几个字时,输入面板会弹出电话拨打卡片。或者当手机用户询问“你知道张洁电话吗?”时,百度语音输入法通过语意识别可以读懂手机用户的使用指令,帮助查询“张洁”的电话号码。语音输入不再仅仅输入文字,还可以智能唤起手机内的简易操作,简化手机操作流程。
以前的手机输入法产品在优化迭代的过程中更倾向于提高输入效率或准确率,但百度语音输入法出现在百度世界大会上后,我们似乎看到了另一种可能,那就是手机输入法也可以像百度度秘、苹果Siri等一样变身智能语音助手,为用户提供更多的快捷操作,甚至到未来将触达生活服务的方方面面。
在智能手机普及的大背景下,输入法技术也在日益更新,其中尤以语音输入最为突飞猛进。此次百度语音输入法在2016百度世界大会主论坛重大亮相,也充分体现语音识别的人工智能战略地位。接入人工智能语音识别技术的百度语音输入法,将从语音识别、语意分析等技术全方位满足用户需求。在今年,百度推出的新一代深度语音识别系统(DeepSpeech2),就被美国权威杂志《麻省理工评论》列为2016年十大突破技术之一,同时,百度语音识别准确率能达到97%的高水准。作为百度大脑四大功能之一的语音功能,在未来也将更多地体现在百度手机输入法中,深入做到更懂用户真实表达。