Siri运作原理:本地识别语音 云服务分析内容
来源:广州中睿信息技术有限公司官网
发布时间:2012/10/21 23:25:16 编辑:admin 阅读 578
11月4日消息,据ZDNet报道,&ldquo语音识别&rdquo是iPhone4S中语音助理服务Siri的核心,但这并未解释Siri理解用户所说内容的详细过程。Siri的工作原理是什么?本周有业内

  11月4日消息,据 ZDNet 报道,“语音识别”是 iPhone 4S 中语音助理服务 Siri 的核心,但这并未解释 Siri 理解用户所说内容的详细过程。Siri 的工作原理是什么?本周有业内人士撰文,解释了 Siri 的工作步骤。

  当用户对 iPhone 4S 说话后,语音被立即转换成编码,变成一个压缩的数字文件,文件中包含着所有有用的信息。这些信息将通过互联网服务提供商(ISP)的网络传送至云计算服务器,而服务器中的模块将识别用户所说的内容。

  与此同时,用户的语音将在手机端被识别。安装在手机中的语音识别器将与云计算服务器通信,了解指令是否适合在本地被处理。用户的指令可能要求手机播放一首歌曲,而另一些指令则有可能需要手机连接至网络,寻求进一步的帮助。如果语音识别器认为,手机内部模块足以处理用户的指令,那么将会告知云计算服务器,不再需要服务器的支持。

  根据用户的声调和语序,服务器将对语音进行静态对比,了解语音中包含哪些字母。与此同时,本地的语音识别器也将对用户语音进行静态对比。在服务器端和手机端,可能性最高的识别内容将优先获得处理。

  此时,识别出的内容已经包含一系列的元音和辅音字母。随后这些内容将被发送至一个语言模块,以评估用户的语音中包含哪些单词。根据不同的可信度,计算机将创建一个用户所说内容的列表。

  如果判断结果具有足够的可信度,那么计算机将能理解用户所说的内容,例如发送短信或查找联系人列表中的联系人。随后用户将会看到手机屏幕上出现所需的内容,而不必手动操作。在这一过程中,如果用户的语音含义过于模糊,那么计算机将会询问用户,例如用户希望查找的联系人是埃里克·奥尔森(Erica Olssen)还是埃里克·施密特(Erica Schmidt)。

联系我们CONTACT 扫一扫
愿景:成为最专业的软件研发服务领航者
中睿信息技术有限公司 广州•深圳 Tel:020-38931912 务实 Pragmatic
广州:广州市天河区翰景路1号金星大厦18层中睿信息 Fax:020-38931912 专业 Professional
深圳:深圳市福田区车公庙有色金属大厦509~510 Tel:0755-25855012 诚信 Integrity
所有权声明:PMI, PMP, Project Management Professional, PMI-ACP, PMI-PBA和PMBOK是项目管理协会(Project Management Institute, Inc.)的注册标志。
版权所有:广州中睿信息技术有限公司 粤ICP备13082838号-2