语音可扩展标记语言

语音可扩展标记语言(英语:Voice Extensible Markup Language,简称VoiceXMLVXML)是于交互式语音回应应用程序建立音频对话的标准,用于开发音频及声音回应应用程序,例如银行系统及自动客户服务。来自网页服务器超文本标记语言(HTML)被网页浏览器接收后,网页浏览器能对其进行解析并视觉呈现出来,VoiceXML应用程序的开发及部署也类似这方式。VoiceXML文档由语音浏览器英语Voice browser解析。于一般的部署架构之下,用户通常经由公共交换电话网(PSTN)跟语音浏览器交互。VoiceXML文档以XML为基础,是由万维网联盟(W3C)开发的标准。

用法 编辑

VoiceXML应用程序于各行业及商业领域广泛使用,包括订单查询、包裹追踪、驾驶方向、紧急通知、唤醒、航班跟踪、语音访问电子邮件、客户关系管理、还按原方抓药、音频新闻杂志、语音拨号、房地产信息和国家目录援助英语Directory assistance等。 VoiceXML的标签能指示语音浏览器英语Voice browser提供语音合成、自动语音识别、对话管理和音频播放。下面是一个VoiceXML文档的例子:

<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml">
  <form>
    <block>
      <prompt>
        Hello world!
      </prompt>
    </block>
  </form>
</vxml>

当一个VoiceXML解析器解析该文档时,“Hello world”字句将以语音合成方式读出。

通常情况下,HTTP被用作获取VoiceXML页面的发送协议。一些应用程序可能使用静态的VoiceXML页面,而依靠动态的VoiceXML作页面生成的应用程序则需使用应用程序服务器,例如TomcatWebLogicIISWebSphere英语IBM WebSphere

从历史上看,VoiceXML的平台供应商以各种不同方式执行其标准,并添加专有产品特点。但是,VoiceXML 2.0标准于2004年3月16日被采纳为W3C推荐标准,阐明了大部分的差异之处。VoiceXML论坛为推广标准用途的产业群,它提供了一个一致性测试英语Conformance testing过程,以证明供应商的执行方式的一致性。

历史 编辑

为了开发一个用于语音对话的标准标记语言,美国电话电报公司IBM朗讯科技摩托罗拉于1999年3月构成了VoiceXML论坛。同年9月,他们于论坛开放会员留言功能,并于2000年3月发布了VoiceXML 1.0。不久后,他们把标准的控制权移交至W3C[1]其后W3C生产了数个中间版本,并于2004年3月生产了最终推荐阶段的VoiceXML 2.0。[2]

基于VoiceXML 2.0的反馈,VoiceXML 2.1页面存档备份,存于互联网档案馆)的新增功能相对较少。VoiceXML 2.1能向下兼容VoiceXML 2.0,并于2007年6月达致W3C推荐阶段。[3]

将来发展 编辑

VoiceXML 3.0页面存档备份,存于互联网档案馆)将会是VoiceXML的下一个主要发行版,包含新的主要特点。它包含一个新的XML状态图描述语言,名为SCXML英语SCXML

参考文献 编辑

  1. ^ Introduction. VoiceXML Forum. 2007-11-04 [2015-04-24]. (原始内容存档于2015-07-04) (英语).  |year=|date=不匹配 (帮助)
  2. ^ W3C recommends VoiceXML 2.0. InfoWorld, Ephraim Schwartz. 2004-03-17 [2015-04-24]. (原始内容存档于2017-06-27) (英语). 
  3. ^ Voice Extensible Markup Language (VoiceXML) 2.1. World Wide Web Consortium (W3C). [2015-04-24]. (原始内容存档于2021-05-07) (英语). 

外部链接 编辑

参见 编辑