Alexa Auto SDK 的 Alexa 模块序列图
以下序列图说明了 Alexa Auto SDK 中使用的两个基本流程。
目录
- 点击通话时序图
- 唤醒词启用序列图
点击通话时序图
此序列图说明了通过汽车点击通话流程访问 Alexa 所遵循的初始序列。驾驶员通过按下车内的语音按钮启动操作。
一旦司机按下语音按钮,Alexa 就会进入聆听状态,准备好进行语音输入、处理和播放。
此图包含 Alexa Auto SDK 中使用的方法和函数的实际名称和语法。
注意:点击通话可用于 PCM 和 OPUS 音频格式。
提示:点击通话可用于从外部服务启动语音识别,例如外部唤醒词引擎、物理语音命令按钮和车载语音信息娱乐 (IVI) 系统的屏幕按钮。
点按通话流程摘要
- 司机按下车内的语音按钮。这种特定的人类行为使 Alexa 进入聆听状态。驾驶员应该有一个视觉指示,表明 Alexa 现在已准备好进行音频输入。
- 汽车的麦克风现在正在主动接收语音输入并准备音频缓冲区以发送到 Alexa Auto SDK Engine。Alexa Auto SDK Engine 音频输入函数会循环,直到返回指示音频输入已完成的指令。
- 主机屏幕上应显示视觉指示,指示 Alexa 处于思考状态。在这种状态下,Alexa 正在处理输入缓冲区并创建适当的响应类型。在这个例子中,Alexa 正在创建一个音频输出文件,该文件被发送到汽车主机播放。
唤醒词启用序列图
此序列图说明了在启用唤醒词的情况下访问 Alexa 所遵循的初始序列。驾驶员通过说出 Alexa 唤醒词来启动操作。
此图包含 Alexa Auto SDK 中使用的方法和函数的实际名称和语法。
注意:WWE 只能用于 PCM 音频格式。
启用唤醒词的流程摘要
-
startAudioInput()
在启用唤醒词检测时调用。如果默认情况下启用唤醒词,或者当应用程序显式调用引擎启动时,就会发生这种情况enabledWakewordDetection()
。发生这种情况时,应用程序必须开始从麦克风向引擎发送音频样本。 - 唤醒词引擎在本地处理音频,直到检测到唤醒词。一旦检测到唤醒词,引擎就会通知应用程序对话状态已更改为“侦听”并启动与 Alexa 的识别事件。
- 在收听状态下,音频数据被发送到 Alexa,直到检测到语音结束。一旦检测到语音结束,Alexa 就会向引擎发送
StopCapture
指令,对话状态将更改为“正在思考”。然后 Alexa 以额外的指令响应语音请求。 - 应用程序应继续向引擎发送音频,直到收到为止
stopAudioInput()
。启用唤醒词时,会在引擎停止或应用程序明确禁用唤醒词检测时发生这种情况。