亚马逊Alexa的
我建立使用AWS Lambda和一的NodeJS Alexa的技能。我有两个问题:
1)是否有可能对我来说,检索扬声器的完整记录?
在我的Alexa的手机应用程序,我能准确读什么跟我谈过,但我想收集这些数据,所以我可以有可能分析人们是如何说我的技能。
这是可能的语音到文本的工具,如谷歌语音的API(demo here,spec here),用之类的东西recognition.onresult()
:
recognition.onresult = function(event) {
var interim_transcript = '';
for (var i = event.resultIndex; i < event.results.length; ++i) {
if (event.results[i].isFinal) {
final_transcript += event.results[i][0].transcript;
在我的Alexa的应用程序,你可以在这里看到它拍摄的时候我问:“唱生日快乐”:
我怎样才能捕捉编程这个?我想,当一个用户请求,我都没有想到的事情就知道了,收集这些故障和普通的语音请求,并提高基于它的技能。
2)的Alexa是否支持多种声音和多国语言(输入和输出)?
再次,看谷歌语音的API,你可以看到它允许许多修改,以语音输入和语音输出,多国语言,甚至语速:
var utterance = new SpeechSynthesisUtterance();
utterance.rate = 0.7;
utterance.lang = "zh-CN";
是否Alexa的提供此套件的控制?
回答如下:问题1:
不是现在。按照request syntax,音频剪辑不提供给你的服务端点。另外,如果你提供的硬件,并利用Alexa的语音服务,那么你会捕捉音频。
问题2:
不是现在。 Alexa的似乎只支持English