Google语音识别API结果为空
我正在执行对Google Cloud Speech API的asynchronous请求,而且我不知道如何获取操作结果:
请求POST: https ://speech.googleapis.com/v1beta1/speech: asyncrecognize
身体:
{ "config":{ "languageCode" : "pt-BR", "encoding" : "LINEAR16", "sampleRate" : 16000 }, "audio":{ "uri":"gs://bucket/audio.flac" } }
哪个返回:
{ "name": "469432517" }
所以,我做了一个POST: https : //speech.googleapis.com/v1beta1/operations/469432517
哪个返回:
{ "name": "469432517", "metadata": { "@type": "type.googleapis.com/google.cloud.speech.v1beta1.AsyncRecognizeMetadata", "progressPercent": 100, "startTime": "2016-08-11T21:18:29.985053Z", "lastUpdateTime": "2016-08-11T21:18:31.888412Z" }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.speech.v1beta1.AsyncRecognizeResponse" } }
我需要得到操作的结果:转录的文本。
我怎样才能做到这一点?
你已经得到了操作的结果,它是空的。 空结果的原因是格式不匹配。 你应该已经提交了“LINEAR16”文件(PCM未压缩数据,基本上是WAV文件),并且你尝试提交FLAC(压缩格式)。
其他原因可能是采样率不正确,通道数不正确等。
最后,纯沉默的文件将导致空的响应。