|
|
呃,这个好像是常规需求啊,腾讯云都支持吧。
不知道你的需求具体是啥,如果是在一堆固定发音人中识别,腾讯云貌似自己有接口 https://cloud.tencent.com/document/product/1093/94481
如果是对话中区分不同的说话人,腾讯云的接口也有 说话人分离参数 SpeakerDiarization 和 SpeakerNumber
https://cloud.tencent.com/document/product/1093/37823
当然,效果如何就要自己测试了… |
|