`
passionke
  • 浏览: 20670 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

利用h5做语音识别

 
阅读更多
 
 
把zip包解压到某一个路径。 比如我这边是 /Users/passionke/study/SpeechRecognition
 
然后 在命令行下切换到这个路径
 
cd /Users/passionke/study/SpeechRecognition
 
在这个路径下执行
 
python -m SimpleHTTPServer 8090
 
这样就可以在网页上打开
 
 


 
在网页上最好使用F12 打开console面板,
  • 大小: 262.2 KB
分享到:
评论
4 楼 passionke 2015-10-21  
客户端(web端)语言javascript, 功能: 启动识别, 获取识别结果,将识别结果发回给服务器端

chrome浏览器的语音识别功能,通过js控制浏览器开启语音识别的声音监听,当语音识别有结果的时候,将声音文件名以及结果发送回服务器。

当网页被打开时,获取网页中带的文件名参数并立即开始声音识别监听

服务器端(server端) 语言 nodejs, 功能: 提供https的服务,接受前端发回的文件名与识别结果,并记录在文件中

server端使用nodejs + express 搭建起https服务

使用https服务是为了避免浏览器弹出窗口受援语音权限给浏览器

控制端 语言 python, 功能。 列出当前文件夹下wma文件列表,打开本地连接,链接上带上文件名, 声音播放, 延迟30s并执行上一步过程

打开本地链接使用python自带的webbrowser模块,

声音播放使用mp3play 的模块

本地电脑

开启立体混音模式,将电脑播放的声音混音到立体混音通道。 禁用立体混音的输出。(避免出现无限回声) 浏览器识别的时候,需要首先设置音频输入为 立体混音。
3 楼 amy265 2015-10-12  
https://www.google.com.hk/#safe=strict&q=%E4%B8%80%E5%B9%B4%E8%87%B32015%E5%B9%B410%E6%9C%8810%E5%8F%B7%E4%B8%8B%E5%8D%88%E4%B8%A4%E7%82%B9
2 楼 amy265 2015-10-12  
https://localhost/sppech/index.html?filename=D:\chenlin\python\1012\SpeechRecognition\SpeechRecognition\wma\data.wma
1 楼 passionke 2015-10-12  
https://localhost/sppech/index.html?filename=D:\chenlin\python\1012\SpeechRecognition\SpeechRecognition\wma\data.wma

相关推荐

Global site tag (gtag.js) - Google Analytics