利用h5做语音识别 -

passionke

浏览: 20670 次
性别:
来自: 杭州

最近访客更多访客>>

夜疯狂

haoningabc

wiresharkdouble

jianganglu

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

利用h5做语音识别

博客分类：

H5
speech recognition

把zip包解压到某一个路径。比如我这边是 /Users/passionke/study/SpeechRecognition

然后在命令行下切换到这个路径

cd /Users/passionke/study/SpeechRecognition

在这个路径下执行

python -m SimpleHTTPServer 8090

这样就可以在网页上打开

http://localhost:8090/

在网页上最好使用F12 打开console面板，

SpeechRecognition.zip (34.2 KB)
下载次数: 47

SpeechRecognition.part01.rar (10 MB)
下载次数: 28

SpeechRecognition.part02.rar (10 MB)
下载次数: 25

SpeechRecognition.part03.rar (7.8 MB)
下载次数: 27

SpeechRecognition.rar (689.7 KB)
下载次数: 25

flow.zip (430 Bytes)
下载次数: 21

speech-input.zip (642 Bytes)
下载次数: 21

查看图片附件

分享到：

胖总的自助餐 | python 小应用

2015-10-10 11:17
浏览 9725
评论(4)
分类:Web前端
查看更多

4 楼 passionke 2015-10-21

客户端（web端）语言javascript，功能：启动识别，获取识别结果，将识别结果发回给服务器端

chrome浏览器的语音识别功能，通过js控制浏览器开启语音识别的声音监听，当语音识别有结果的时候，将声音文件名以及结果发送回服务器。

当网页被打开时，获取网页中带的文件名参数并立即开始声音识别监听

服务器端（server端）语言 nodejs，功能：提供https的服务，接受前端发回的文件名与识别结果，并记录在文件中

server端使用nodejs + express 搭建起https服务

使用https服务是为了避免浏览器弹出窗口受援语音权限给浏览器

控制端语言 python，功能。列出当前文件夹下wma文件列表，打开本地连接，链接上带上文件名，声音播放，延迟30s并执行上一步过程

打开本地链接使用python自带的webbrowser模块，

声音播放使用mp3play 的模块

本地电脑

开启立体混音模式，将电脑播放的声音混音到立体混音通道。禁用立体混音的输出。（避免出现无限回声）浏览器识别的时候，需要首先设置音频输入为立体混音。

3 楼 amy265 2015-10-12

https://www.google.com.hk/#safe=strict&q=%E4%B8%80%E5%B9%B4%E8%87%B32015%E5%B9%B410%E6%9C%8810%E5%8F%B7%E4%B8%8B%E5%8D%88%E4%B8%A4%E7%82%B9

2 楼 amy265 2015-10-12

https://localhost/sppech/index.html?filename=D:\chenlin\python\1012\SpeechRecognition\SpeechRecognition\wma\data.wma

1 楼 passionke 2015-10-12

https://localhost/sppech/index.html?filename=D:\chenlin\python\1012\SpeechRecognition\SpeechRecognition\wma\data.wma

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

利用h5做语音识别

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

利用h5做语音识别

评论

发表评论

相关推荐

最近访客更多访客>>