微信公众平台开发(75) 语音识别

2014-01-03 23:50:00

本文介绍如何使用微信公众平台高级接口中的语音识别功能，做出一个语音版的天气预报查询功能。根据这个模型，你可以扩展到所有的语音查询。

一、接收语音识别结果

开通语音识别功能以后，用户每次发送语音给公众号时，微信会在推送的语音消息XML数据包中，增加一个Recongnition字段。该字段为语音识别出的文本内容。

用户发送语音：

语音XML数据包如下

参数说明：

参数

描述

ToUserName

接收方微信号

FromUserName

发送方帐号（一个OpenID）

CreateTime

消息创建时间（整型）

MsgType

语音为voice

MediaID

语音消息媒体id，可以调用多媒体文件下载接口拉取该媒体

Format

语音格式：amr

Recognition

语音识别结果，UTF8编码

MsgID

消息id，64位整型

二、中文分词

中文分词 (Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道，在英文的行文中，单词之间是以空格作为自然分界符的，而中文只是字、句和段能通过明显的分界符来简单划界，唯独词没有一个形式上的分界符，虽然英文也同样存在短语的划分问题，不过在词这一层上，中文比之英文要复杂的多、困难的多。通过分词可以提取其中关键词语进行搜索。

打个比方：“深圳天气怎么样”，这句话中可分词为“深圳”，“天气”，“怎么样”三个词。其中“天气”为名词，“深圳”为地点名词。

以下是SAE上的分词代码示例：

结果如下：

得到，名词天气，和地名名词深圳，副词怎么样可以忽略。

三、程序实现

判断是否开启语音识别

效果如下：

调用SAE分词

返回结果如下：

这样就获知晓了用户要查询的功能是天气，城市名称是长沙。

功能查询

根据获得的功能类别及关键字，我们可以查询相应的城市天气预报。

四、效果演示

微信公众平台开发(75) 语音识别

继续阅读

2021-08-08 mysql索引

【Python学习笔记】- Day6

Windows版本的Google word2vec和Stanford GloVe工具

seq2sqe与attenton实现聊天机器人

奋战聊天机器人（四）自然语言处理中的文本分类nltk中的贝叶斯分类器

从词向量衡量标准到全局向量的词嵌入模型GloVe再到一词多义的解决方式衡量标准Evaluation引子全局向量的词嵌入应用对一词多义的思考Reference

GloVe与word2vec的区别，及GloVe的缺陷

统计学习大作业-BERT模型1 文本处理-BERT模型2 参考资料：

SQLServer 提升查询速度

详解SQL中几种常用的表连接方式

oracle 中不使用已有的索引解决办法

anaconda中科大镜像

对first_name创建唯一索引uniq_idx_firstname问题描述Sql语句

NLP从入门到放弃_IBM Model1IBM Model1

记一次因MySQL编码问题导致的慢查询排查

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合