天天看点

Kibana(七):如何在地址中查询中文关键字

对于轻量级搜索,具有简单快捷且能跨索引的优点,并且特别适用于数据调试与诊断,以Kibana中的调试工具(Dev Tools)为例,如下:

即可轻松获取到在tweet类型中tweet字段包含yiifaa 单词的所有文档。

URL地址的方式对于ASCII码一般不存在什么问题,但如果是中文,怎么办?如我要查询到在tweet类型中 tweet字段包含“蚁蚄” 单词的所有文档,直接以下面的写法,毫无疑问将检索不到任何数据:

解决办法是将中文采用Unicode转义,将蚁蚄转义为“\u8681\u8684”,现在查询语句如下:

GET /_all/tweet/_search?q=tweet:\u8681\u8684
           

需要注意的是,以上执行语句只能在Kibana的调试工具(Dev Tools)里才能执行成功,如果要采用curl工具,那么还需要进行一次URL编码,如下:

# 千万不要把q后面的=转义为%2d,否则es无法识别参数
curl -XGET http://localhost://_all/tweet/_search?q=name%a%e7%e%b
           

再强调一次,URL转义只能针对“q=”之后的字符,否则一定会出现以下错误:

{"error":{"root_cause":[{"type":"illegal_argument_exception","reason":"request [/_search] contains unrecognized parameter: [q=tweet:蚁蚄]"}],"type":"illegal_argument_exception","reason":"request [/_search] contains unrecognized parameter: [q=tweet:蚁蚄]"},"status":}
           

另外,推荐一个在线字符转义的网址。

结论

查询字符串具有简洁高效的特点,对于通过命令做一次性查询,或者是在开发阶段,都非常方便,但因为URL编码的原因,让字符串理解起来较为晦涩,但利用字符转义工具,可以降低这种困难。

继续阅读