前言：

有媒體報道北京魯迅博物館官網資料查詢線上檢索系統可以實作“魯迅說過的話，可以一鍵查詢”功能。聽說報道出來第二天，系統就被擠癱瘓了。當時就在想自己能不能也做一個簡單的查詢系統來玩玩。讓我們愉快地開始吧~

Python實用工具，fuzzywuzzy子產品，Python實作魯迅名言查詢系統

開發工具

Python版本：3.6.4

相關子產品：

PyQt5子產品；

python-Levenshtein子產品；

fuzzywuzzy子產品；

以及一些Python自帶的子產品。

環境搭建

安裝Python并添加到環境變量，pip安裝需要的相關子產品即可。

原理簡介

首先，下載下傳一份魯迅全集的.txt檔案：

然後用PyQt布局實作個簡單的GUI：

'''簡單的GUI'''
class GUI(QWidget):
  def __init__(self, parent=None):
    super().__init__()
    self.setWindowTitle('魯迅名言查詢-微信公衆号:Charles的皮卡丘')
    self.setWindowIcon(QIcon('data/icon.jpg'))
    self.label1 = QLabel('句子:')
    self.line_edit = QLineEdit()
    self.label2 = QLabel('查詢結果:')
    self.text = QTextEdit()
    self.button = QPushButton()
    self.button.setText('查詢')
    self.cmb = QComboBox()
    self.cmb.setStyle(QStyleFactory.create('Fusion'))
    self.cmb.addItem('比對度: 100%')
    self.cmb.addItem('比對度: 90%')
    self.cmb.addItem('比對度: 80%')
    self.cmb.addItem('比對度: 70%')
    self.grid = QGridLayout()
    self.grid.setSpacing(12)
    self.grid.addWidget(self.label1, 1, 0)
    self.grid.addWidget(self.line_edit, 1, 1, 1, 38)
    self.grid.addWidget(self.button, 1, 39)
    self.grid.addWidget(self.label2, 2, 0)
    self.grid.addWidget(self.text, 2, 1, 1, 40)
    self.grid.addWidget(self.cmb, 1, 40)
    self.setLayout(self.grid)
    self.resize(200, 400)
    self.button.clicked.connect(self.inquiry)
    self.paragraphs = self.loadData('data/book.txt')

大概長這個樣子：

那麼接下來，隻需要當使用者點選查詢按鈕時，根據使用者選擇的比對度下限，找到魯迅全集的book.txt檔案中的所有與待搜尋句子比對度大于該比對度下限的段落并在查詢結果框中顯示出來即可。

在這裡投機取巧偷個懶，直接當調包俠了，即這裡直接使用了python的fuzzywuzzy包。

fuzzywuzzy是一個可以對字元串進行模糊比對的小工具，使用起來非常簡單。

這裡我們直接調用它的partial_ratio方法來比對兩段話的相似度，并将相似度大于給定門檻值的所有段落顯示在結果框中。具體而言，代碼實作如下：

'''查詢'''
  def inquiry(self):
    sentence = self.line_edit.text()
    matched = []
    score_thresh = self.getScoreThresh()
    if not sentence:
      QMessageBox.warning(self, "Warning", '請先輸入需要查詢的魯迅名言')
    else:
      for p in self.paragraphs:
        score = fuzz.partial_ratio(p, sentence)
        if score >= score_thresh and len(sentence) <= len(p):
          matched.append([score, p])
      infos = []
      for match in matched:
        infos.append('[比對度]: %d\n[内容]: %s\n' % (match[0], match[1]))
      if not infos:
        infos.append('未比對到任何相似度大于%d的句子.\n' % score_thresh)
      self.text.setText('\n\n\n'.join(infos)[:-1])

文章到這裡就結束了，感謝你的觀看，關注我每天分享Python小工具系列，下篇文章不用聲霸卡讓電腦自己哼起歌

Python實用工具，fuzzywuzzy子產品，Python實作魯迅名言查詢系統

前言：

開發工具

環境搭建

原理簡介

繼續閱讀

HBuilder開發App Step1——環境搭建，HelloMUI 以及真機調試

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入