天天看點

Python實用工具,fuzzywuzzy子產品,Python實作魯迅名言查詢系統

前言:

有媒體報道北京魯迅博物館官網資料查詢線上檢索系統可以實作“魯迅說過的話,可以一鍵查詢”功能。聽說報道出來第二天,系統就被擠癱瘓了。當時就在想自己能不能也做一個簡單的查詢系統來玩玩。讓我們愉快地開始吧~

Python實用工具,fuzzywuzzy子產品,Python實作魯迅名言查詢系統

開發工具

Python版本:3.6.4

相關子產品:

PyQt5子產品;

python-Levenshtein子產品;

fuzzywuzzy子產品;

以及一些Python自帶的子產品。

環境搭建

安裝Python并添加到環境變量,pip安裝需要的相關子產品即可。

原理簡介

首先,下載下傳一份魯迅全集的.txt檔案:

Python實用工具,fuzzywuzzy子產品,Python實作魯迅名言查詢系統

然後用PyQt布局實作個簡單的GUI:

'''簡單的GUI'''
class GUI(QWidget):
  def __init__(self, parent=None):
    super().__init__()
    self.setWindowTitle('魯迅名言查詢-微信公衆号:Charles的皮卡丘')
    self.setWindowIcon(QIcon('data/icon.jpg'))
    self.label1 = QLabel('句子:')
    self.line_edit = QLineEdit()
    self.label2 = QLabel('查詢結果:')
    self.text = QTextEdit()
    self.button = QPushButton()
    self.button.setText('查詢')
    self.cmb = QComboBox()
    self.cmb.setStyle(QStyleFactory.create('Fusion'))
    self.cmb.addItem('比對度: 100%')
    self.cmb.addItem('比對度: 90%')
    self.cmb.addItem('比對度: 80%')
    self.cmb.addItem('比對度: 70%')
    self.grid = QGridLayout()
    self.grid.setSpacing(12)
    self.grid.addWidget(self.label1, 1, 0)
    self.grid.addWidget(self.line_edit, 1, 1, 1, 38)
    self.grid.addWidget(self.button, 1, 39)
    self.grid.addWidget(self.label2, 2, 0)
    self.grid.addWidget(self.text, 2, 1, 1, 40)
    self.grid.addWidget(self.cmb, 1, 40)
    self.setLayout(self.grid)
    self.resize(200, 400)
    self.button.clicked.connect(self.inquiry)
    self.paragraphs = self.loadData('data/book.txt')
           

大概長這個樣子:

Python實用工具,fuzzywuzzy子產品,Python實作魯迅名言查詢系統

那麼接下來,隻需要當使用者點選查詢按鈕時,根據使用者選擇的比對度下限,找到魯迅全集的book.txt檔案中的所有與待搜尋句子比對度大于該比對度下限的段落并在查詢結果框中顯示出來即可。

在這裡投機取巧偷個懶,直接當調包俠了,即這裡直接使用了python的fuzzywuzzy包。

fuzzywuzzy是一個可以對字元串進行模糊比對的小工具,使用起來非常簡單。

這裡我們直接調用它的partial_ratio方法來比對兩段話的相似度,并将相似度大于給定門檻值的所有段落顯示在結果框中。具體而言,代碼實作如下:

'''查詢'''
  def inquiry(self):
    sentence = self.line_edit.text()
    matched = []
    score_thresh = self.getScoreThresh()
    if not sentence:
      QMessageBox.warning(self, "Warning", '請先輸入需要查詢的魯迅名言')
    else:
      for p in self.paragraphs:
        score = fuzz.partial_ratio(p, sentence)
        if score >= score_thresh and len(sentence) <= len(p):
          matched.append([score, p])
      infos = []
      for match in matched:
        infos.append('[比對度]: %d\n[内容]: %s\n' % (match[0], match[1]))
      if not infos:
        infos.append('未比對到任何相似度大于%d的句子.\n' % score_thresh)
      self.text.setText('\n\n\n'.join(infos)[:-1])
           

文章到這裡就結束了,感謝你的觀看,關注我每天分享Python小工具系列,下篇文章不用聲霸卡讓電腦自己哼起歌

繼續閱讀