天天看點

個人項目-論文查重

個人項目:論文查重

gitHub位址

軟體工程

作業要求

作業要求連結

作業目标

完成論文查重項目,進行測試并使用<code>Github</code>進行版本釋出及源碼和測試用例管理

Personal Software Process Stages

預估耗時(分鐘)

實際耗時(分鐘)

Planning

計劃

· Estimate

· 估計這個任務需要多少時間

360

660

Development

開發

120

165

· Analysis

· 需求分析 (包括學習新技術)

· Design Spec

· 生成設計文檔

10

15

· Design Review

· 設計複審

20

25

· Coding Standard

· 代碼規範 (為目前的開發制定合适的規範)

30

35

· Design

· 具體設計

40

· Coding

· 具體編碼

80

95

· Code Review

· 代碼複審

· Test

· 測試(自我測試,修改代碼,送出修改)

50

60

Reporting

報告

· Test Repor

· 測試報告

· Size Measurement

· 計算工作量

· Postmortem &amp; Process Improvement Plan

· 事後總結, 并提出過程改進計劃

· 合計

535

<code>simhash</code>算法實作類:

個人項目-論文查重

餘弦相似度算法實作類:

個人項目-論文查重

Unit類

個人項目-論文查重

采用<code>simhash</code>算法來計算文本相似度,需要計算得到漢明距離

個人項目-論文查重

最後由公式

個人項目-論文查重

,将漢明距離帶入x即可計算出文本相似度

個人項目-論文查重

記憶體、CPU、GC、線程情況

個人項目-論文查重

Live Memory

個人項目-論文查重

CPU Load

個人項目-論文查重

堆記憶體

個人項目-論文查重

代碼

個人項目-論文查重
個人項目-論文查重

測試結果:

個人項目-論文查重
個人項目-論文查重

代碼覆寫率

個人項目-論文查重
個人項目-論文查重

異常測試

個人項目-論文查重
個人項目-論文查重