個人項目:論文查重
gitHub位址
軟體工程
作業要求
作業要求連結
作業目标
完成論文查重項目,進行測試并使用<code>Github</code>進行版本釋出及源碼和測試用例管理
Personal Software Process Stages
預估耗時(分鐘)
實際耗時(分鐘)
Planning
計劃
· Estimate
· 估計這個任務需要多少時間
360
660
Development
開發
120
165
· Analysis
· 需求分析 (包括學習新技術)
· Design Spec
· 生成設計文檔
10
15
· Design Review
· 設計複審
20
25
· Coding Standard
· 代碼規範 (為目前的開發制定合适的規範)
30
35
· Design
· 具體設計
40
· Coding
· 具體編碼
80
95
· Code Review
· 代碼複審
· Test
· 測試(自我測試,修改代碼,送出修改)
50
60
Reporting
報告
· Test Repor
· 測試報告
· Size Measurement
· 計算工作量
· Postmortem & Process Improvement Plan
· 事後總結, 并提出過程改進計劃
· 合計
535
<code>simhash</code>算法實作類:

餘弦相似度算法實作類:
Unit類
采用<code>simhash</code>算法來計算文本相似度,需要計算得到漢明距離
最後由公式
,将漢明距離帶入x即可計算出文本相似度
記憶體、CPU、GC、線程情況
Live Memory
CPU Load
堆記憶體
代碼
測試結果:
代碼覆寫率
異常測試