个人项目:论文查重
gitHub地址
软件工程
作业要求
作业要求链接
作业目标
完成论文查重项目,进行测试并使用<code>Github</code>进行版本发布及源码和测试用例管理
Personal Software Process Stages
预估耗时(分钟)
实际耗时(分钟)
Planning
计划
· Estimate
· 估计这个任务需要多少时间
360
660
Development
开发
120
165
· Analysis
· 需求分析 (包括学习新技术)
· Design Spec
· 生成设计文档
10
15
· Design Review
· 设计复审
20
25
· Coding Standard
· 代码规范 (为目前的开发制定合适的规范)
30
35
· Design
· 具体设计
40
· Coding
· 具体编码
80
95
· Code Review
· 代码复审
· Test
· 测试(自我测试,修改代码,提交修改)
50
60
Reporting
报告
· Test Repor
· 测试报告
· Size Measurement
· 计算工作量
· Postmortem & Process Improvement Plan
· 事后总结, 并提出过程改进计划
· 合计
535
<code>simhash</code>算法实现类:

余弦相似度算法实现类:
Unit类
采用<code>simhash</code>算法来计算文本相似度,需要计算得到汉明距离
最后由公式
,将汉明距离带入x即可计算出文本相似度
内存、CPU、GC、线程情况
Live Memory
CPU Load
堆内存
代码
测试结果:
代码覆盖率
异常测试