1 研究目标
從應用場景來看,基于内容的推薦算法更多地适用于使用者根據關鍵字或者電影名字來搜尋相應的電影,然後推薦系統來進行相應的推薦。
基于需求個性角度來看,基于内容的推薦算法還不夠個人化,使用者需要的是更加符合個人偏好的推薦結果,可以根據使用者之前的打分情況,更有針對性地推薦一些可能喜歡的電影,這種情況下,應用最多的就是協同過濾算法。
本設計着重讨論基于協同過濾算法的電影推薦系統設計。
2 技術要求
(1) 熟悉并掌握爬蟲的基本原理。研究内容包括:Scrapy 爬蟲架構。
(2) 熟悉并掌握JavaWeb的各種開發工具與架構。研究内容包括:IntelliJ IDEA + Maven + Git + Linux + MySQL + MyBatis + Spring + Spring MVC + EasyUI。
(3) 熟悉并掌握Spark及機器學習庫。研究内容包括:Spark 基本原理,協同過濾算法,MLlib機器學習算法庫。
(4) 設計Web 軟體,模拟協同過濾算法下的電影推薦。
3 研究難點
(1) 對協同過濾算法的深入學習和掌握;
(2) 通過Spark程式的設計來實作電影的實時推薦。