天天看點

論文戰略

最近論文實驗進行的非常的不順利,一方面是實驗聚類的效果十分的差,另一方面是做大資料的實驗對計算機的性能要求很高,非常的耗費記憶體,每當矩陣的次元大于3000的時候,整個計算機就像中了魔法似的,像蝸牛一樣慢。這樣用小資料做實驗效果非常的差,用大資料做實驗計算機又跑不動,搞的自己很愚昧,不知道是自己資料集的問題,還是聚類算法的問題。

通過讀論文,做實驗,讓自己學會了堅忍,深刻地了解了用機器學習處理大規模資料所帶來的挑戰,以及明白了無論做什麼事情都要上心。

普盧塔克說,薩特斯為了告訴他的士兵堅忍和智慧比蠻力更重要的道理,把兩匹馬帶到他們面前,然後讓兩個人拔光馬的尾毛。一個人是魁梧的大力士,他抓住尾巴拔了又拔,但一點效果也沒有;另一個人是一個精明的、長相狡黠的裁縫,他微笑着,每次拔掉一根毛,很快就把尾巴把得光秃秃的。

當然,這個故事每個人都有自己的了解。我自己學到的是裁縫的心态,面對困難的事情,能夠認準目标,耐住性子,一步一步往前走。不怕慢,隻怕站,以及欲速則不達的道理。

面對實驗的挑戰,自己精疲力盡。也許是自己實驗的方法有問題,思路錯了,現在最需要的就是靜下心來,回顧自己以前讀過的論文,再看一些新的論文,整理一下思路,重新出發。如果實在不行,那麼開始學習叢集,多線程,分布式和并行計算,搭建一個Hadoop叢集進行實驗。山不轉水轉,無論怎樣,實驗還是要做的,論文還是要發的。

從現在開始,自己對待論文的态度也要轉變,以前自己認為論文不屑一顧,純粹是在浪費時間,并且毫無價值可言。其實,整個生活就像一面鏡子,你是什麼樣子的,你看到的就是什麼樣子的。科學隻不過是經過整理群組織的常識而已。隻有經過實踐,然後整理自己的思想,最後以論文的形式展現出來,自己的思想才能夠為更多的人所熟知,才能夠為後來的人所繼承,自己的思想才能夠得到延續,因為寫在沙地上的論文,是得不到延續的,即使再有價值,一陣微風吹過,一切美好将不再存在。

關于論文的形式與内容,也是仁者見仁,智者見智。總之,形式與内容相輔相成,一切的形式都是為内容服務的。寫論文可以用Word,當然最好還是用LaTeX。要踏實,要認真,要純粹,要簡單。

既然決定發表論文,那麼就要發表高品質的論文,而不是垃圾,這樣至少能夠對得起自己的付出,不要因為走的太遠,而忘記了當初我們為什麼出發。

“我常常說,當你對所講的内容能夠進行度量并能夠用數字來表達的時候,證明你對這些内容是有所了解的。如果你不能用數字來表達,表明你的認識是不完整的,也是無法令人滿意的:無論它是什麼東西,它也許正處于知識的初級階段,但在你的思想中,幾乎從沒把它上升到一個科學的高度。”

我對這句話是深有感觸的,隻有把現實世界,經過數學模組化之後,才能夠存儲到計算機世界的,然後才能進行操作以及其它的什麼事情。總之,數學的重要性是不言而喻的。

從現在開始,自己一邊做實驗,一邊讀論文以及相關的書籍(自己的方向是基于社交網絡的推薦算法),如下所示:

《Recommender Systems Handbook》

《Recommender Systems for Social Tagging Systems》

《推薦系統》

《推薦系統實戰》

《網絡科學:原理與應用》

《社會計算:社群發現和社會媒體挖掘》

《數學分析》

《線性代數》

《機率論》

《統計學》

《随機過程》

《離散數學》

《組合數學》

《具體數學》

無論怎樣,不得不面對的一個問題就是工作的問題,相信自己一定能夠處理好論文與工作之間的關系,魚和熊掌可以兼得。具體規劃如下所示:

1、上午

數學和經典算法;英語(小資料分析)

2、下午

讀論文;做實驗(論文戰略)

3、晚上

資料算法;英語(大資料分析)

總之,工具上精通Java、Python,SPSS和MySQL。理論上,重點學習社交網絡,推薦系統,資料挖掘和機器學習。郁悶的心情隻能在前行中得到緩解,排除一切幹擾,一直往前走,所有的問題都必将迎刃而解。至少相信上帝是公平的,相信上帝是不會抛棄任何一個肯努力的孩子的,精誠所至,金石為開。部落格容易,論文不易,且寫且行。