過去的一個周末,社交網絡Facebook因為使用者資料被第三方API濫用幫助美國大選的事情上了熱搜。直到現在,Facebook CEO小紮也沒有發出任何官方回應,以及未來該如何更好的保護私人資料。有人認為作為坐擁海量使用者資料的網站在獲得巨大收益的同時,理應預想到資料被濫用的可能并作出防範措施,在事情發生之後也應該更積極的面對而不是回避。也有人提出犯法的是第三方API, 原罪不在Facebook。
先把這件事情放一邊,可以确定的是Facebook擁有大量可供人們浏覽的資料,人們可以使用此資料做很多事情。今天我們來了解一下如何使用Facebook Graph API用Python進行資料抓取和分析。

Facebook擁有大量資料供您探索,您可以使用以下資料做很多事情:分析Facebook頁面或Facebook群組,将這些資料用于社交網絡分析(SNA),為數字營銷做資料分析, 甚至收集和儲存自己個人項目的資料。
這些視訊将向你展示如何做基本的分析,例如:
從Facebook下載下傳資料
從json轉換為更友善的資料結構
處理Graph API中的日期變量和其他資料
第1課:介紹和了解Graph API
在本視訊中,我将向您介紹GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例請求。
第2課:下載下傳并儲存Facebook資料
在本視訊中,我将向您展示如何從Facebook頁面或Facebook群組下載下傳并儲存所有資料,并記住某些要點。
第3課:設定和清理資料
在第三課中,我将使用notebook來清理和審計從Facebook獲得的資料,并為分析做好準備。
第4課:評論最多的文章
在第四課中,我将向您展示一種簡單的方式,以獲得評論最多的文章。
https://v.qq.com/x/page/s06098fb92o.html
第5課:點贊最多文章
在這個課程中發生了一些有趣的事情,因為我發現我可以使用API通路了一些已删除的文章。
https://v.qq.com/x/page/r0609s6vt80.html
第6課:計算詞頻
在這個視訊中,我将向您展示如何數一個組或一個頁面中的所有文章詞頻。
您也可以在評論中使用相同的功能。
https://v.qq.com/x/page/j0609g7vvhp.html
第7課:按關鍵字對文章進行分組
在這個視訊中,我會将在頁面中具有關鍵字“free”的文章進行分組,并計算有多少人擁有這個關鍵字,以及有多少人沒有這個關鍵字。
分組方式非常有用,我們将在未來的視訊中更頻繁地使用更多變量。
https://v.qq.com/x/page/f06099j7ats.html
第8課:按日期分組
在本視訊中,我們将探索“建立時間”變量,以按照年份,月份或星期幾對文章進行分組。
這可以用來查找釋出模式等等。
https://v.qq.com/x/page/e0609puvw9j.html
原文釋出時間為:2018-03-20
本文作者:文摘菌