天天看點

win7下 pyspark+pycharm的結合使用

個人使用python的時候喜歡用pycharm,安裝好spark後同樣也想在其中使用,這需要一些配置,希望對有同樣需求的人有所幫助

ps:由于配置時沒有馬上做記錄,中間有些過程忘了,可能會有其他問題,歡迎提出,看到盡快回複

(1)打開pycharm,打開設定選項

win7下 pyspark+pycharm的結合使用

 (2)輸入python console ,如下

win7下 pyspark+pycharm的結合使用
win7下 pyspark+pycharm的結合使用
win7下 pyspark+pycharm的結合使用

 (3)下面是一個測試代碼,統計詞頻的

from pyspark.context import SparkContext

sc = SparkContext("local", "WordCount")   #初始化配置
data = sc.textFile("a.txt")   #自己随便寫的一個txt

counts = data.flatMap(lambda line: line.split(" ")).map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b)
counts.saveAsTextFile('count_result') #結果就在count_result這個檔案夾裡面
      

繼續閱讀