天天看点

[Spark][Python][Application]非交互式运行Spark Application 的例子

非交互式运行Spark Application 的例子

$ cat Count.py

[Spark][Python][Application]非交互式运行Spark Application 的例子

import sys

from pyspark import SparkContext

if __name__ == "__main__":

sc = SparkContext()

logfile = sys.argv[1]

count = sc.textFile(logfile).filter(lambda line: '.jpg' in line).count()

print "JPG requests: ", count

sc.stop()

[Spark][Python][Application]非交互式运行Spark Application 的例子

$

$ spark-submit --master yarn-client Count.py /test/weblogs/*

Number of JPG requests: 10258

本文转自健哥的数据花园博客园博客,原文链接:http://www.cnblogs.com/gaojian/p/7749427.html,如需转载请自行联系原作者

继续阅读