天天看点

pyspark之DataFrame操作大全

Spark SQL中的DataFrame类似于一张关系型数据表。在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现。

DataFrame().columns

from pyspark.sql import Row
df = sc.parallelize([ 
Row(name='Alice', age=5, height=80), 
Row
           

继续阅读