Spark SQL中的DataFrame类似于一张关系型数据表。在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现。
DataFrame().columns
from pyspark.sql import Row
df = sc.parallelize([
Row(name='Alice', age=5, height=80),
Row
Spark SQL中的DataFrame类似于一张关系型数据表。在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现。
from pyspark.sql import Row
df = sc.parallelize([
Row(name='Alice', age=5, height=80),
Row