在最简单的方式下,默认的数据源(parquet
除非另外配置通过spark.sql.sources.default)将会用于所有的操作。
val usersDF = spark.read.load("examples/src/main/resources/users.parquet") usersDF.select("name", "favorite_color").write.save("namesAndFavColors.parquet")
完整的示例代码在 "examples/src/main/scala/org/apache/spark/examples/sql/SQLDataSourceExample.scala"。