Dataset API 和 DataFrame API 进行了统一。在 Scala 中,DataFrame 变成了 Dataset[Row] 类型的一个别名,而 Java API 使用者必须将 DataFrame 替换成 Dataset<Row>。Dataset 类既提供了强类型转换操作(如 map,filter 以及 groupByKey)也提供了非强类型转换操作(如 select 和 groupBy)。由于编译期的类型安全不是 Python 和 R 语言的一个特性,Dataset 的概念并不适用于这些语言的 API。相反,DataFrame 仍然是最基本的编程抽象, 就类似于这些语言中单节点数据帧的概念。