怎么能将所有这些整合在一起对我们来说真是太神奇了。 现在,您将看到一些`NaN`值,它们代表**而不是数字**,以及熊猫如何指示缺失值。 因此,这种解释的方式是,例如`user_id`数字`1`没看电影`1-900 (1994)`,但是`user_id`数字`1`却看了`101 Dalmatians (1996)`并将它评为`2`星。 `user_id`数字`1`也观看了`12 Angry Men (1957)`并将其评为`5`星,但没有观看电影`2 Days in the Valley (1996)`,例如,好吗? 因此,我们最终得到的基本上是一个稀疏矩阵,其中包含每个用户和每个电影,并且在用户对电影进行评分的每个路口处都有一个评分值。
怎么能将所有这些整合在一起对我们来说真是太神奇了。 现在,您将看到一些`NaN`值,它们代表**而不是数字**,以及Pandas如何指示缺失值。 因此,这种解释的方式是,例如`user_id`数字`1`没看电影`1-900 (1994)`,但是`user_id`数字`1`却看了`101 Dalmatians (1996)`并将它评为`2`星。 `user_id`数字`1`也观看了`12 Angry Men (1957)`并将其评为`5`星,但没有观看电影`2 Days in the Valley (1996)`,例如,好吗? 因此,我们最终得到的基本上是一个稀疏矩阵,其中包含每个用户和每个电影,并且在用户对电影进行评分的每个路口处都有一个评分值。
为解决此问题,PixieDust 提供了一个简单的`display()` API,该 API 使 Jupyter Notebook 用户可以使用交互式图形界面来绘制数据而无需任何编码。 这个 API 实际上不会创建图表,但是会在根据用户选择通过调用其 API 委托给渲染器之前完成准备数据的所有繁重工作。
`display()` API 支持多种数据结构(熊猫,Spark 和 JSON)以及多种渲染器(Matplotlib,Seaborn,Bokeh 和 Brunel)。
`display()` API 支持多种数据结构(Pandas,Spark 和 JSON)以及多种渲染器(Matplotlib,Seaborn,Bokeh 和 Brunel)。
作为说明,让我们使用内置的汽车性能数据集,并通过调用`display()` API 开始可视化数据: