今日份知识你摄入了么?
在一个新插件的帮助下,将数据分析提升到了一个新的水平。不,我指的不是代码解释器,它还没有提供给所有 Plus订阅者,而是一个名为的新插件。
图片由授权
是插件商店中提供的一个新的插件,它可以帮助我们在几秒钟内完成数据分析!你只需要使用我将在本文中向你展示的代码就可以开始使用这个插件。
以下是如何帮助你自动化数据分析的方法。
设置
首先,我们需要安装。要做到这一点,请前往插件商店并搜索。一旦你找到它,只需点击安装!
图片由作者提供
安装后,将弹出下面的窗口。你必须在开始使用这个插件之前创建一个帐户。
图片由作者提供
为什么我们需要一个账户?将显示我们要求的可视化和分析,但是所有的代码只能在中以笔记本格式提供。最重要的是,我们需要在上创建一个项目来使用插件。
登录后,你将看到如下所示的一个空格,其中包含一个名为“My First .”的默认项目。单击该项目或从头创建一个项目。
图片由作者提供
一旦你开始一个项目,复制链接。我们将在下一节中使用该链接。链接的格式应该如下所示。
https://app.noteable.io/p//
使用
现在是时候让为我们做数据分析了!这是我们要使用的。
Load this dataset:
Use this as my default project:
Act as a data scientist and analyze ...
如你所见,我们只需要提供我们数据集和项目的链接。差不多就是这样了!
你可以让进行一般但快速的分析,也可以在中指定要获取的内容,让我们看看。
01
使用进行快速数据分析
首先,我们让自己进行数据分析,对一个包含1955年至2020年世界各国人口数据的数据集进行自动化数据分析。
加载此数据集:
%/.csv
作为一名数据科学家,分析数据集,制作图表,以显示世界各地人口增长的主要趋势。
以下是给出的数据集概述。
图片由作者提供
然后,它会自动关注2020年人口最多的5个国家,并绘制出1955年至2020年人口增长的线形图。
图片由作者提供
最后,它添加了一些注释来完成分析,不错!
02
定制数据分析与
现在,我们将告诉和我们想要进行的分析类型。对于这个例子,我们将使用一个数据集,其中包含有关游戏中足球运动员的信息。我们将在下面的中指定要获得的可视化效果和要使用的列。
加载此数据集:
作为一名数据科学家,分析来自美国、加拿大、英国、巴西和阿根廷的足球运动员。制作一个柱状图来分析“总体”这一栏,这一栏代表一个球员在足球方面的水平。制作直方图和箱线图来分析这些国家球员的平均身高。制作散点图,看看玩家的体重是如何分布的。最后,制作饼图以查看来自美国的前10名最有价值球员。
结果真是太棒了!和考虑了我提到的所有细节。
图片由作者提供
我自己做了这个数据分析(当时还不存在),并将其发表在一篇文章中()。结果完全一样!
最后但同样重要的是,你可以访问通过网站生成的代码。
图片由作者提供
03
加载多个数据集并使用进行分析
我加载了多个数据集,并指导如何使用它们。结果和之前的测试一样好!
在下面的中,我加载了2017年、2018年、2019年、2020年和2021年《国际足联》游戏的5个数据集,以查看Messi和等球员的FIFA评分(“总体”列)的演变。
加载这5个数据集:
作为一名数据科学家,加载提供的5个数据集。每个数据集都代表了2017年、2018年、2019年、2020年和2021年FIFA比赛的评分。加载每个数据集后,用数据集的年份创建一个新列“years”。使用线图分析球员L.Messi、、K.、V.和K.Mbappé从2017年到2021年的“整体”演变。“整体”一栏代表一名球员的足球水平。
这是我得到的。
神奇吧!这就是我在这篇文章中发表的分析结果()。
就是这样!现在轮到你使用自动进行数据分析了!