2018年9月,谷歌推出了一个新的数据集搜索引擎,旨在帮助研究人员浏览来自公共资源的大型数据集。这些数据包括人口普查数据,人口统计调查,医学研究等等。
数据集主要供学术研究人员处理数字并提取模式。但是,即使对于普通的外行来说,其中一些数据集也很有趣。
Google数据集搜索的工作方式
多年来,Google搜索引擎的最大弱点之一是地下互联网的整个部分仍然不可见。
该互联网仍然是“地下"的,因为Google的网络爬虫无法搜索信息本身。这是因为数据存储在需要特殊搜索查询的数据库中,或者存储为只能下载和分析的数据文件。
但是,当您使用Google数据集搜索来查找信息时,而不是返回网站,它会返回数据库列表。
您可以单击任何一个数据库以查看到源数据的链接。
源数据可以包括可搜索的数据库,一个可下载的文件,甚至是一个在线可视化工具,可以帮助您分析和可视化数据库中包含的大量信息。
您可以找到哪种信息?
这里是与Google的数据集搜索引擎链接的一些最有趣的数据集,供您浏览。
1。国家海洋和大气管理局
通过Google数据集,您会找到指向NOAA EV2图像访问系统的链接。
这是从缩微胶片到旧气候数据的令人印象深刻的档案数字格式,向公众免费提供。
您可以从该数据库中提取一些令人印象深刻的记录,包括:
在每种情况下,您都需要选择所需数据的状态。您可以返回并获取数据的年限取决于状态。
对于扶手椅式气候学家或仅对全球气候变化感兴趣的人,这是一个了不起的资源。
2 。 NOAA交互式地图
除了可下载的数据集外,在Google数据集上,您还会看到指向NOAA交互式地图的链接。
这些地图是令人难以置信的资源,可让您定制
NOAA交互式地图包括以下每个数据趋势的直观表示。
这些地图引人入胜,探索了这些年来,并观察了地球气候如何缓慢变化。即使对于不是气候学家的任何人,这些交互式地图也是一个了不起的资源。
3。 NASA风暴追踪[不再可用]
NASA网站一直是有用信息的仓库。许多人可能没有意识到,他们还收集和共享有关世界各地天气模式的卫星数据。
最广泛的数据集之一是NASA的“热带风暴地图集"。它涵盖了1961年至1998年的风暴数据。在数据集页面上,您可以选择月份或季节和年份,并请求下载当年发生的以下重大风暴的任何以下内容。
回顾风暴印象深刻模式可以追溯到几十年。对于寻找气候模式的任何研究人员来说,这都是一个宝贵的数据库。
4。 WHISPers
WHISPers是“野生动物健康信息共享合作伙伴计划"事件报告系统。这是一张互动式地图,向您显示了美国最近发生的20种野生动植物健康事件。
您可能偶尔会听到鸟类大量死亡,疾病致死的蝙蝠种群或禽流感病例。新闻中提到了慢性消耗性疾病。但是,如果您要监视此地图,则会发现此类案例的群集在媒体中出现之前就已经出现了很久。
5。人类埃博拉疫情
人类疾病的传播是一个令人着迷的领域。在现代没有人类疾病爆发像埃博拉病毒爆发一样可怕。西非在2014年成为该新闻,当时该地区看到了人类历史上最严重的埃博拉疫情。
不过,过去还有其他埃博拉疫情。这些数据将在Figshare提供的在线数据库中记录和共享。
数据集始于1976年,一直持续到现在。跟踪疫情潮起潮落,流传多久似乎没有爆发,然后又似乎又开始主动爆发很有趣。
您可以在网络的在线版本下下载详细的数据集一般数据。
6。全球人口估计和预测
如果您在Google数据集中搜索“全球人口估计",则会看到世界银行交互式“人口估计和预测"工具的链接。
这是一个令人印象深刻的工具,可让您选择要绘制的国家和数据系列。在右侧,您可以以表格,图表或地图的形式查看数据结果。
从人口统计学和国家/地区等角度回顾人口预测的趋势非常有启发性。该工具可为您节省大量时间。世界银行工具无需亲自研究元数据并开发这些图表,而是可以为您完成所有工作。
令人印象深刻的是,您不仅限于人口数据库。您可以将主要数据库从人口切换为贫困,全民健康覆盖,工作,教育统计数据等。
在Google提供的任何数据集链接中,这是最有用的数据库之一。
7。国家UFO报告中心
您越深入地研究Google数据集,就越会惊讶您发现哪些信息。
例如,有一个链接到从国家不明飞行物报告中心下载去年的所有不明飞行物报告。数据包括事件的位置,发现的对象是什么,目击持续了多长时间,证人的摘要等等。
您认为可以根据聚类目击的时间和位置来发现模式吗?通过下载整个数据集并查找相关性来进行尝试。
搜索Google数据集
使用Google数据集搜索可找到的信息量令人印象深刻。以上示例仅是冰山一角。尝试输入您自己的几个关键字,看看自己会发现什么。
如果不确定如何分析发现的大量数据,请将其加载到Excel中。 Excel是用于分析大量数据的强大工具。如果您以前从未做过此事,则可以在开始挖掘将要发现的所有信息之前先了解有关Excel数据分析功能的更多信息。