[ad_1]
Google的数据集搜索于2018年9月首次发布, 正式 测试版中,索引了近2500万个数据集。
数据集搜索可用于从科学研究到进一步了解自己喜欢的爱好的任何事物。
“在网络上,几乎有您感兴趣的任何主题都有数百万个数据集。如果您想购买一只小狗,则可以找到汇编小狗买家投诉或小狗认知研究的数据集。或者,如果您喜欢滑雪,则可以找到有关滑雪胜地收入或伤害率和参与人数的数据。”
自测试版发布以来,Google已根据用户收集的反馈为数据集搜索添加了新功能。现在,可以根据所需的数据集类型(表格,图像,文本等)或是否免费提供数据集来过滤结果。
此外,数据集搜索现在可以在移动设备上使用,谷歌表示,数据集描述的质量已经“显着提高”。
在数据集搜索中为内容建立索引
发布者必须经过的流程才能使其数据集搜索中包含的数据集保持不变。任何发布数据的人都可以使用适当的schema.org结构化数据来使其数据集可被发现。
迄今为止,使用数据集搜索的人们范围从学术研究人员到学生,再到业务分析师。最常搜索的数据集包括“教育”,“天气”,“癌症”,“犯罪”,“足球”和“狗”。
数据集涵盖的最大主题包括地球科学,生物学和农业。最受欢迎的数据集格式是表格,其中有600万以上包含在“数据集搜索”中。
尽管Google正式退出测试版,但它仍致力于改进数据集搜索,就像它一直在改进其主要搜索引擎一样。