Tag: opendata

免费使用大数据集来实验Hadoop

你知道任何大型的数据集来试验免费/低成本的Hadoop吗? 任何指针/链接相关的赞赏。 Prefernce: 至less有1 GB的数据。 Web服务器的生产日志数据。 目前我发现的其中很less: 维基百科转储 http://wiki.freebase.com/wiki/Data_dumps http://aws.amazon.com/publicdatasets/ 我们也可以运行我们自己的抓取工具来从网站上收集数据,例如维基百科? 任何关于如何做到这一点的指针也是赞赏。