Tag: hadoop

Hadoop 2.2安装`。' 无此文件或目录

我已经使用本教程安装了Hadoop和HDFS http://codesfusion.blogspot.com/2013/10/setup-hadoop-2x-220-on-ubuntu.html 一切安好。 我也能够创build目录并使用它们 hadoop fs -mkdir /tmp hadoop fs -mkdir /small 我也可以说 hadoop fs -ls / 不过,我正在学习培训师的教程 hadoop fs -mkdir temp hadoop fs -ls 现在在我的机器上,当我发出上面的命令说 ls: `.': No such file or directory 在我的训练video中,hadoop fs -ls命令完美无缺。 为什么要指定“/”? 而且我在所有的命令中都得到了这个警告 13/12/28 20:23:52 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable […]

为什么HBase是比Cassandra和Hadoop更好的select?

为什么使用HBase比使用Cassandra和Hadoop更好? 任何人都可以给这个详细的解释吗? 谢谢

免费使用大数据集来实验Hadoop

你知道任何大型的数据集来试验免费/低成本的Hadoop吗? 任何指针/链接相关的赞赏。 Prefernce: 至less有1 GB的数据。 Web服务器的生产日志数据。 目前我发现的其中很less: 维基百科转储 http://wiki.freebase.com/wiki/Data_dumps http://aws.amazon.com/publicdatasets/ 我们也可以运行我们自己的抓取工具来从网站上收集数据,例如维基百科? 任何关于如何做到这一点的指针也是赞赏。

如何使用hadoop fs -copyToLocal命令覆盖现有的文件

有什么办法可以覆盖现有的文件,而从HDFS应付使用: hadoop fs -copyToLocal <HDFS PATH> <local path>

如何修复损坏的HDFS文件

如何修复一个已经损坏的HDFS? 我查看了Apache / Hadoop网站,并说它的fsck命令不能解决这个问题。 希望之前遇到这个问题的人可以告诉我如何解决这个问题。 与传统的本地文件系统的fsck实用程序不同,此命令不会更正它检测到的错误。 通常NameNode会自动纠正大部分可恢复的故障。 当我运行bin/hadoop fsck / -delete ,它列出了损坏或丢失块的文件。 我如何使它不腐败? 这是在一台练习机上,所以我可以吹走所有的东西,但是当我们活着的时候,我将无法通过吹走所有东西来“修复”它,所以我现在想弄明白。

如何杀死Hadoop的工作

当我的代码遇到未处理的exception时,我想自动杀掉所有的hadoop作业。 我想知道最好的做法是什么? 谢谢

Mapreduce初学者程序实例

我是mapreduce程序的初学者,如果问题不重要,请原谅我。 我想了解更多关于mapreduce程序。 为了理解编程方法,我想练习除wordcount程序以外的其他程序。 任何人都可以build议好的和简单的mapreduce例子除了wordcount.I使用eclipse juno和cdh4 请帮帮我

如何运行一个spark java程序

我写了一个Java程序的火花。 但是如何从unix命令行运行和编译它。 编译运行时是否需要包含任何jar?

像SQL这样的Hive插入查询

我是新来的蜂巢,并想知道是否有任何将数据插入到蜂巢表中,就像我们在SQL中做的一样。 我想要像我的数据插入蜂巢 INSERT INTO tablename VALUES (value1,value2..) 我读过,你可以从一个文件的数据加载到Hive表,或者你可以从一个表导入数据到Hive表,但有什么办法来追加数据在SQL中?

HBase RESTfilter(SingleColumnValueFilter)

我无法弄清楚如何在HBase REST接口(HBase 0.90.4-cdh3u3)中使用filter。 文档只是给了我一个“string”的架构定义,但没有显示如何使用它。 所以,我可以这样做: curl -v -H 'Content-Type: text/xml' -d '<Scanner startRow="ddo" stopRow="ddp" batch="1024"/>' 'http://hbasegw:8080/table/scanner' 然后检索 curl -s -H "Content-Type: text/xml" http://hbasegw:8080/table/scanner/13293426893883128482b | tidy -i -q -xml 但是现在我想使用SingleColumnValueFilter,并且必须以某种方式在XML中进行编码。 有没有人有这样的例子? 谢谢,马里奥