2007-09-16
完成了自定义入nutch库的命令
关键字: nutch lucene hadoop
可以利用到hadoop的map/reduce和hdfs,感觉还是很爽,需要注意的几点总结如下:
1.自定义命令类可以单独作一个jar,但要记得部署到 每个节点,否则会无法执行
2.记得启动maper服务,否则无法进行map/re duce计算
3.自定义命令调用方法bin/nutch CLASSNAME 参数
4.目前没有找到更简便的调试方式,目前都是编译完,打 包上传,执行,步骤觉得复杂了一些
5.nutch0.8不能使用最新的hadoop0.1 4比较可惜,不过照发展趋势应该很快可以使用
1.自定义命令类可以单独作一个jar,但要记得部署到
2.记得启动maper服务,否则无法进行map/re
3.自定义命令调用方法bin/nutch CLASSNAME 参数
4.目前没有找到更简便的调试方式,目前都是编译完,打
5.nutch0.8不能使用最新的hadoop0.1
发表评论
- 浏览: 3333 次
- 性别:


- 详细资料
搜索本博客
最近加入圈子
最新评论
-
solr弯路篇
lucene,solr,hadoop,nutch,这几者更适合作什么呢? 个人 ...
-- by chenlb -
Hadoop and Lucene
汗,来点实际的。这些算什么东西,光概念
-- by 火柴天堂 -
solr弯路篇
有详细的资料吗,我想学习一下.谢谢
-- by surpass_li -
solr改造篇
看了CollectionDistribution的过程,因为是E文的,而且也说的 ...
-- by tovegar -
Hadoop and Lucene
呵呵,期待看到你更多的成果
-- by 老熊






评论排行榜