2007-09-14
solr弯路篇
在改造solr的过程中,发现代码越写越驱近于nutc
h。。。。。再次打开nutch的代码进行研读,发现n utch对于hadoop的支持更为自然(但nutch 不支持最新的hadoop0.14版本,只支持到had oop-0.12版本,如果强行升级会因为hadoop 0.14去除了一些方法而失败)。目前想到的方案,用n utch来完成索引的建立和文件的保存,用solr进行 查询,将结果暴露为json格式。
需要做的工作:
1.开发nutch的录入分析程序,还可以利用到map /reduce
2.将solr的查询部分改为从hdfs搜索,之前以完 成
虽然走了一些弯路,在solr上花费了不少时间,不过总 算弄清了lucene,solr,hadoop,nut ch,这几者更适合作什么,如何协调会更好
需要做的工作:
1.开发nutch的录入分析程序,还可以利用到map
2.将solr的查询部分改为从hdfs搜索,之前以完
虽然走了一些弯路,在solr上花费了不少时间,不过总
评论
chenlb
2008-06-12
lucene,solr,hadoop,nutch,这几者更适合作什么呢?
个人之见:
lucene索引数据结构
solr搜索
hadoop存储索引
nutch提供数据源(不太清楚)
个人之见:
lucene索引数据结构
solr搜索
hadoop存储索引
nutch提供数据源(不太清楚)
surpass_li
2008-04-03
有详细的资料吗,我想学习一下.谢谢
发表评论
- 浏览: 3336 次
- 性别:


- 详细资料
搜索本博客
最近加入圈子
最新评论
-
solr弯路篇
lucene,solr,hadoop,nutch,这几者更适合作什么呢? 个人 ...
-- by chenlb -
Hadoop and Lucene
汗,来点实际的。这些算什么东西,光概念
-- by 火柴天堂 -
solr弯路篇
有详细的资料吗,我想学习一下.谢谢
-- by surpass_li -
solr改造篇
看了CollectionDistribution的过程,因为是E文的,而且也说的 ...
-- by tovegar -
Hadoop and Lucene
呵呵,期待看到你更多的成果
-- by 老熊






评论排行榜