2007-09-14

solr弯路篇

在改造solr的过程中,发现代码越写越驱近于nutc
h。。。。。再次打开nutch的代码进行研读,发现nutch对于hadoop的支持更为自然(但nutch不支持最新的hadoop0.14版本,只支持到hadoop-0.12版本,如果强行升级会因为hadoop0.14去除了一些方法而失败)。目前想到的方案,用nutch来完成索引的建立和文件的保存,用solr进行查询,将结果暴露为json格式。

需要做的工作:
1.开发nutch的录入分析程序,还可以利用到map/reduce
2.将solr的查询部分改为从hdfs搜索,之前以完

虽然走了一些弯路,在solr上花费了不少时间,不过总算弄清了lucene,solr,hadoop,nutch,这几者更适合作什么,如何协调会更好
评论
chenlb 2008-06-12
lucene,solr,hadoop,nutch,这几者更适合作什么呢?

个人之见:
lucene索引数据结构
solr搜索
hadoop存储索引
nutch提供数据源(不太清楚)
surpass_li 2008-04-03
有详细的资料吗,我想学习一下.谢谢
发表评论

您还没有登录,请登录后发表评论

清风
搜索本博客
最新评论