2007-09-14
Hadoop and Lucene
关键字: hadoop hdfs lucene
这几天的工作一直在围绕Hadoop进行,记录一些随手心得.
Hadoop有价值的部分:
1.HDFS
一个分布式的文件系统,我们的目标是用HDFS来完成数据的分布式保存和索引文件的分布式保存
2.Map/Reduce
用来做分布式运算,摆脱SQL的束缚,完全利用索引,来进行数据的检索.然后用Map/Reduce来进行我们需要的统计计算,利用分布式机制提高运算速度
Lucene,以前只是比较皮毛的接触过Lucene,这次会有一次比较深入的应用,利用Lucene的索引提高检索速度,并配合HDFS,将索引文件分布式存储
目前还一个很重要的工作,就是解决FreeBSD下diablo-jdk1.5的RandomAccess类的mode设置为rws不能正常工作的问题
http://lists.freebsd.org/pipermail/freebsd-java/2006-September/005670.html
参考资料:
http://lucene.apache.org/hadoop/
http://lucene.apache.org/java/docs/index.html
Hadoop有价值的部分:
1.HDFS
一个分布式的文件系统,我们的目标是用HDFS来完成数据的分布式保存和索引文件的分布式保存
2.Map/Reduce
用来做分布式运算,摆脱SQL的束缚,完全利用索引,来进行数据的检索.然后用Map/Reduce来进行我们需要的统计计算,利用分布式机制提高运算速度
Lucene,以前只是比较皮毛的接触过Lucene,这次会有一次比较深入的应用,利用Lucene的索引提高检索速度,并配合HDFS,将索引文件分布式存储
目前还一个很重要的工作,就是解决FreeBSD下diablo-jdk1.5的RandomAccess类的mode设置为rws不能正常工作的问题
http://lists.freebsd.org/pipermail/freebsd-java/2006-September/005670.html
参考资料:
http://lucene.apache.org/hadoop/
http://lucene.apache.org/java/docs/index.html
发表评论
- 浏览: 3337 次
- 性别:


- 详细资料
搜索本博客
最近加入圈子
最新评论
-
solr弯路篇
lucene,solr,hadoop,nutch,这几者更适合作什么呢? 个人 ...
-- by chenlb -
Hadoop and Lucene
汗,来点实际的。这些算什么东西,光概念
-- by 火柴天堂 -
solr弯路篇
有详细的资料吗,我想学习一下.谢谢
-- by surpass_li -
solr改造篇
看了CollectionDistribution的过程,因为是E文的,而且也说的 ...
-- by tovegar -
Hadoop and Lucene
呵呵,期待看到你更多的成果
-- by 老熊






评论排行榜