Lucene 建索引效率
2007年06月13日 星期三 19:48
昨天给一个项目的数据做索引, |
===显然,采用内存可以最大减小磁盘读取。则索引的效率非常高=======
这些服务器将采用拥有大容量内存的低主频处理器。业内人士认为,这可能是采用低端的1路Woodcrest处理器的服务器,并且配置大量的内存以提高性能。这种配置可能会满足Google对内存的需求。目前还没有资料显示Google为什么需要那样多的内存。
这不奇怪,google采用分布式体系结构进行数据挖掘,其中大量的工作就是数据立方体的计算,在目前内存价格比较便宜的情况下,把单个数据立方体缓存在内存中,性能会提高很多,feelor就是这么做的。
=========
这两台机器配置都是300MHz 频率、内存512MB的的奔II服务器,共有9块9G 的硬盘。主要的搜索任务就是由它们执行。
//这可以看出,那个年代他们就是搞的大内存。