讲到架构,机器学习,网页容量,容错,网络中断,数据中心,互联网大小,pagerank,pr比较高的多复制几遍。index,一个过程经过一千台左右的机器,时间越0.25s,硬件失效,一个大的job分配到多台机器,字典,自动纠正,用户数据的统计(上千万或者上亿)