狂花非叶提示您:看后求收藏(爱米文学网aimiwx.com),接着再看更方便。
这还只是其中比较小的开发困难。
比如,搜索引擎的核心就是通过海量数据抓取后的快速检索,而抓取的数据越多,当庞大的数据存储在数据库里,就需要构建快速存取数据的分布式存储架构。
再比如,为了让用户在最短的时间内获得想要的搜索结果,就需要后台系统不断的执行数据抓取和建立索引等操作。
这就需要建立分布式实时计算系统,以及对索引结构的构建……
王川估计也是最近开发中有些郁闷了,一说起来就滔滔不绝。
隋波虽然不太懂他说的一些技术术语,但毕竟前世作为用户也使用了20多年的搜索引擎,接触的多了,也了解一些基本的知识。
他安静的听着王川不断的讲述团队面临的一个个困难,又是怎么想办法克服的。
不时提问两句,显得听的很认真。
脑子里却不断的在回忆,当初Google和百度是有哪些创新的举措,才一举成功的?
印象最深的,就是那句“百度更懂中文”,这应该就是刚才王川所提的中文分词了,这块王川已经考虑到了。
至于是不是更进一步,先弄个智能输入法出来?……
现在团队的研发压力已经很大了,暂时先略过不提。
还有就是百度快照,不过好像这个功能虽然对用户而言很有价值,但争议很大……
还有就是Google独创的PageRank技术。