搜索引擎整个的处理流程是非常复杂的,涉及大量的运算,本文只是简单介绍一下搜索引擎的大致过程。
搜索引擎的工作流程大致分为三个阶段:
首先是获取信息
也就是所谓的抓取,将网站的内容全部都记录下来,收集到搜索引擎的数据库中,这个过程使用的程序叫做搜索引擎蜘蛛,这些搜索引擎放出的蜘蛛,“爬行”到网站,跟踪网站的所有链接进行每个页面地访问,或者信息,存入数据库;
其次是处理信息
将蜘蛛抓取到的原始信息进行文字提取、分析以及索引,为搜索做准备;
最后是排名
在例如百度、谷歌等搜索引擎输入要搜索的关键词后,这个程序就在上一步准备好的数据中,提出所需数据,返回给搜索的用户,这个就是我们在网页上执行的“搜索”动作。