首页重庆seo服务 › 搜索引擎是如何工作的?搜索引擎工作原理

搜索引擎是如何工作的?搜索引擎工作原理

欢迎来到重庆seo优化技巧学习分享博客。上篇文章回顾什么是seo?seo介绍,下面我们一起来学习搜索引擎的工作原理。

了解搜索引擎工作原理有助于我们更好的进行seo优化。

搜索引擎工作原理图

搜索引擎工作原理图

搜索引擎工作原理图

从索引去出发开始抓取众多的网页,然后将抓取到的网页放到临时库中进行处理,然后再顺着网页上的链接去抓取其他的内容,在临时库中它会将不符合规则的清理掉,那么符合规则的将会放在它的索引区,然后在索引区中将网页进行分类、归档、排序,然后呢将结果反馈给用户,这样当用户在搜索引擎通过搜索时就可以查询到自己想要的内容。

1.抓取网页数据

互联网的信息呈爆发式的增长,那么如何有效的获取并利用这些信息,这是搜索引擎工作中的首要环节,数据抓取系统作为整个系统中的上游,它主要负责互联网信息的收集、保存、更新的环节,想蜘蛛一样在网络间爬来爬去,因此通常叫做Web spider也就是网络蜘蛛或者是Robot机器人。

常见的搜索引擎抓取程序:Baiduspider(百度蜘蛛)、360spider(360蜘蛛)、Sougou Web Spider(搜狗网络蜘蛛)、Googlebot(谷歌机器人)。spider抓取它是从一些重要的url开始,通过页面上的超链接关系不断的发现新的url并进行抓取,它会尽最大的可能抓取到更多有价值的网页。

蜘蛛抓取顺序:1.广度优先。2.深度优先。

2.建立索引库

其实搜索引擎的蜘蛛抓了多少页面并不是最重要的,重要的是有多少页面被建索引库。

索引库层级:优质的网页会被分配到重要的索引库,普通的网页会待在普通库,较差的网页会分配到低级库中充当补充材料。目前60%的检索需求只需调用优质索引库即可满足。这就解释了有些网站收录很多,但是流量一直不是很理想的原因。

哪些网页可以进入优质的索引库:1.有时效性且有价值的页面、2.内容优质的专题页面、3.高价值原创内容页面、4.重要的个人页面。总的原则就是对用户的价值。

3.页面排序

用户通过关键词进行检索,搜索引擎在排序环节要做的是把相关的网页从索引库中提取出来,把提取出来的不同网页按照不同的纬度结合相关因素进行综合排序。影响排序的因素:相关性、权威性、时效性、重要性、丰富度、受欢迎程度。

4.展示搜索结果

以百度为例:百度搜索结果左侧结果展现形式:竞价、凤巢、品牌专区、自然搜索等。百度搜索结果右侧结果展现形式:知心搜索以及百度竞价。

看完思考:如何创建优质网页?

转载本站文章请注明出处:搜索引擎是如何工作的?搜索引擎工作原理

文章出自:黄楼seo

上一篇:

下一篇:


博主精心推荐:
阿里云服务器(ECS) 阿里云精品网站模版 阿里云DDoS高防IP 阿里云服务器30元/月

公安备案图标渝公网安备 50010802001971号 网站地图 重庆seo
×
用户注册

 

登录 忘记密码?
×
用户登录

 

注册 忘记密码?
×
订阅图标按钮