SEO教程——17爬虫的详解 - SEO教程_SEO入门教程_SEO免费教程_SEO优化教程_

SEO教程——17爬虫的详解

1年前 (2017-07-19) SEO教程 0评论 已收录 335℃
俗话说得好:“工欲善其事必先利其器”!
而当你想要从事seo这个行业,想要跟互联网打交道,想要驯服搜索引擎,那么就必须先要知道搜索引擎是什么,它的工作原理是怎样的!
搜索引擎又叫做网络爬虫,是按照一定的规则,抓取互联网上的有价值的信息。
因为互联网信息过于庞大,如果人工浏览、判断每一条信息,则效率过于低下并且记忆知识的有限也会导致错误的产生,因此研发者编写了一套程序能够自动识别信息的系统。
搜索引擎系统不止一个,也意味着不同的搜索引擎具体的抓取细节也是不一样的,所以它的称呼也有很多种,但是它们的工作原理是一致的。
如:百度:Baiduspider 百度蜘蛛/爬虫抓取程序;谷歌:Googlebot 谷歌机器人;360:360Spider 360蜘蛛;搜狗:Sogou News Spider 等。
搜索引擎工作原理简单的来说就是:抓取-过滤-建立索引-输出结果
抓取:蜘蛛抓取互联网上的所有信息(有价值/无价值、好的/坏的)。
过滤:蜘蛛在这些信息中开始筛选过滤,过滤掉一下重复的,没有价值的信息或者网站。
建立索引:将省下来的信息建立索引供用户搜索。
输出结果:一段时间后,蜘蛛根据用户的搜索、点击、浏览时间长短等因素给这些信息排序,最后的结果体现在信息/网站在浏览器的排名上。
SEO教程——17爬虫的详解

搜索引擎的详细工作原理
搜索引擎反感及不能识别的内容:
1.搜索引擎反感网站的空页面,这是你的网站基础优化就没有做好,就比如用户进到你的网站,一打开页面是空的,首先体验就不好。
SEO教程——17爬虫的详解

2.搜索引擎不能够识别菜单栏中的下拉菜单。
SEO教程——17爬虫的详解

3.纯文字的页面,用户体验度差,停留时间短,也会让搜索引擎降低排名。
SEO教程——17爬虫的详解

4.搜索引擎不能够访问的登陆/权限后台要记得用robots屏蔽。
SEO教程——17爬虫的详解

5.目前搜索引擎对于图片的识别能力还不是很高,所以纯图片的内容对于它来说就是空页面。
SEO教程——17爬虫的详解

6.搜索引擎也不能够识别:flash动画,css,iframeajax.
了解搜索引擎,并且让它为你所用,它就是你的一把利器。一定要记住:搜索引擎最终的目的还是服务用户,所以网站一定要有用,有价值,从用户的角度出发。
SEO视频详解:

如无特殊说明,文章均为本站原创,转载请注明出处
本文标题:SEO教程——17爬虫的详解
本文永久链接地址:http://www.taoliseo.cn/328.html

相关推荐

嗨、骚年、快来消灭0回复。

网站地图