在正式学习SEO之前,你还需要学习一下搜索引擎的工作原理,毕竟SEO是针对搜索引擎进行操作的,那么弄明白搜索引擎的工作原理,那么遇到一些问题的时候,你就可以知道问题产生的原因了。一个搜索引擎,一般由下面几个模块组成:
1、抓取模块
2、过滤模块
3、收录模块
4、排序模块
搜索引擎在运作的时候,第一个工作就是要去互联网上面抓取页面,而实现这个工作的模块,我们称为抓取模块。学习抓取模块,我们需要先了解下面几个知识点:
1、搜索引擎抓取程序:蜘蛛
搜索引擎为了可以自动抓取互联网上面数以万计的网页,必须有一个全自动的页面抓取程序。而这个程序我们一般称之为“蜘蛛”(也可以叫做“机器人”)。那么不同的搜索引擎的蜘蛛,叫法也就不同了。百度的抓取程序,一般称为百度蜘蛛。
谷歌的抓取程序,一般称为谷歌机器人。
360的抓取程序,一般称为360蜘蛛。
其实,不管叫做蜘蛛,还是机器人,你只要知道这个指的是搜索引擎的抓取程序,就可以了。蜘蛛的任务很简单,就是顺着链接不断的抓取互联网上,自己还没有收录过的网页和链接,然后将抓取到的网页信息和链接信息存储到自己的网页数据库中。而这些抓取到的网页,将有机会出现在最终的搜索结果中。
2、怎么让蜘蛛来抓取我们的网站
通过上面对蜘蛛的解释,我们能够知道:要想自己的页面最终出现在搜索结果中,首先得让蜘蛛抓取到我们的网站。通过下面三种方法可以让蜘蛛来抓取我们的网站
外部链接:我们可以在一些已经被搜索引擎收录的网站上面发布自己网站的链接,以此吸引蜘蛛,或者交换友情链接也是一个常用的方法。
提交链接:百度为站长们提供了链接提交的工具,通过这个工具,我们只需要通过这个工具提交给百度,那么百度就会派出蜘蛛来抓取我们网页了。
百度网址提交工具网址(如图所示):
http://zhanzhang.baidu.com/linksubmit/url
蜘蛛自己来抓取:如果你希望蜘蛛能够定期主动来自己的网站抓取网页,那么你就必须提供优质的网站内容。只有蜘蛛发现你的网站的内容质量很好,那么蜘蛛就会特别关照你的网站,定时会来你的网站看看是不是新的内容产生。如何才能够确保自己的网站能够提供优势的内容,这个话题我们在之后的章节再做阐述。
下一篇:什么是搜索引擎?搜索引擎怎么定义