匹配搜索请求的详细过程
搜索请求(search query)是指搜索者在搜索引擎上键入的用来搜索的词语,比如某个人在google上面输入“SEO网站优化”时,这就是一个搜索请求。一般搜索引擎会把用户输入的词语分成不同的搜索项(search term)(这个例子中,“SEO”和“网站优化”都是搜索项)来匹配索引库中的信息。从分析搜索请求开始,搜索引擎通过一些基本步骤来匹配网页。
第一步、分析搜索请求
一旦搜索者键入搜索请求并按下回车键,搜索引擎便开始分析搜素请求-检查搜索请求的每一个词(搜索项),并且决定怎样在搜索索引库中找到匹配的网页,狼蚁网站SEO优化分析一些搜索引擎分析请求的方法:
(1).发现词的变种和矫正拼写
在英语和其他西方国家的语言中,同一个词可以写成不同的“格”(写成“Glaucoma Treatments”而不是“glaucoma treatments”)。大多数搜索引擎并不注意词的“格”,这也常常是搜索所希望的,因为一个词在句首出现和在句中出现一样重要。比如搜索者搜索“白宫”(White House)可能是想找到与这个词的这个特定“格”相匹配的网页(并不是匹配这样的句子:“他住在第四街的白房子(white house)”),但是搜索引擎一般都通过忽略这样的“格”来得到更好的匹配结果。
(2).查找词组、非词组和停止词
词组(phrase)在搜索中和平常使用的意义稍有不同。我们知道一些搜索指令,是用双引号将几个词放在一起作为一个词来搜索的。搜索引擎把这些放在一起的词称之为“词组”。
随着搜索引擎算法的改进,即使在搜索的时候没有使用双引号,也会把一些词作为词组的。搜索引擎可以辨别一些经常同时出现的词,并优先选择这些同时使用这些词的网页。
还有一些被称为停止词(stop word),比如“的”、“这”、“那”等等,以前搜索引擎也许不回去关注他,但是现在搜索回去关注这些词,比如在百度中搜索“这”的时候,就出现了百度词典、百度百科、百度音乐、百度知道等等。所以作为一个搜索引擎营销人员,如果能够避免在品牌词和商标中将这些停止词作为关键词,那么这些品牌和商标就会更容易被搜索到。
(3).检查词序
搜索引擎子啊执行搜索时会考虑词序的问题,因此当搜索如“网站优化”和“优化网站”时,会出现不同的搜索结果,这些搜索引擎会尝试按照搜索者请求中的词序来搜索含有同样词序的网页。
(4).处理搜索运算符号
搜索引擎会识别一些标点符号标注的词语,把这些词语作为关键词或者品牌词处理。
第二步、选择和搜索请求相匹配的结果
因为搜索引擎分为付费的和免费的,这里又分为两种情况:
自然搜索匹配的结果和选择付费放置匹配结果。
自然搜索使用其索引库来定位最匹配的网页,基本上通过分析搜索者请求来决定查找什么词-不仅是在搜索请求中键入的那些词,还有词的所有变体(同义词或者同音词)-以及忽略的那些词(“停止词”和“非词组”)。搜索引擎查看搜素请求中的每个词,看那些网页包含这些词。搜索引擎可以被看做是一个按字母顺序排列的列表,列出了互联网没一个网页上的每一个词,如下图所示:
图:自然搜索引擎检查网页列表的索引,网页列表列出了包含搜索请求中的每个词的所有网页
这个索引库中包含每个词的所有网页的列表,因此,当你查看“青光眼”这个词的时候,就会得到含有这个词的所有网页的列表。
付费搜索结果和自然搜索结果不同,不是从搜索索引中得到,但是搜索引擎确实查阅一个广告主提交的存储在所有列表中的数据库。每一个广告主选择的关键词和短语,并且提交一个投标价格-搜索者每次点击广告时,广告主按这个价格付款。搜索引擎也是子啊付费列表的数据库中查询这些词,每一个与搜索请求的关键词有关联的列表都会被从付费列表数据库中找回。