百度搜索引擎搜索算法解密
百度搜索引擎的特点:
1. 基于字词结合的信息处理方式。巧妙解决了中文信息的理解题目,极大地进步了搜索的正确性和查全率。
2. 支持主流的中文编码尺度。包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。
3. 智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。
4. 检索结果能标示丰硕的网页属性。(如标题、网址、时间、大小、编码、摘要等)并凸起用户的查询串,便于用户判定是否阅读原文。
5. 百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继承检索,逐步缩小查找范围,直至达到最小、最正确的结果集。利于用户更加利便地在海量信息中找到自己真正感爱好的内容。
6. 相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,匡助用户查找更相关的结果,统计表明可以促进检索量晋升10-20%。
7. 运用多线程技术、高效的搜索算法、不乱的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的均匀响应时间小于0.5秒)
8. 可以提供一周、二周、周围等多种服务方式。可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。
9. 检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,进步用户检索效率。
10. 智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最正确、最广泛、最具时效性的信息提供了坚实基础。
11. 分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高机能和高不乱性。
12. 高可配置性使得搜索服务能够知足不同用户的需求。
13. 提高前辈的网页动态摘要显示技术。
14. 独占百度快照。
15. 支持多种高级检索语法,使用户查询效率更高、结果更准。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“link:”,还将继承增加其它高效的搜索语法。
有良多枢纽字人们会常常拼写错误的,找出这些常常泛起错误拼写的词或词组可认为你带来额外的流量。(就GOOLE来说,它有检查拼写错误的功能。建议不要用拼写错误的词、词组作枢纽字)
1、 处理枢纽字:
首先收集良多与你的网站或产品有关的枢纽字了。接下来的工作就是把收集到的枢纽字进行组合,把它们组成常用的词组或短语。良多人在搜索的时候会使用两 个或 三个字组成词。据统计,均匀是2.3个字。不要用普通的,单个字作为枢纽字。这样的枢纽字很难排到搜索引擎的前十位。例如:你有以下几个枢纽字:“搜索引 擎、软件、进步”,试着把他们组合为“搜索引擎软件”、“搜索引擎进步”等。把字组成枢纽字短语有利于进步你网站的排名,你将会更有效进步你网站访问量。 例如:很少人会用“搜索引擎”或者“软件”。
2、 舍弃一些枢纽字: 寻找出那些搜索时很少用到的枢纽字:
A:在英文里,在搜索引擎大小写是没有区别的。
B:拼写错误的枢纽字是没用的,但是找到一个常常泛起拼写错误码的词可以额外埠进步你的访问量
C:去除那些停用的词,在英文里有“the, for , a ,” 等。中文里有“的,地,你,我”等。
D:没有人会用“最好的”,“疯狂的”等词语进行搜索。假如你的网站里有类似的词,最好把他去除。
选择最佳枢纽字:
假如你按照上述所说,你一定列出了一大堆的枢纽字。尽管,你已经去除了一些没人使用的。但是对于你来说仍是太多了。现在是时候进入枢纽字优化的最后一步了。
提示:
试着用剩余的枢纽字在搜索引擎中进行搜索,不要把焦点放在最流行的枢纽字上。有时候,次枢纽字排名起来仍是比较轻易的。由于最流行的枢纽字会存在着更 多的竞争对手,而次枢纽字反之。在选择枢纽字时的技巧是找出枢纽字需求与枢纽字竞争的平衡点,即所选枢纽字竞争不是很激烈。
为什么要使用html的meta标签?
1、 meta标签是内嵌在你网页中的特殊html标签,包含着你有关于你网页的一些躲藏信息。Meat标签的作用是向搜索引擎解释你的网页是有关哪方面信息 的。对于高级的搜索引擎来说,html 的meta 标签并不是什么新颖的东西。但是不管如何它是一个优秀网页不可缺少的。下面我们就它进行一些讲解吧。
2、当你计划搜索引擎优化策略是meta标签长短常重要的。尽管如斯,一般的加入meta 并不能匡助你在搜索引擎中获得更好的排名。有好几种meta标签,但重要的有以下几个:de 111222tion标签, keywords标签, title标签(严格来说title不算是一个标签)。当你不时刷新标签时这几个标签显得特别的重要。假如你但愿搜索引擎对你的网站进行索引时就会用到 html标签的重定向(redirect)标签与robots标签。
留意:调查表只有20%的网页用到“枢纽字”与“描述”标签(即keyword, de 111222tion)
多个枢纽字用逗号分开。
3、 title 标签
title 标签可能是你网页中最重要的标签,它是你网页中最先看到的部门。把它放在de 111222tion 与 keyword前。在这个标签中最好是加上你网站的枢纽字,title标签在搜索引擎的搜索中据有非常重要的地位。最好是把它放在其他meta标签前,这 更有利于你网站的排名。(留意:有些搜索引擎会按title标签的字母的优先权进行排名,尽量在你的title中使用开始的字母)title标签是人们在 搜索引擎中第一个看到有关你网站的描述,所以尽量把它弄得简朴、明了。让人一看就知道你的网站是关于什么的。
4、 De 111222tion标签
De 111222tion标签就在title后面,该标签可以是一小段(一个或者两个句子)。用于描述你网站。与title标签一样,这也是人们在搜索 引擎 列表中链接到你网站的点击。这些描述将鼓动人们去浏览你的网站而不是你竞争对手的。(描述不能太夸张。不然,当访问者到你网站发现内容根本不是你说的那个 样子,那么他很快就会退出去。)良多搜索引擎答应描述的字数在150个左右,所以你要保证你的描述在150以下,否则搜索引擎会自动把多余的部门剪去从而 造成你网站的描述的不完整。搜索引擎以为描述里的枢纽字远比网页中的内容要重要(似乎现在这种情况不是那么显著了)。真如上所述,这里提供了非常重要的信 息:确定你的描述能准确的反映你网站的主题,尽量在描述中加入你主要的枢纽字,越靠meta的枢纽字意义越大。这样会突显你的枢纽字。
现在大多的搜索引擎(google除外)都会支持de 111222tin标签。假如你不使用的话你将会失去排名靠前的可能。
5、keyword 标签
比拟于de 111222tion与title标签,keyword标签显得并不是那么重要了。有些搜索引擎把它完全地忽略,但是使用下准确的keyword标签对进步排名仍旧有效。
除了搜索引擎外,一般情况下人们是看不到的。keyword标签是一个躲藏的标签,向搜索引擎提供了一组与你的页面有关的的枢纽字或枢纽短语列表。你 可以 用相应的工具找出一系列合用于你网站的枢纽字。(留意:枢纽字标签中只能包括与你本页内容相关的枢纽字列表。所有在这里的枢纽字必需与页面的内容相联 系。)
提示:在你每一个页面中组织相关的枢纽字,每个页面必需专注于不同的产品或者内容。在标签中列满枢纽字对于进步你网站的排名并没有好处。多个枢纽字间 用逗 号用隔,逗号表示是逻辑“或”的意思。空格表示逻辑“与”。这是正式在keyword标签中描述枢纽字必需的。尽管如斯,良多搜索引擎也会把枢纽字间以空 格分开以达到能搜索出更相关的结果的目的。这样做的意义是,搜索引擎会把空格分开的枢纽字根据一定的方式自由组合。可以尝试用两种方法,看哪一种更加适合 你。
枢纽字不宜以统一形式重复3-6次,一般这已经以为是最大的枢纽字重复数(似乎现在又发生了变化)。所以,尽量避免把你的枢纽字一次又一次地不断重 复。这 对于每一个搜索引擎来说是SPAM(枢纽字垃圾),你会因此而受到惩罚。大多数的搜索引擎会答应你在keyword标签中使用最多 1000个字符。通常,对每一个页面使用相关连的枢纽字会进步你网站的排名。一个很重要的因素是你枢纽字冗余度,假如你一个枢纽字是一个字符,而你的 keyword标签中有100个字符,那么你枢纽字的冗余度就为1%。搜索引擎将会利用相关的算法对你的枢纽字冗余度进行统计你网页中的每一个重要的词或 短语。去除多余的枢纽字有利于进步你网站的排名。
基本搜索引擎优化策略:
为什么有的网站能在搜索引擎上排名很好,而有的却连找到找不到呢?这个秘密何在呢?正如免费搜索引擎上的指导方针所说,有五个因素你是必需铭记于心的:
1、 你网站的内容与主题。
2、 每页的枢纽字数。
3、 枢纽字放置的位置。
4、 点击量。
5、 链接数目。
1、搜索引擎优化策略:网站内容
网站的实际内容是SEO策略的一个重要的因素。假如你想让你的网站在搜索结果中排得靠前,在你的网站中必需有实际的内容。搜索引擎的蜘蛛基本上是一个 瞎 子。他们只能对你网页内容进行判定你网站的质量,而不能从图片、flash动画上判定。在所有的页面中有充足的内容给搜索引擎进行索引是一个成功搜索引擎 优化策略的基本需要。很轻易明白,为什么一个没什么内容的网站很难排上去。人们在查找信息的时候,老是但愿找到一个包括良多重要信息的网站。很天然,网页 内容丰硕的网站要比那些网页内容还那么丰硕的网站排名要好得多。每个为他们的网站进行优化的站长请牢记:不要健忘更新你的网站。不管是搜索引擎仍是访问者 都但愿看到比较新的信息。这是什么意思呢?这就要求你要收集大量的信息,专注于这领域的变化。
2、搜索引擎优化策略:枢纽字密度
枢纽字密度 (Keyword Density)是指在一个页面中,枢纽字(keyword)或枢纽字段(keyphrase)占所有该页面中总的文字的比例,该指标对搜索引擎的优化起 到枢纽的作用。为天然进步在搜索引擎中的 排名位置,您网站中页面的枢纽字密度不能过高,也不要过低,一般在 1% 到 7% 较为合适。假如要达到 1% 的比例,那么您在均匀100 个文字中最好包含 1 个枢纽字或枢纽字段,假如在 1000 个文字中仅仅只包含 1 个枢纽字或枢纽字段,那么枢纽字密度就被稀释了。记住,您千万别把所有的枢纽字或枢纽字段堆积在一起,要不搜索引擎将人为是一种恶意行为(Spam), 直接降低您网站的排名位置。
3、 索引擎优化策略:凸起枢纽字
在有价值的地方放置枢纽字,当你统计完你的页面需要多少个枢纽字后,接下来就是考虑把你的枢纽字放在网页的什么地方。凸起枢纽字是吸引搜索引擎留意的 一个 最重要的因素。搜索引擎将会专注于你网页中某一部门的内容,处于这一关注部门的词语显得比其他部门的词语要重要得多。这就是所谓的“凸起枢纽字”。
A: Title 和meta 标签:在上一节已经提到,title 标签是网页中最重要的标签。所以在title中放置枢纽字显得非常重要。有一些搜索引擎会额外的留意“描述”与“枢纽字”标签。
B: 标题(headings)
标题标签为你的访问者指明了哪些是网站中比较重要的内容。在“标题”标签中能泛起枢纽字对于进步你网站排名有很大的好处。
C: 超链接文本: 你链接到一个网页与你网站内容相关,这一想法主意长短常正常的事。这也是枢纽字在链接文本中为什么那么重要。
D: URL文本:在你的域名和你的网页中泛起枢纽字对于搜索引擎排名会产生很大的影响。这样的枢纽字被称为“URL文本”,在另一个网站与你网站建立链接时,尽量使用枢纽字作为链接文字,这有利于进步你网站的重要性,从而影响到PR。
E: 顶部:网页顶部的文本,每段开头的内容显得特别重要,所以,尽量在这些地方把枢纽字包含进来。