高权重域名

当前位置:   网站首页 >>seo教程

网站推广过程中收录减少的原因及解决方法

0条评论 3 ℃

很多人发现在网站推广过程中网站页面收录数量会出现减少的现象,其实这是跟网站自身因素和搜索引擎调整息息相关的。那么如何解决搜索引擎收录减少的问题呢?下面科泉网络给大家分析一下:
    首先是网站有作弊嫌疑:即堆积关键字、隐藏文字及交叉链接。发现后及时去除多余关键字,记住勿要刻意去堆积关键字。否则搜索引擎还有可能对你进行降权甚至其他“酷刑”
  
    然后是keywords区域堆积关键字:有些朋友盲目的将网站keywords区域堆积关键字,想当然的增加网站的曝光率。殊不知这样做其实是很忌讳的,keywords一般放置3个关键字左右就好,言简意赅,针对性强。  
    其次是网站近期动作过大:如改版即使是要改版,需要一步一步逐渐进行,这一过程以不让搜索引擎发现为最佳,分类标签等不要做大的变动。可以增加新的分类、标签,但对于老的内容,最好不要删除。
    第四点是外链:是不是你的外链一直在减少?或者外链中出现了被降权甚至被封的站点,那样很有可能你的站点遭受牵连,被搜索引擎当作从犯,从而降低信任或者不信任。因此定期的对你外链的质量进行过滤,长期降权的剔除,被K的站点立即删除链接,否则下一个可能会是你!   
    第五点是空间不稳定,服务器有作弊站点:蜘蛛来爬你的空间,多次打不开后,它可能会认为你的网站已经关闭了。有空要site一下同空间的其他站点有没有被搜索引擎降权或封掉,发现这样的站点就联合其他的站长向空间商理论去,别跟着做了冤死鬼。  
    第六点是内容质量:内容质量很关键,原创为主,如果你用了海量采集或者几乎都是采集来的内容,当搜索引擎发现你并非原创没有价值的话,很可能会逐渐的删除你的这些垃圾链接。必要的时候可以采集后进行伪原创了!
    第七点是网站安全隐患:站点里可能有恶意代码,当然可能是黑客所为,因此搜索引擎降低了你的信任度。所以定期保存数据是很重要的,及时发现,及时清除!
       
    第八点是其他不定因素:如算法改变等等,你受牵连。那这谁也无能为力,茫茫人海中选择了你。
  
    以上是科泉网络总结的为什么搜索引擎收录减少的数种原因,网站页面收录减少的朋友们,对照着分析自己站点的情况,加之改善。情况很快会好转;没有这类情况的朋友们,当以此为鉴,勿犯此类错误。

...

浅谈Google左侧排名

0条评论 49 ℃

Google左侧排名,主要是通过技术手段,提高网站在Google中的综合评分自然的获得较好的排名的。这里我们讲一下Google左侧排名技巧:
第一步:Google排名第一步要先了解Google排名的因素: Google排名因素据说超过300种,这个数据是一个国外的著名的SEO(搜索引擎优化研究)研究者提供的,不过我们必须研究那么深,因为我们祖先有句非常有道理的话是这么说的:万变不离其宗!
影响Google左侧排名因素主要有以下几条:
A: 网站结构:合理的网站结构可以让Google轻松搜索到你网站的大多内容,收录你大量的页面,更多的关注你这个网站。是排名很重要的一条因素。
B: 标签设计:搜索引擎都喜欢通过一些标签来认识网页,判断网页,Google也不见外。此条因素也非常重要。
C: PageRank:也就是常说的PR值。Google对网页的等级评分。是排名因素中的重中之中,下面会给大家详细谈一下。
D: 网站流量:网站流量越大,Google越关注,而且不光对你网站更新非常快,而且对排名的好处也是非常大的。
E: 其他因素:还有很多很多,这里就不列出来了,只要前面那四项我们想办法做好就OK。
第二步:优化网站:Google优化主要包括:网站结构优化,网站标签优化,网站页面优化,为的是让Google更容易搜索你的网站并且关注你想排的关键词。这里举个实际例子给大家谈:
A: 结构优化:让想GOOGLE收录你网站更多的网页,关键就是要让各个页面之间相互都有连接。另外最好再做一个详细的网站地图页面。例如:
各个页面之间的连接结构
   
网站地图
B: 标签设计:网页标签主要是两个标签,一个是网页标题,一个是简介标签,一个是关键词标签。标签中要适当的突出关键词。例如在Google中输入“电子商务”一次排名第一的网站首页标签是这么设计的:
电子商务指南是一个专业的电子商务交流学习站点,主要有以下栏目:电子商务新闻、电子商务研究、电子商务论文、电子商务法律、电子商务论坛。另外提供电子商务与网络营销咨询策划服务.。
电子商务
这三段标签要放在与之间
注:标题标签长度不可超过40个字符(20个汉字)为好。
注:简介标签要清晰明了的写出网页简介内容,另外突出关键词。不要过长和写与网页内容不相干的内容
注:关键词标签写太多容易被认为作弊,老实写出就OK,不要写与自己网页无关的词。
C: 网页优化:
首页:许多网站首页都是纯FLASH或者是一个图片,这样结构的网站很不合理,首页是一个网站的入口,起到的主要就是导航作用。首页最好一个清晰明了又有内容的页面。
另外,网页文本内容中要突出关键词,里面遇到的关键词可以用加粗。另外文本中有其他页面的关键词的话,可以将这个关键词加上超链接,导向相关页面。
注:每个网页突出的关键词越少越好,最好不要超过3个。另外,网页中的关键词的密度一定要把我好一个度,不要太低,也不高太高。一般在3%左右比较合适。
第三步:提高网站SEO的PR值. PR值是Google对网页的评分,主要根据网页之间的连接来计算:比如,A站有B站的连接,一个用户从A站点击B站在A站的连接进入B站,就表示A站投了B站一篇,将被GOOGLE记录。一个网页的外部连接越多,它的PR值就越高。
提高网页PR值主要有以下几中方法:
A: 和PR值高的网站做友情连接。
B: 登陆YAHOO, DMOZ 等许多网页目录。
C: 到一些自助连接站点登陆自己网站的连接。
D: 网站优化结构,让网站自身页面之间都有很好的连接。
第四步:提高网站流量:想让自己网站本身的流量越好越好,首先第一条就是要把网站自身内容做好,粘住浏览过你网站的客流,让他们第一次上你网站就记住你网站,并且下次需要相关信息了还会来你的网站。另外就是配合着做其他方面的推广。

...

浅谈网站效益转化率

0条评论 6 ℃

网站建设角度来说,用户体验及可信度建设是提高网站转化率的重要因素之一,让网站给人以信任感意味着网站更可能使你目标市场的消费者转化成为你的用户,吸引高质量链接以及更可能在新闻中被提及。
1、提高网站访问量搜索引擎是用户查找信息的首要手段,提高网站在搜索引擎的排名,可以带来更多的流量与潜在客户,因此基于搜索引擎的SEO优化就应运而生了。SEO优化是手段而不是目的,它解决的问题是提高网站的知名度与广度,为网站带来潜在客户。
特别需要强调的是,SEO能够很大程度的吸引更多潜在用户访问,而这个工作也仅仅是完成了网站效益转化的第一步,所以任何网站都千万不能为了纯粹的SEO而放弃网站自身定位和特点,这样只会让您得不偿失。
2、重点一:提高网站信任度中国的网站就是一大抄,你抄我,我抄你,不认真做就想靠网站赚钱,是没那么容易的,你否有正在为此困惑着呢?
网站设计和信任暗示是非常重要的,网站设计是最容易让用户谈论网站的一个话题,事实证明,网站设计的专业程度和企业VI形象的体现,是用户对网站信任度的第一印象,所以粗枝烂叶的网站或者抄袭的网站很难实现的网站效益转化。网站设计是否原创?网站设计是否能很好的体现企业形象?网站设计的易用性是否合理?是不是将一些重要信息放入了网站混乱的导航里面,不清晰的令人感到困惑的导航不容易使人产生信任。因此网站的设计是否原创而显得专业,从这表面现象可以对用户起到一定的暗示作用,从第一印象中建立网站的可信度。
3、重点二:以用户为中心如果你向网站访问者提供了他们所需要的信心、舒畅感、便利和合理价值,他们便会响应你的行动呼吁方案。网站转换战略都应关注如何方便、清晰、一致地满足访问者的需求,用户体验(UE)这块很重要。
消费者最关心什么问题?
用户如何更方便的找到自己想要的内容?
如何能主次分明的引导用户进行网站浏览?如何把重要的内容首先呈现给用户?
您产品的特色在哪里?您网站内容能够引起用户的注意和共鸣吗?
您的网站流程是否方便快捷,并能适合访问者或者订购者的习惯?
以用户为中心的网站体验设计,能够使用户充分的信任您,并产生购买欲望、甚至在线达成交易,往往这是网站效益转化最重要的一个环节。
4、完善网站在线服务和实时检控做好销售的临门一脚。很多的网站,都做得很精美,内容也是消费者所渴望和需求的,但是销售的临门一脚没做好,没有在最佳的时间内达成销售,很多的网友离开了页面,第二天他们找不到你的网站或者已经把你企业的名字已经忘却。
通过流量统计系统每天监测网站的访问量来源、搜索引擎及关键词统计,尤其google的流量统计工具将adwords关键词广告和网站流量分析都整合在一起。根据对这些数据的分析,我们可以获得不断优化改进网站的依据。
5、完善网站品牌建设任何一个品牌都可以分为2个方面:理性品牌方面和感性品牌方面。理性品牌体现主要在于满足用户需求,一个网站的理性特质主要有用户受益(用户在网站上能受益什么,如用户可以在新浪看新闻),解决方案(用户在平台上解决自己的问题,如通过搜索引擎搜索自己的想找的内容,在淘宝上买到自己的商品解决购物问题),强势企业品牌的影响(搜索选择百度,看新闻选择新浪,这些都是由企业的强势品牌作为基础,选择名牌当然是理性的选择)。
而感性品牌主要基于用户感情,通过情感投资,建立用户与网站的信任,呼唤感情,用心维护用户和网站的友谊,着力创建完美的用户体验。感性品牌的成长过程是缓慢的,需要与用户一起建立,所以感性品牌是用户认可的而非网站方面单一承担的。感性品牌体现的是品牌文化的核心,所以更容易引起平台和用户之间的共鸣。一旦感性品牌能够成功的打造,那么和用户之间将突破技术的隔阂,从使用用途,转化为享受过程。当消费者用理性分析筛选出质量用途体验等其他特质都不错的几种品牌之后,最终决定用户选择的就是基于感情因素了。如今网站内容同质化,功能相似化,用途相同化的环境很恶劣,单一通过理性角度来订制品牌战略更是难上加难。所以注重培养用户体验,加大感情投资,建设好品牌的感性方面是网站迫在眉睫的任务。

...

网络推广的注意事项

0条评论 11 ℃

1、不要用大量的图片组成首页
任何搜索引擎都喜欢主题突出,结构分明的网站,请不要用搜索引擎不知道的“皮”来铺盖你的网页。
 
2、不要去相信网络公司对你销售业绩的承诺
不要单纯相信网络公司对你销售业绩的承诺,你是传统行业也好,完全依靠网络销售也行,业绩的增长一定还有你们的汗水。要相信一点,信德很懂互联网,可你们很懂你们的产品/服务和定位,只有咱们相互取长补短,针对自己公司及行业的特性设计的整合化营销计划配合线下持久的服务支持和产品支持才能实现业绩目标。
 
3 、不要去作所谓的通用网址,那是用来骗不懂网络的人
一个网站80%的流量来源于搜索引擎,其他的20%则通过直接输入网址和导航网站的连接,用通用网址的人不到0.5%。因为3721网络实名的成功,通用网址只不过是想借中国互联网不成熟的时机捞一把而已。你懂网络吗?懂就不要用通用网址。
 
4、不要被中搜的廉价垃圾服务所骗,很值白的说,中搜不是搜索引擎,因为没有流量,很多个人网站的流量都要比他大的多,最关键还是技术问题一直没有很好的解决。
 
5 、要期望用垃圾邮件来推广你的网站
如今没有人不讨厌垃圾邮件,因为它已经给人们的工作带来了很多负面影响,会阅读垃圾邮件的几率不到千分之一,更不会去考虑你的服务和产品了。很影响企业形象。
 
6、不要去作第一页以后的广告
如果热门关键词做不了前三页,那么可以考虑精准关键词和长尾关键词。请注意,流量很重要,排名很重要,客户转化率也很重要!
 
7、为难那些电子商务师,他们心有余而力不足
很多公司为了追赶电子商务浪潮,专门找一个学习电子商务专业的学生或者是一个对网络了解的人,希望可以不再花其他的钱,来成功运行公司网站,最终使网站盈利。千万不要为难那些电子商务师,他们也想把公司网站运作好,但是他们本身那也不是很懂。他们只能来维护你的网站。

...

网站更新频率如何把握

0条评论 12 ℃

最近有很多人说起这个问题,发现更新频率较快的网站很容易出问题,其他更新较慢的相反没什么问题。所以控制好自身网站的更新节奏。不要被误认为采集。有的时候我们的网站内容明明被百度收录了,可是从百度来的IP就没有见长。对此也教你一个方法,这个方法也是我从别人那看来的。就是利用百度的中文搜索风云榜,在你的网站里发布一些内容,内容的标题必须包含风云榜里的关键字,这样一来,你的网页被用户搜索到的概率就大多了,也许你会问,其他的网站的网页也有这样的关键字,百度和google都是根据关键字来列出目录的,你输入一个关键字,与该关键字吻合而且数量又多的话,那么就会排在前面,所以你在网页标题里放上关键字后,你还应该在网页的第一段多放上几个关键字,因为搜索引擎列出的目录是以网页标题和网页开头内容结合的。比如, “同命鸳鸯”在风云榜中是个热门的关键字,排名比较靠前,这个时候我就写了《同命鸳鸯的命运该如何掌握——求职信和简历》,合理的再内容里面添加了同命鸳鸯一词。在增加内容的同时一定要记住增加的网页内容是和你的站点里的栏目相关,如果你在一个招聘栏目里,增加一些以***为关键字的网页,那么你会被你的用户骂,而且百度会怀疑你作弊,这样一来就得不偿失了。

...

网站推广的几种基本方式

0条评论 3 ℃

今天来说下网站推广的几种基本方式。科泉网络认为,要想把推广工作做好,不能只懂得务实,以为成天闷头干活就成了;一定要对整个市场推广有个宏观的认识,只有理论结合实际,才能把工作做的更好,才能进步的更快。言归正转,下面说一下市场工作方式的一些认识。
一、按范围分
1、对外的推广
  顾名思义,对外推广就是指针对站外潜在用户的推广。主要是通过一系列手段针对潜在用户进行诉求,以达到增加网站PV、IP、会员数或收入的目的。我们做的推广基本上都是对外推广。
2、对内的推广
  和上面相反,对内推广是专门针对网站内部的推广。比如如何增加用户浏览频率、如何激活流失用户、如何增加频道之间的互动等。以友答网举例,其旗下有几个不同域名的网站,如何让这些网站之间的流量转化、如何让网站不同频道之间的用户互动,这些都是对内推广的重点。
  很多人忽略了对内推广的重要性,其实如果对内推广使用得当,效果不比对外推广差。毕竟在现有用户基础上进行二次开发,要比开发新用户容易的多,投入也会少很多。
二、按投入分:
1、付费的推广
  就是需要花钱才能进行的推广。比如各种网络付费广告、竞价排名、杂志广告、CPM、CPC广告等。做付费推广,一定要考虑性价比,即使有钱也不能乱花,要让钱花出效果。
2、免费的推广
  这里说的免费推广是指在不用额外付费的情况下(雇兼职除外)就能进行的推广。这样的方法很多,比如论坛推广、资源互换、软文推广、邮件群发等。随着竞争的加剧、成本的提高,各大网站都开始倾向于此种方式了。
三、按渠道分
1、线上的推广
  指基于互联网的推广方式。比如网络广告、论坛群发等。现在越来越多的传统企业都开始认可线上推广这种方式了,和传统方式比,其性价比非常有优势。
2、线下的推广
  指通过非互联网渠道进行的推广。比如地面活动、户外广告等。由于线下推广通常投入比较大,所以一般线下推广都是以提升树立品牌形象或是增加用户粘性为主,如果是为了提升IP或是PV,效果不一定很好,要慎重考虑。
四、按手段分
1、常规手段
  是指一些良性的、非常友好的推广方式。比如正常的广告、软文等。不过随着竞争的加剧,这种方式的效果越来越不明显了,通常需要开发新的发法,或是在细节上狠下功夫才能达到更好的效果。
2、非常规手段
  就是指一些恶性的、非常不友好的方式。比如群发邮件、骗点、恶意网页代码,甚至在软件里插入病毒等。通常这种方法效果都奇好,但对于品牌形象可能会有负面影响,所以使用时,要把握好尺度。对于一些特别恶性的,尽量不要用。
五、按目的分
1、品牌推广
  以建立品牌形象为主的推广。这类推广一般都用非常正规的方法进行,而且通常都会考虑付费广告。
2、流量推广
  以提升流量为主的推广。在流量面前,大部分网站都不得不低下高贵的头,现在大家基本上什么方法都用,我们的口号是:没有不敢使的招,只有想不到的招。
3、销售推广
  以增加收入为主的推广。通常会配合销售人员来做,具体情况具体对待,这里就不多说了。
4、会员推广
  以增加会员注册量为主的推广。一般大家都以有奖注册,或是其它激励手段为主进行推广。没办法,现在的用户太现实了,没好处,不会揍你场。
5、其它推广
  其它一些项目、或是细节的推广。比如某个具体活动等,就不具体举例了。

...

什么样的网站才算成功

0条评论 12 ℃

流量、电话量、业务量是三个相关的检验企业网站成败的重要指标。
一、流量
网站流量是企业网站建设好后要跨越的第一到门槛。没有流量的网站怎么精美、怎么功能强大都是失败的。我们通过一些专业的网站流量监测分析工具,发现90%的企业网站的每天流量停留在10次以下。一般认为,这样的企业网站是没有达到建站的目的。换句不客气的话,假如排除网站特殊的用途,建站的费用是白花的。解决方法:网站推广。目标:100次/天。
有些企业的网站流量每天能在100次左右。根据不完全统计,达到这样流量的网站一般都可以收回建站投资或者2倍左右的回报。
我们也有部分客户的每天网站流量达到1000次左右,他们一般都是做网站建设与推广方面做得很成功了。业务主要来源也就是互联网了。
每天1万次、10万次、100万次、1000万次、1亿次那分别是大企业、网络公司、行业门户、综合门户、搜索公司的目标了。
二、电话量
客户从网上找到您的网站,也有意选择您的产品或者服务。一般会打电话与您联系。当然也包括电子邮件、网上订单、留言、传真等多种渠道。为了形象描述的方便,我们就统称电话量吧。
电话量的多少验证了您的产品或者服务被市场接受的程度,反映了您的网站被客户认可的程度,也说明了您的网站推广的力度。所以,有很多询问的电话、邮件、传真,就说明以上三条做得很好。一般每20~100次流量会有1个电话量,具体因不同的行业有所差异。
假如,网站流量很高,就是没有电话咨询,那就需要检查网页设计是否合理,提供的产品或者服务的价格是否不合适,网站的可信度是不是有什么问题。解决了这些问题,电话量一定会上去的。
三、业务量
企业投资建设一个网站,我们认为主要是想通过网站宣传自己的企业和获得更多的商业机会。不论通过什么方式,只要企业通过自己的网站获得成交的业务多了。这是一个企业成功网站的最高标准。也是我们建设网站的根本目标。一个企业本身有很多获得业务的渠道,像广告宣传、公关活动、口碑传播、客户推荐、熟人介绍、网络推广等等。识别业务来源的最简单的办法就是在与客户签约时,不经意地问一句:“能为您提供服务,我们真的很荣幸!您是怎样找到我们的呀?”客户说:“网上”。那就是互联网的功劳了啊。
一般每3-10个电话就能成功一单业务。不能达到这个比例就应该检查回复客户的咨询是不是有什么不妥,网站上的宣传是不是与现实有很大的出入。
作为企业的领导者需要对企业业务来源进行统计,网络业务来源最多,那就需要重视互联网的投资和关注其效果。假如目前还没有通过网络来源的业务,看看同行有没有通过网站获得业务。同行假如有很多业务来源于互联网,而自己的公司没有。那就立即委托专门的网络服务商建立自己的企业网站。

...

网站不是放在网络上摆设

0条评论 8 ℃

链接总打不开,新闻是几年前的旧闻,产品更新滞后……本是作为宣传窗口和营销通道的企业网站,却有很多形同虚设。
调查显示:有高达74.3%的企业网站不能有效吸引客户。网站变成了企业的一种摆设和花瓶。不少网站看起来花里胡哨,但有效的产品信息却很少,甚至企业联系方式等重要信息都找不到。由于这些企业在网站建设方面存在诸多误区,盲目跟风,浪费了很多人力和物力,也使网站丧失了的营销功能。
不仅网站被当成摆设,还缺乏必要的网络推广手段,导致潜在客户白白流失。很多企业信奉“酒香不怕巷子深”,轻视网络推广,在网站建成之后就守株待兔,不采用任何推广措施。殊不知,不进行推广的网站,好比在信息之海中的孤岛,没有人知道它的存在,更别提是否会给企业带来任何销售收入。
为帮助企业走出网站建设及网络营销误区,科泉网络络为您介绍了网站建设和网络营销的理念和实战,帮助您了解网站对企业产生的重大影响。通过这些优秀企业网站的现身说法,为您展示网络营销为企业所带来的巨大成功。
科泉网络衷心地每一位客户都能通过网站制作、网站优带来更多的效益,为你介绍成功的网站建设思路和经验,并期待与您作进一步的沟通与合作,希望与您携手步入企业成功的营销之道。

...

企业网站为什么要重视网站优化

0条评论 8 ℃

根据多年的互联网从业经验来看,发现我们很多企业网站建站后,很少及时更新维护,更不做专业的优化,也很少做推广。得使网站的排名很靠后,进而访问很低,使网站得不到应有的推广作用和营销效果。这是相当的资源浪费。
   企业在网上建立了自己的网站,如何让更多您的用户和合作伙伴知道,这就网站推广的意义所在。在网络经济与电子商务迅猛发展的今天,很多企业都认识到了建立 企业站点的必要性。但是企业网站建好以后,如果不进行推广,那么企业的产品与服务在网上就仍然不人所知,起不到建立站点的作用,所以企业在建立网站后即应 着手利用各种手段推广自己的网站。
   从易用性来说:最早的网站可能存在每当主流浏览器升级时,刚刚建立的网站就可能过时,我们就需要升级或重新建造一遍网站;为了使网站兼容Netscape和IE,网站不得不为这两种浏览器写不同的代码;每当新的网络技术和交互设备的出现,我们也需要制作新版本来支持这种新技术或设备,如支持手机上网的WAP技术;网站代码臃肿浪费了大量带宽;不易用的代码,残障人士无法浏览网站等等的问题,这是一种恶性循环,是一种巨大的浪费。

...

谷歌的搜索排名算法

0条评论 4 ℃

图书馆管理员们提出最多的问题之一是:“对于什么样的结果应该位于搜索列表的最上方,Google是如何选择的?”现在品质工程师马特-卡兹介绍了快速入门的知识,解释了Google是如何在网上爬行和索引,以及如何评定搜索结果等级的。马特也向学校图书馆管理员提出建议,告诉他们如何辅导学生。
爬行和索引
在你浏览包含了Google搜索结果的网页之前,要发生很多事情。首先是在万维网数以十亿计的网页上爬行和索引,这个工作是由Googlebot完成的,它负责与全球的网络服务器连接以收集文件。爬行不是真的在网上漫游,而是访问网络服务器返回到一个特定的网页上,接着扫描该网页建立超链接并为每一个网页编上号码。爬行可收集大量的文件,但这些文件还不能直接用于搜索。
如果没有索引,在你想查询如“civil war”(南北战争)等内容时,Google的服务器将不得不在你每次搜索时阅读每一份文件的内容。因此第二个步骤是要建立一个索引,这样就需要“转换”爬行所获得的数据。为了不必在每一份文件上扫描每一个单词,就需要在数据上做些文章,以便显示包含了特定单词的所有文件。例如,假设单词“civil”在编号为3、8、22、56、68和92的文件上出现过,而单词“war”出现编号为2、8、15、22、68和77的文件上。
一旦建立了索引,就开始对文件进行等级评定并确定它们的相关性。假如某个人上Google搜索并输入“civil war”,为呈现和评价搜索结果需要做两件事:一是查找包含了用户提问的网页;二是按照相关性排定匹配网页的位置。Google已经开发出一个有趣的技术可加速第一步骤的过程:不是将所有索引存储在一台电脑上,而是使用数百台电脑做这种工作。由于任务被分配到很多电脑上,使得查询答案更为迅速。
为更加形象地描述这个过程,可以设想下一本30页厚书的索引。如果一个人在索引中查找数页的信息,那么每一次搜索都至少需要花几秒钟的时间;但如果你将索引的每一页分给不同的人去查找呢?三十个人分别查找索引的不同部分,要比一个人独自查找快的多。同样,Google也是将数据分配到各台电脑上以便可以更快地查找文件。
如何查找包含了用户提问的网页?让我们返回到上面举的“civil war”例子。单词“civil”在编号为3、8、22、56、68和92的文件上,单词“war”在编号为2、8、15、22、68和77的文件上,我们可以在网页上显示文件并寻找包含两个单词的文件(从下表中可以看出是8、22和68号文件)。
单词civil 3 8 22 56 68 92
单词war 2 8 15 22 68 77
两个单词都出现 8 22 68
包含了一个单词的文件列表被称为“文件标识列表”,查找包含两个单词的文件被称为“文件标识列表的交集”。
评定搜索结果
有了包含用户提问的网页后,就该按照相关性评定网页了。Google使用了很多技术,其中PageRank算法是最有名的。PageRank评定的是两种事情:从网站到某一网页有多少个链接,提供链接的网站的排名。使用PageRank,来自CNN和纽约时报网站的链接的价值,是很多不太有名网站的两倍。
除了PageRank外Google还使用了很多其他技术,例如一份文件所包含的“civil”和“war”两个单词靠的很近,就比只使用了“war”单词的包含“Revolutionary War”(独立战争)的文件相关性要大的多。另外在题目中出现了“civil war”的网页,它的相关性就比题目为“19th Century American Clothing”(19世纪的美国服装)要重要的多。同样如果“civil war”在网页上出现了数次,比出现一次的网页要相关的多。
Google的目的是要找到知名度和相关性都大的网页。如果两个网页出现匹配提问的信息数量几乎一样,我们常常会选择更有名网站的链接。但如果其他方面表明一个网页更为相关,也会选择更少链接或更低排名的网页。例如,一个网页全篇都是讲“南北战争”的内容,会比只是略微提到“南北战争”的网页更为有用,即使这个网页是出现不太有名的网站上。一旦我们有了文件的列表和分值,就会选择最高分值、最匹配的文件。
Google从包含了提问单词的每一份文件中提取几句话作为摘要显示,接着将排好的URLs和摘要显示在搜索结果上。正如你所知道的运行一个搜索器需要大量的计算资源。每一次搜索需要500台以上的电脑一起工作,搜索的时间还不到半秒钟

...