1990年,加拿大蒙特利尔大学学生Alan Emtage发明了Archie程序,成为现代意义上搜索引擎的先驱;1994年7月20日,美国卡内基梅隆大学的Michael Mauldin创建了最早的搜索引擎Lycos;1994年,美国斯坦福大学电机工程系博士生大卫·费罗(David Filo)和美籍华人杨致远(Gerry Yang)创办了超级目录索引雅虎;1997年9月15日,美国斯坦福大学博士生Sergey Brin和Larry Page注册了Google.com的域名,从此创造了一个网络奇迹;1998年,美国知名搜索引擎Overture首创“Paid placement”(竞价排名)模式,催生了搜索引擎竞价行业的蓬勃发展;1999年年底,留美博士李彦宏及其好友徐勇博士成立百度;2008年年初,微软提出收购雅虎,5月份突然放弃收购计划。
☆ :Google是互联网上最流行的搜索引擎,目前Google每天处理的搜索请求已达2亿次,而且这一数字还在不断增长。Google数据库存有42.8亿个Web文件,属于全文(Full Text)搜索引擎,是一个用来在互联网上搜索信息的简单快捷的工具。
☆ :Live Seach是微软投入巨资开发的一款功能强大的新一代智能搜索引擎,比以往的MSN 搜索更为先进,可帮助您通过计算机或移动设备快速、准确、全面的查找所需内容。
☆ :百度支持搜索1.3亿中文网页,是世界上最大的中文搜索引擎。并且百度每天都在增加几十万新网页,对重要的中文网页每天进行更新,用户通过百度搜索引擎可以搜到世界上最新、最全的中文信息。
☆ :雅虎搜索是全球第一家提供互联网导航服务的网站,不论在浏览量、网上广告、家庭或商业用户接触面上,Yahoo.com都居于领导地位,在全球消费者品牌排名中位居第38位。
☆ :搜狗搜索是搜狐推出的完全立足于自主技术开发的全球首个第三代互动式中文搜索引擎,同时它还是一个具有独立域名的专业搜索网站。
☆ :新浪搜索引擎爱问采用了目前领先的智慧型互动搜索技术,它以一个独有的互动问答平台弥补了传统算法技术在搜索界面上智慧性和互动性的先天不足。
☆ :有道搜索是网易结束与谷歌的合作后,自行研发的搜索引擎,是网易的核心业务板块之一,与网易的各项优势产品紧密融合。
☆ :腾讯搜搜目前主要包括问问、网页搜索、综合搜索、图片搜索、音乐搜索以及搜吧等16项产品,通过网页、音乐、图片等搜索功能寻找海量的内容信息,为广大用户提供实用和便利的搜索服务,并结合腾讯特色优势来满足互联网用户多样化搜索服务需求。
☆ :中国搜索(原慧聪搜索)是国内领先的搜索引擎公司。自2002年正式进入中文搜索引擎市场以来,在一年多的时间里,发展成为全球领先的中文搜索引擎公司,先后为新浪、搜狐、网易、TOM等知名门户网站提供搜索引擎技术。
测评环境:

技术简介:
搜索引擎的技术:主要包括网页数据的快速采集、海量数据的索引存储、搜索结果的相关性排序、搜索效率的毫秒级要求、分布式处理和负载均衡、自然语言的理解技术及各种算法等等。这些都是实现搜索引擎不可缺少的技术。另外对于搜索引擎来说,整个系统的架构设计也是不可缺少的重要方面。
就搜索引擎而言,目前主要分为三个类型:
1:全文检索搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google (http://www.google.com/) 、yahoo(http://search.yahoo.com/) 、AllTheWeb (http://www.alltheweb.com/) 等,国内著名的有百度(http://www.baidu.com/)、中搜(http://www.zhongsou.com/)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,这也是目前常规意义上的搜索引擎。
2:目录搜索引擎
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词查询,仅靠分类目录也可找到需要的信息。国外比较著名的目录索引搜索引擎有yahoo(http://www.yahoo.com/)Open Directory Project(DMOZ)(http://www.dmoz.com/)、LookSmart(http://www.looksmart.com/)等。国内的搜狐(http://www.sohu.com/)、新浪(http://www.sina.com/)、网易(http://www.163.com/)搜索也都具有这一类功能。
3:元搜索引擎
元搜索引擎在接受用户查询请求时,同时在其它多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有Dogpile(http://www.dogpile.com/)、Vivisimo(http://www.vivisimo.com/)等,国内元搜索引擎中具代表性的有搜星搜索引擎(http://www.soseen.com/),优客搜索(http://www.yok.com/)。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
下面小编将主要针对全文检索搜索引擎的系统架构进行说明。
搜索引擎的系统架构(实现原理)主要可以分成四步:
1:从互联网上抓取网页
利用能够从互联网上自动收集网页的“网络蜘蛛程序”,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,反复循环,直到把爬过的所有网页按照设定的规则收集到服务器中为止。
2:建立索引数据库
由索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
3:在索引数据库中搜索
当用户输入关键词搜索后,分解搜索请求,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。
4:对搜索结果进行处理和排序
所有相关网页针对该关键词的相关信息在索引库中都有记录,只需综合相关信息和网页级别形成相关度数值,然后进行排序,相关度越高,排名越靠前。最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
如何评测:
对于搜索引擎来说,小编并不是专家,也是不是学者,而更多的是站在一个用户的角度去实际的体验和感受。如果用业术语讲就是:查准率、查全率和搜索速度(耗时);通俗的说就是:快、全、准。其中最易达到的是搜索速度,对于搜索耗时在1秒以下的系统来说,用户已经很难辨别其快慢了。因此,对搜索引擎的评价就集中在了准和全。而对于中文搜索引擎的“准”,需要保证搜索的前几十条结果都和搜索词十分相关,这需由“分词技术”和“排序技术”来决定;中文搜索引擎的“全”则需保证不遗漏某些重要的结果,而且能找到最新的网页,这需要搜索引擎有一个强大的网页收集器(即蜘蛛程序)。总之对于此篇评测小编将偏重于从实用的角度而非技术面去探讨。
评测开始:
搜索引擎界面:

对于以上评测的九款搜索引擎来说,绝大多数的界面都非常简洁,易于操作,同时也非常的相似,主体部分都包括一个长长的搜索框,外加搜索按钮及LOGO。其中雅虎和爱问的界面稍显复杂;Live Search的LOGO标志不够醒目,而中搜搜索引擎则是直接被嵌入到中搜网首页上端。
主要搜索服务种类:

对于搜索服务种类的支持,google总体表现还是非常出色,而其最具特色的是已经可以支持13种非HTML文件的搜索。除了PDF文档,Google现在还可以搜索Microsoft Office (doc, ppt, xls, rtf)、Shockwave Flash (swf)、PostScript (ps)和其它类型文档;
Live Search总体表现也还可以,但总的来说,支持的搜索服务种类还不是太多;
Baidu的表现可以说是非常出色,它的最大特色就是搜索服务更加的细分,包含的种类更多,是其它任何一款搜索引擎都无法比拟的;
Yahoo对于主要搜索类别的支持不是太好,没有太多的特色;
Sogou总体表现还是比较不错,但特色不强;
iAsk总体表现不错,其最具特色的搜索服务种类有两个,一是:爱问知识人可以快速准确的回答用户提出的各种问题;二是爱问专业搜索包含了29个行业信息中心、360家专业资讯服务商、5980个权威数据库的专业资料的搜索;
Youdao表现一般,没有什么特色之处;
Soso表现还可以,如果说特色,那就是对QQ自身产品搜索的支持;
Zhongsou表现一般,没有太多的特色;
注意:
1:新浪iAsk及腾讯Soso对于网页的搜索功能,都是由Google提供的;
2:对于打叉的选项并不是表示某种搜索引擎不能搜索此种资源,而只是说明它没有提供对此种资源的专业查询支持;
平均搜索速度(耗时):
【对于搜索速度的测试,小编分别以周一和周日的早中晚为测试区间,取其平均值】

对于以上九大搜索引擎来讲,它们的搜索速度都很快,几乎没有什么差别。
搜索结果显示:(针对网页搜索)

对于搜索结果的显示,以上各款搜索引擎总体表现都不错,但也比较相似,搜索结果主要包括标题、摘要内容、网址、快照及类似页面等。其中Yahoo及iAsk的网页搜索结果都添加了具体的时间说明,并精确到了小时,而中搜对于搜索的结果可以直接查看其网站排名,yahoo、搜狗、soso及中搜在搜索结果中的显著位置都包含了广告链接,让用户感觉很讨厌。
【由于搜索的种类不同,返回的结果众多,只能对用户最常使用的的搜



