本文目录一览:
- 1、中文搜索引擎的发展历史
- 2、搜索引擎的发展史
- 3、搜索引擎优化的发展历史
- 4、简述:"搜索引擎发展历史"
中文搜索引擎的发展历史
1996年8月成立的搜狐公司是最早参与作网络信息分类导航的网站,1998年2月,搜狐推出分类目录搜索引擎.是当年Yahoo!的中国版.2000年7月12日,搜狐公司在美国纳斯达克挂牌上市(NASDAQ:SOHU),之后努力在门户方向发展。
1997年6月创立的网易,也推出全中文搜索引擎目录,但并不是主服务。
之后经过几次升级先后使用Google.baidu的后台搜索技术,但是网易还是拥有目前中文唯一的开放式目录体系ODP,2000月6月,网易在美国纳斯达克股票市场挂牌交易(NASDAQ:NTES)。
1997年10月29日北大天网正式在CERNET(教育科研网)上提供服务, 由北大计算机系网络与分布式系统研究室开发,有强大的ftp搜索功能。
1998年1月,台湾中正大学吴升教授所领导的GAIS实验室创立了Openfind中文搜索引擎,是最早开发的中文智能搜索引擎,采用GAIS实验室推出多元排序(PolyRankTM)核心技术.
1999年2月2日,新浪网开始推出新一代中文搜索引擎“新浪搜索”(SinaSearch)测试版,并于10月9日,推出了高级搜索,网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。
2000年4月,新浪网在美国NASDAQ上市(NASDAQ:SINA)。
2000年11月1日,新浪又正式推出国内第一家综合搜索引擎,即1此搜索可对多个数据库发出请求,在关键词的查询反馈结果中,同一页面上包含目录、网站、新闻标题、新闻全文、频道内容、网页、商品信息、消费场所、中文网址、沪深行情、软件、游戏等各类信息的综合搜索结果,可选择自主切换。
1999年9月,雅虎中国网站(yahoo)正式开通,继承了雅虎全球的分类目录搜索的基因,为中国互联网用户提供了强大的搜索功能。
1999年5月,hao123网之家成立,遵循简单,直接分类模式,成为万千网民上网必备利器.04年8月被百度收购.
1999年底成立于美国硅谷百度(Baidu,Inc)以超链分析技术为基础,推出新一代中文搜索引擎,2003年11月,百度推出全新基于社区化搜索概念的搜索产品贴吧;2005年8月5日,百度赴美上市成功。
2000年9月12日,Google也开始启用中文搜索服务。
之后中文版的各种软件和功能在快速升级中.
2002年9月25日,由中国网、慧聪国际等共同打造的中国搜索联盟,为门户提供搜索技术,03年8月推出搜索门户,命名为中国搜索.
2004年6月雅虎推出全新“一搜”,这是雅虎十年历史上首个专业搜索网站。
它与其网络实名、雅虎门户搜索一起构成了中国搜索市场上的“雅虎搜索系”。
说名雅虎在非常注重中文市场,也很注重技术本土化。
2004年8月3日搜狐公司推出的完全自主技术开发的搜狗(sogou)互动式中文搜索引擎。
以给予多个主题的“搜索提示”,帮助用户查询过程中,有效的人机交互,引导用户更快速准确定位自己所关注的内容,用户快速找到相关搜索结果。
2005年6月30日,新浪搜索引擎推出“爱问”(iAsk)专门搜索平台,这是1款新浪自主研发的搜索产品。
中文搜索发展到今天的地步,无论从产业角度还是从产品角度来看,都还有差距,看看国际搜索巨头们的前半年的收购轨迹, 也许你就会发现,搜索无定型,不要说搜索引擎就是要能搜索,他也可以是互动的如百度贴吧,也可以使资源的如图片搜索mp3搜索,发展史就是迎合用户需求不断的完善和扩张史.
Google, 3月份收购Urchin 网站信息分析公司, 5月份,收购手机社交网Dodgeball,
Yahoo!, 收购Konfabulator桌面软件,参股alibaba.
某些时间参考了搜索引擎十年有多少故事,如果想看看这些网站当年都是什么样子可以到web.archive去察看,当年的搜狐SOHOO,网易ease,新浪前身SRSNet等他们的域名都是跟现在不1样的.
PS,只是以大企业为标杆简单记录下,如要严格考证其实这中间也有N多花絮,诸如北极星,search163的分类目录,goyoyo的搜索,chinaren的智能搜索孙悟空等。
参考:中文搜索引擎史记
://loverty/2005/08/blog-post_14.
搜索引擎的发展史
搜索引擎的发展史和应用
1990年以前,没有任何人能搜索互联网.
1990年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出Archie.当时,万维网(World Wide Web)还没有出现,人们通过FTP来共享交流资源.Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件. 用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件.虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源,建立索引,提供检索服务.所以,Archie被公认为现代搜索引擎的鼻祖.
Robot(机器人)一词对编程者有特殊的意义.Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序.由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider程序.
1993年Matthew Gray开发了 World Wide Web Wanderer,这是第一个利用HTML网页之间的链接关系来检测万维网规模的"机器人(Robot)"程序.开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址(URL).
1994年4月,斯坦福大学(Stanford University)的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo.随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索.因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录.雅虎于2002年12月23日收购inktomi,2003年7月14日收购包括Fast和 Altavista在内的Overture,2003年11月,Yahoo全资收购3721公司.
1994年初,华盛顿大学(University of Washington )的学生Brian Pinkerton开始了他的小项目WebCrawler.1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容.WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字.
1994年7月,卡内基·梅隆大学(Carnegie Mellon University) 的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos.除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量.
1994年底,Infoseek正式亮相.其友善的界面,大量的附加功能,使之和Lycos一样成为搜索引擎的重要代表.
1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup).用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果, 集中起来处理后再返回给用户.第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler.
1995年12月,DEC的正式发布AltaVista.AltaVista是第一个支持自然语言搜索的搜索引擎,第一个实现高级搜索语法的搜索引擎(如 AND, OR, NOT等).用户可以用AltaVista搜索新闻组(Newsgroups)的内容并从互联网上获得文章,还可以搜索图片名称中的文字,搜索 Titles,搜索Java applets,搜索ActiveX objects.AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线.AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站.在面向用户的界面上,AltaVista也作了大量革新.它在搜索框区域下放了"tips"以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能.这系列功能,逐渐被其它搜索引擎广泛采用.1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的.
1995年9月26日,加州伯克利分校助教Eric Brewer,博士生Paul Gauthier创立了Inktomi,1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前.声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容.HotBot也大量运用cookie储存用户的个人搜索喜好设置.
1997年8月,Northernlight搜索引擎正式现身.它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News,7,100多出版物组成的Special Collection,良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类.
1998年10月之前,Google只是斯坦福大学(Stanford University)的一个小项目BackRub.1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了google.com的域名,1997年底,在Sergey Brin和Scott Hassan,Alan Steremberg的共同参与下,BachRub开始提供Demo.1999年2月,Google完成了从Alpha版到Beta版的蜕变.Google公司则把1998年9月27日认作自己的生日.Google以网页级别(Pagerank)为基础,判断网页的重要性,使得搜索结果的相关性大大增强.Google公司的奇客(Geek)文化氛围,不作恶(Don't be evil)的理念,为Google赢得了极高的口碑和品牌美誉.2006年4月,Google宣布其中文名称"谷歌",这是Google第一个在非英语国家起的名字.
Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品.1999年5月,发布了自己的搜索引擎 AllTheWebi.Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之.Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索,图像搜索,视频,MP3,和FTP搜索,拥有极其强大的高级搜索功能.(2003年 2月25日,Fast的互联网搜索部门被Overture收购).
1996年8月,sohu公司成立,制作中文网站分类目录,曾有"出门找地图,上网找搜狐"的美誉.随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应.sohu于2004年8月独立域名的搜索网站"搜狗",自称"第三代搜索引擎".
Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室.Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪,奇摩,雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分.2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域.
2000年1月,两位北大校友,超链分析专利发明人,前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度 (Baidu)公司.2001年8月发布Baidu.com搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索.Baidu搜索引擎的其它特色包括:百度快照,网页预览/预览全部网页,相关搜索词,错别字纠正提示,mp3搜索,Flash搜索.2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快.后推出贴吧,知道,地图,国学,百科等一系列产品,深受网民欢迎.2005年8月5日在纳斯达克上市,发行价为USD 27.00,代号为BIDU.开盘价USD 66.00,以USD 122.54收盘,涨幅353.85%,创下了5年以来美国股市上市新股当日涨幅最高纪录.
2003年12月23日,原慧聪搜索正式独立运做,成立了中国搜索.2004年2月,中国搜索发布桌面搜索引擎网络猪1.0,2006年3月中搜将网络猪更名为IG(Internet Gateway) .
2005年6月,新浪正式推出自主研发的搜索引擎"爱问".
搜 索 引 擎 分 类
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine),目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine).
全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有 Google,Fast/AllTheWeb,AltaVista,Inktomi,Teoma,WiseNuti等,国内著名的有百度(Baidu). 它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎.
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称"蜘蛛"(Spider)程序或"机器人" (Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎.
目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已.用户完全可以不用进行关键词(Keywords) 查询,仅靠分类目录也可找到需要的信息.目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎.其他著名的还有Open Directory Project(DMOZ),LookSmart,About等.国内的搜狐,新浪,网易搜索也都属于这一类.
元搜索引擎
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户.著名的元搜索引擎有 InfoSpace,Dogpile,Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎.在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo.
除上述三大类引擎外,还有集合式搜索引擎,门户搜索引擎,免费链接列表等几种非主流形式:
由于上述网站都为用户提供搜索查询服务,为方便起见,我们通常将其统称为搜索引擎.
几种搜索引擎的特点
百度搜索引擎的特点
百度搜索引擎使用了高性能的"网络蜘蛛"程序自动的在互联网中搜索信息,可定制,高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息.百度在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆,香港,台湾,澳门,新加坡等华语地区以及北美,欧洲的部分站点.百度搜索引擎拥有目前世界上最大的中文信息库,总量达到6000万页以上,并且还在以每天几十万页的速度快速增长.由于后台应用了高效的信息索引算法,大大提高了检索时的响应速度和承受大访问量时的稳定性,百度搜索引擎对超过6000万网页检索一次的本地平均响应时间小于0.5秒.
它主要具有以下的特点和功能:
1)基于字词结合的信息处理方式.
2)支持主流的中文编码标准.
3)智能相关度算法.
4)检索结果能标示丰富的网页属性(如标题,网址,时间,大小,编码,摘要等),并突出用户的查询串,便于用户判断是否阅读原文.
5)百度搜索支持二次检索(又称渐进检索或逼进检索).
6)相关检索词智能推荐技术.
7)运用多线程技术,高效的搜索算法,稳定的UNIX平台,和本地化的服务器,保证了最快的响应速度.
8)可以提供一周,二周,四周等多种服务方式.可以在7天之内完成网页的更新,是目前更新时间最快,数据量最大的中文搜索引擎.
9)检索结果输出支持内容类聚,网站类聚,内容类聚+网站类聚等多种方式.
10)智能性,可扩展的搜索技术保证最快最多的收集互联网信息.
11)分布式结构,精心设计的优化算法,容错设计保证系统在大访问量下的高可用性,高扩展性,高性能和高稳定性.
12)高可配置性使得搜索服务能够满足不同用户的需求.
13)先进的网页动态摘要显示技术.
14)独有百度快照.
15)支持多种高级检索语法,使用户查询效率更高,结果更准.
Google搜索引擎特点
Google搜索引擎是一个利用蜘蛛程序(Spider)以某种方法自动地在互联网中搜集和发现信息,并由索引器为搜集到的信息建立索引,从而为用户提供面向网页的全文检索服的互联网信息查询系统.
它主要具有以下的特点和功能:
1)采用了先进的网页级别(PageRankTM)技术.
2)在同一个界面下,用户可以定制语言和到何种网站中进行搜索.
3)具有超链分析的功能.
4)遵从关键字的相对位置.
5)提升了中文搜索引擎的相关性,而且更好地实现了检索字串与网页中文字的语义上的匹配.
搜狐搜索引擎的特点
搜狐网站的内容丰富多彩,与我们的生活联系十分紧密.搜狐分层目录是专为中国用户设计的高质量的分类目录系统,把超过15万个精选的中文站点链接归为18个大类,如:娱乐,计算机与互联网,工商经济,科学,艺术,文学,生活服务,科学技术,政治法律等等.而有价值的用户往往只关心自己需要的专门信息.所以我们在每个最初目录下,都建立全面丰富的目录树系统,构成了四通八达的信息高速公路,方便迅速地把您带到目的地.分层目录系统不仅使用户找到最需要的专门信息,也使广告客户更便捷地找到特定的用户群,达到最佳的宣传效果.在搜狐分层目录之外,还同时设立了七项搜狐频道:搜狐新闻,财经报道,搜狐体育,网猴, 多媒体,外国资源,搜狐社区.
它主要具有以下的特点和功能:
1)最先进的人工分类技术;2)友好的全中文界面;3)符合中文语言文化习惯;4)18个部类,近15万条链接构成的树杈型网页结构;5)最直观,最轻松为网上用户提供所需要的内容.
北大天网搜索引擎的特点
北大天网收录 135 万网页和 9 万新闻组文章,更新较快;功能规范;反馈内容完整,包括网页标题,日期,长度和代码;可在反馈结果中进一步检索;支持电子邮件查询.无分类查询.另提供北京大学,中国科院等FTP站点的检索.
它主要具有以下的特点和功能:
1)在语种上支持中英文搜索.国内大部分的搜索引擎都只收录中文网站,用来查找国内的英文网站.
2)在文件格式上即支持www文件传输格式,也支持FTP文件传输格式.天网将FTP文件分成电影,动画片,mp3音乐,程序下载,开发资源共四大类,用户可以象目录导航式搜索引擎那样层层点击下去查找自己需要的FTP文件.
如何使用搜索引擎
搜索引擎可以帮助您在Internet上找到特定的信息,但它们同时也会返回大量无关的信息.如果您多使用一些下面介绍的技巧,将发现搜索引擎会花尽可能少的时间找到您需要的确切信息.
在类别中搜索
许多搜索引擎(如Yahoo!)都显示类别,如计算机和Internet,商业和经济.如果您单击其中一个类别,然后再使用搜索引擎,您将可以选择搜索整个Internet还是搜索当前类别.显然,在一个特定类别下进行搜索所耗费的时间较少,而且能够避免大量无关的Web站点.
当然,您或许还想搜索整个Internet,以搜索特定类别之外的信息.
使用具体的关键字
如果想要搜索以鸟为主题的Web站点,您可以在搜索引擎中输入关键字"bird".但是,搜索引擎会因此返回大量无关信息,如谈论羽毛球的"小鸟球 (birdie)"或烹饪game birds不同方法的Web站点.为了避免这种问题的出现,请使用更为具体的关键字,如"ornithology"(鸟类学,动物学的一个分支).您所提供的关键字越具体,搜索引擎返回无关Web站点的可能性就越小.
使用多个关键字
您还可以通过使用多个关键字来缩小搜索范围.例如,如果想要搜索有关佛罗里达州迈阿密市的信息,则输入两个关键字"Miami"和"Florida".如果只输入其中一个关键字,搜索引擎就会返回诸如Miami Dolphins足球队或Florida Marlins棒球队的无关信息.一般而言,您提供的关键字越多,搜索引擎返回的结果越精确.
使用布尔运算符
许多搜索引擎都允许在搜索中使用两个不同的布尔运算符:AND和OR.如果您想搜索所有同时包含单词"hot"和"dog"的Web站点,只需要在搜索引擎中输入如下关键字:
hot AND dog
搜索将返回以热狗(hot dog)为主题的Web站点,但还会返回一些奇怪的结果,如谈论如何在一个热天(hot day)让一只狗(dog)凉快下来的Web站点.
如果想要搜索所有包含单词"hot"或单词"dog"的Web站点,您只需要输入下面的关键字:
hot OR dog
搜索会返回与这两个单词有关的Web站点,这些Web站点的主题可能是热狗(hot dog),狗,也可能是不同的空调在热天(hot day)使您凉爽,辣酱(hot chilli sauces)或狗粮等.
留意搜索引擎返回的结果
搜索引擎返回的Web站点顺序可能会影响人们的访问,所以,为了增加Web站点的点击率,一些Web站点会付费给搜索引擎,以在相关Web站点列表中显示在靠前的位置.好的搜索引擎会鉴别Web站点的内容,并据此安排它们的顺序,但其他搜索引擎大概不会这么做.
此外,因为搜索引擎经常对最为常用的关键字进行搜索,所以许多Web站点在自己的网页中隐藏了同一关键字的多个副本.这使得搜索引擎不再去查找Internet,以返回与关键字有关的更多信息.
正如读报纸,听收音机或看电视新闻一样,请留意您所获得的信息的来源.搜索引擎能够帮您找到信息,但无法验证信息的可靠性.因为任何人都可以在网上发布信息.
搜索引擎优化的发展历史
搜索引擎优化(SEO)不是突然出现的一个技术,而是和搜索引擎同步发展起来的,两者的关系虽然不能说是“矛和盾”的关系,但是可以肯定的是,因为有SEO才使得搜索引擎技术能够变得更完善。
一、1994-1997年:雅虎诞生与SEO诞生
1993年8月,Lycos推出了基于搜索机器人的数据发现技术,并支持搜索结果相关性排序额,它还第一次让搜索引擎能够使用网页自动摘要。
1995年底,Alta Vista推出,由于它具备大量的新的搜索功能,深受大众好评,Alta Vista是第一个支持自然语言搜索,具备了基于网页内容分析、智能处理的能力,第一个实现高级搜索语法的搜索引擎(如AND,OR,NOR等),同时还能搜索新闻群组中的内容,还能搜索图片。
这一阶段也是yahoo发展的初期阶段,大多数人在这个时候对搜索并不熟悉,也不太知道有搜索引擎这回事,但是对于yahoo,大多数人则有所了解,寻找网站就上Yahoo。所以,将你的网站送到Yahoo是很必要的,在此阶段,只要你的网站基本有个模样,有一定的可看性,一般只要向Yahoo提交地址,72小时内就能出现在Yahoo目录上。Yahoo对所有的网站进行人工归类,一般是按照字母顺序排列网站,自然开头为“A”的网站排到开头为“B”的前面,而有两个A的网站,排在有A和B的网站前面,比如,American Airlines的网站不仅排在Bank of America的前面,而且也排在American Basketball Association前面。所以,大批网站就以追求A字来命名。这是搜索引擎优化的雏形。这个逻辑和黄页电话号码的排名逻辑一样。
在这一阶段,Yahoo的栏目编辑们也在网上积极搜索新的网站,丰富他们的数据库,而他们的搜索都是人工的,最典型的方法就是从一个网站的链接去访问另外一个网站。遇到一个好的网站,他们就给站主发电子邮件,欢迎站主登录,而且都是免费的。
这些Yahoo编辑访问网站的行为和我们今天看到的搜索引擎蜘蛛和机器人的形式是一样的孜孜不倦。有个Yahoo编辑这么关心你的网站,比你还着急登录你的网站,而且一文不收,这个在今天是无法想象的。你的网站登录后,你还可以随时更改登录的信息,一般72小时就得到了更新。
值得一提的是,虽然在这个时期中文网站很少,而且大多数是美国的中文网和在台湾的网站,但是Yahoo显然注意到中文网站的未来,而且迅速有个中文译名“雅虎”,而这个不仅仅是因为它的创始人是杨致远。
这一阶段也是SEO的雏形时期。网上网下出现了一些论文,讨论文字对应、数据挖掘和对搜索引擎程序员的访谈。人们初步有了让网页内容符合搜索引擎数据库原理的模糊意识。同样,将网站收录到搜索引擎也是很容易的,你的网页只要关键词的使用达到一定密度就轻而易举地排列在搜索引擎上了。
值得一提的是,搜索引擎InfoSeek首次做到每日更新。早晨八点你提交网站,下午就被收录,第二天就能出现在搜索之中。正是因为这么快的更新和这么容易的提交收录,大量的站主开始变着法子频繁登录不同的网址,英文出现Spam这个词来形容站主不负责地制造泛滥的垃圾,很快使这些搜索引擎吃不消。
所以,SEO从一开始就是黑白两道开始的。白的,英文里是white-hat,就是按照能够悟出的搜索引擎原理来合理地调整自己的网站,使搜索引擎能收录并得到好的曝光。黑道,英文叫black-hat,这类优化者仿佛是黑客,寻找搜索引擎的弱点,力图将混淆的信息强塞给搜索引擎,从而为真实的网站提高曝光机会。
这个时期,因为强大的利润诱惑,成人网站可以说是带头去“黑”搜索引擎。所以SEO和搜索引擎从一开始就是爱和恨的关系,这个时期,收费的网站优化服务也开始在美国出现。
在中文搜索引擎领域,中国的起步其实并不晚。1996年8月成立的搜狐公司是最早参与做类似Yahoo的管理信息分类导航的网站,曾一度有“出门找地图,上网找搜狐”的美誉。
这个时候,没有人注意在斯坦福大学的一个宿舍里,两个聪明的学生正在慢慢孕育一个令世界瞩目的新型搜索引擎。他们发明了一个新的叫PageRank的理论,来重新塑造搜索引擎。这个新型搜索引擎就是现在的Google。
二、1998-1999年:Google和SEO理论浮现
这一阶段,美国的互联网大会开始有一些关于网站优化的文章发表。这些文章开始关注到链接流行度(Link Popularity)、名录网站链接(Directory Listing)的意义。这段时间,搜索引擎也知道了需要限制人们的网站提交来防止垃圾网站的泛滥,于是开始组织反击。
Alta Vista开始大规模剔除含有“我们来优化”或者“我们来推广”这类文字的网页。SEO的实践者开始意识到,要破解搜索引擎的原理越来越难。在1999年将一个网站提升到前十名要比在1998年难上十倍。搜索引擎开始更多关注链接流行度的意义。
Google也在1998年收到了第一张十万美元的风险投资,搬出了斯坦福校园,正式命名为Google公司,域名也从google.stanford. edu变成google. com。这个新的搜索引擎衡量网站的重要性首次将链接流行度作为排名的标准之一。
1999年5月,英国的FAST公司推出ALLTheWeb搜索引擎。它的网页搜索可利用ODP自动分类,支持Flash和PDF文件搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3和FTP搜索,拥有极其强大的高级搜索功能。这么强大的功能使它成为最流行的搜索引擎之一。
这一阶段的初期,搜索引擎也开始了多元化的进程,开始设立多语种的网站,比如AltaVista就率先开始了拉丁语的版本。台湾中正大学吴升教授所领导的GAIS实验室于1998年1月创立了OpenFind中文搜索引擎。它是最早开发的中文智能搜索引擎,号称能抓取全球最多的网页并开始进入英文搜索引擎。
1999年Google获得了两千五百万的资金,开始全力发展,并且已经在每天处理50万次搜索,这个投资也使Google再次搬家到旧金山——硅谷地区叫Palo Alto的城市。Google也开始结识合作伙伴,从AOL到Netscape不久,Google再次搬家到的全球总部依然是旧金山——硅谷叫Mountain View的城市。这时候的搜索引擎开始设法控制市场,广告广泛地出现在搜索引擎上。这引起了许多搜索者的反感,因为大家还是在用56KB modem上网,大量的广告使网站页面出现的太慢。
Google发现了这个影响搜索步伐的致命的问题。简洁的网页设计使众人耳目一新,飞快地搜索速度更使得各个站主奔走相告,每个站主论坛都充满了对Google的极好评价,杂志的采访也是接连不断地对Google进行推荐,Google的全面演出就正式登台了。
三、百度和搜索引擎的革新
从2000年开始,登录一个网站到搜索引擎花的时间是越来越长。搜索引擎热衷于收费服务,从一个新的搜索引擎Inktomi到Alta Vista都染上了金钱。与此同时,搜索者希望有一个搜索引擎能真正地给他们带来有用的信息。Google没有辜负人民的期望,它的精确搜索开始巩固它在搜索引擎中的地位。
首先出局的是InfoSeek,这个InfoSeek在1998被迪士尼公司买下,变成Go. com。从那以后,InfoSeek被抛弃,而Go. com也使用Yahoo搜索来代替。在1999年,InfoSeek的一位华人工程师离开了这个搜索引擎而驶向北京,他力图要创立一个“中国人自己”的搜索引擎,并且受一句中国古词“众里寻他千百度,蓦然回首,那人却在灯火阑珊处”的启发,将中国人的搜索引擎起名叫“百度”。这个工程师就是百度的创始人之一—李彦宏。
李彦宏自己就是新一代的搜索技术专家,他早在1996年就解决了如何将基于网页质量的排序与基于相关性排序完美结合的问题,并获得美国专利。百度公司结合硅谷搜索引擎人才精英,依托北京最优秀的软件人才,开发了大型商业化的中文搜索引擎,中文搜索从此与英文搜索站在了同一起跑线上,同时,百度搜索巧妙地解决了数据更新的瓶颈,整个中文网页的数据库可以最快每天更新一次。
2000年也是Flash动画、JavaScript特技Rollover和动态图片的流行之年。这些动态的形式让人喜爱,但是很少有人知道,搜索引擎不能认识这些,搜索引擎只能阅读文字,而非这些感官的创意,因为它们一直是在模拟人的阅读方式,但是却无法模拟人的感知,直到今天,搜索引擎也没有解决这个问题。
从这一年开始,实际上,向搜索引擎呈交新的网站不需要按照以前那样在搜索引擎的页面上填写“ADD URL”,搜索引擎已经能从一个存在的网站上发现新网站的链接来访问并收录。在这个时候,SEO实践者也开始知道,如果网站能被目录导航站(Directory),特别是开放目录ODP(Open Directory Project)收录,将非常有助于搜索排名的提升。最知名的ODP是DMOZ(www. dmoz. org),由尼克·斯冠塔河鲍勃·图尔两位Sun公司的工程师在1998年创办,它是一个人工来收录网站进行分类的目录网站。在这点上,它的组成和Yahoo是一样的。
不同的是,它是由全球的站主自己做编辑来维护的,而Yahoo是由专业编辑来维护的。关于DMOZ,搜索引擎青睐DMOZ,是因为经过人工分析的网站的可信度自然要高于搜索引擎蜘蛛和机器人来获取的网站信息可靠。
2001年的收费登录大为红火。搜索引擎市场经历大清洗,人们开始抛弃搜索引擎Hotbot,Alta Vista和Excite。Alta Vista试图仿效Google方式来重新回到缩小版的搜索引擎,但是这个垂死挣扎非常痛苦地失败了,并在2003年被Yahoo收购。Inktomi也失去了好几个应用伙伴,急剧走下坡路,2004年同样被Yahoo收购,而且成为了今天Yahoo搜索的主要核心技术。
四、2002-2007年:Google Dance和SEO的不眠之夜
其实在2001年,敏感的站主和SEO实践者感觉到了一个从未有过的现象。有些人对网站在Google上的排名一夜之间消失,而有的网站则名列首位。这个现象几乎是每月一次。后来,人们知道,这就是Google定期地更新它的索引(Index)的距离活动,给人的感觉就像跳舞一样,因此被SEO实践者称为Google Dance。
正是因为有Google Dance,每个SEO实践者都在Google更新的那个晚上熬夜地看自己的SEO成果能否在Google上实现。每次更新有赢家和输家,网上SEO论坛总有成千上万的讨论,期望知道下次更新能有什么可以预料的,或者猜测更新的具体日期。
搜索引擎在这个阶段中遇到更严重的泛滥问题。SEO实践者大量采用门户网页(Doorway Page)、重复网站(Duplicate Website)、伪装网页(Cloaked Page)、隐藏链接(Hidden Links)等来试图欺骗Google。另外,DMOZ被Google作为一个重要的收录新网站的渠道,DMOZ也被注入许多垃圾网站。
2002年是大量SEO被滥用的一年。但是,搜索引擎从这些与SEO非法实践的斗争中不断丰富自己的辨别技术,对抓住的网站拒绝收录,已经收录的则给予剔除。但是这个封锁也冤枉了不少诚实的SEO网站。
在中国,百度于2001年9月开始提供公共搜索服务,并成功地使搜狐和新浪开始使用它的搜索技术。同时,它还提供新闻搜索服务,迅速扩大用户群。
2003年,越来越多的网站设计对Flash的应用有了谨慎的态度。这一年也是搜索引擎继续反击垃圾泛滥的一年。许多SEO实践者明白黑帽技术(black-hat)已经行不通,而是要扎扎实实地真正提高网站的素质。
Google在2003年更是挤掉了AltaVista和Inktomi,成为独大。Google诞生于一个搜索引擎纷杂的时代,在那个时代,像Alta Vista等搜索引擎对自己的市场份额太具信心而懒得变化。Google由各个站主和SEO实践者宣扬,从而一举后来居上。Google开始反击垃圾泛滥,矛头直接对向曾经支持它的这些站主和SEO实践者。这些人成了Google成功的牺牲品。
2003年的Google的“佛罗里达更新”(Florida Update)真是让全世界的站主领教了Google的厉害。倘若强烈飓风一般,Florida Update一夜之间让千万个网站从搜索中消失或者从前十名刮到100页以后。这个发生在11月16日的更新,尤其对寄希望在即将来临的圣诞节狠赚一笔的电子商务网站损失惨重。Google的这个更新是反击垃圾网站和不法SEO行为的一次重要战役。
然而,由于使用的过滤器(filter)不完美,冲击了很多无辜网站。之所以叫“佛罗里达更新”,是因为这个更新由Google在佛罗里达的数据中心开始的。
之后,2004年1月叫做“Austin Update”的余波同样也对相当多的网站造成冲击。霎时间,所以SEO实践者都突然摇身变成了Google Adwords的专家,大家不能不依靠Google广告来维持这段节日期间的销售。
关于这两个历史性的Google更新,给了许多SEO实践者相当大的教训。规规矩矩地从改善网站本身的素质而不是投机取巧,成为了SEO唯一可行的方法。PPC也稳定的成为营销策略中的重要手段,而SEO也成为搜索引擎营销(SEM)的一部分。
Yahoo在这个时候决定与Google正式分道扬镳。长久以来,为了弥补自己靠人工收录网站的不足,Yahoo一直采用Google的技术来提供网络搜索。Yahoo显示陆续购入Alta Vista,AllTheWeb和Inktomi公司,让人觉察到Yahoo的心情——它是否间接养大了Google?它的手上还有20%Google的股份!终于,在2004年2月16日,Yahoo出售了Google股份,正式告别Google,走上自己开发搜索引擎的道路。
同年,2004年9月12日,Google推出简体及繁体两种中文版本的搜索引擎。
进入2005年,最大的变化是Google Update不再是定期的活动,而是逐渐地成为每天的递进更新。剧烈的变化不再看见。SEO实践者能够很快看到自己的努力是否出现了效果。遵循搜索引擎的纪律,以合理的方法来调整、提高网站的结构和内容,成为唯一能够保证网站稳定的方法。更重要的是,遵循这些规范操作而优化的网站,不仅在Google上排名良好,还会在Yahoo和MSN上也具有不错的结果。中文网站,如果扎实地做好网站的素质,也会在百度的排名上获益。
简述:"搜索引擎发展历史"
1990年以前,没有任何人能搜索互联网。所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。
虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。
Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
扩展资料
搜索引擎的作用
搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的 一个有效工具”。
高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品/服务的销售,而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值。
1、从网络营销的环境看,搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用;
2、从效果营销看,很多公司之所以可以应用网络营销是利用了搜索引擎营销;
3、就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成部分,是向终端客户传递信息的重要环节。
参考资料来源:百度百科-搜索引擎