阿拉丁平台
百度搜索开放平台是一个基于
百度网页搜索的开放的数据分享平台,广大
站长和开发者, 可以直接提交结构化的数据到
百度搜索引擎中,实现更强大、更丰富的应用,使用户获得更好 的搜索体验,并获得更多有价值的
流量。
功能
在经过必要的申请、审核后,可以通过
开放平台实现的特色功能有·指定关键词,更精确、更直接的影响目标用户;
·指定排序位置,更统一、更全面的展现内容;
·指定样式,更丰富、更恰当的适应资源本身,不局限于文字;
技术实现
原来,在无边无际的信息宇宙中,很多人类信息并没有被Web化,而且即使一些信息Web化了,也没有纳入到搜索引擎的检索体系。所以,能被搜索引擎检索到的信息只占人类所有信息中非常小的一部分,更多的信息都存在于Hidden Web,也就是“暗网”之中。
百度的理想在于,在“
阿拉丁计划”的支持下,
搜索引擎技术可实现超越现有web内容的限制,对包括“暗网”在内的所有信息进行更深一步的分析、融合、处理,使这些web化的信息能最富有效率地被用户通过搜索引擎进行检索。
“借助‘阿拉丁平台’,百度将越来越接近通过一个搜索框满足不同用户搜索请求的理想。”
平台前景
业内专家分析,正是在这种急欲建立起更为庞大和牢不可破信息帝国雄心的指引下,
李彦宏与他的团队将潜心多年的“阿拉丁平台”研发计划向外界和盘托出。而且,这项宏大的计划一旦实施,或将彻底改变搜索引擎产业——“百度不仅将借此继续领跑
搜索引擎行业,还将对搜索引擎和
互联网产业的未来发展格局产生深远影响”。而无疑,在整个过程中,普通的互联网用户是最大的受益者。
展望
创新
“如果把
百度搜索引擎比做一个探照灯,在无边无际的信息宇宙中扫射,那么,那些探照灯扫射不到的区域,都是我们定义的所谓Hidden Web。能被搜索引擎检索到的信息只占所有信息中非常小的一部分,大部分信息存在于‘暗网’之中。”百度CTO
李一男解释称,这些“暗网”之所以存在,一方面是很多人类信息并没有Web化;另一方面即使一些信息Web化了,也没有纳入到搜索引擎的检索体系。
那么能不能挖掘出更多存在于“暗网”之中的有价值的信息,让更多人从中受益呢?这正是百度新的研发计划——“阿拉丁平台”的诞生初衷。
“我们希望未来的搜索引擎,能像阿拉丁神灯那样,在瞬间满足用户所有的搜索需求。”
李一男这样解释百度的“阿拉丁平台”,他指出,百度提出构筑“
阿拉丁”平台的意义,就是为更多的“暗网”信息web化提供便利条件,同时使这些web化的信息能精准地被用户通过搜索引擎进行检索。
在“
阿拉丁计划”的支持下,
搜索引擎技术可以超越现有web内容的限制,对包括“暗网”在内的所有信息进行更深一步的分析、融合、处理,确保为用户提供零成本、无障碍、无时差的精准搜索结果。
未来
此番百度首次对外披露的“阿拉丁平台”计划,其实早已经历了数年时间的酝酿。而早在两三年前,该计划便已经在千余名百度核心技术工程师的参与下秘密启动。
对此,
李一男并未否认。他告诉记者,实际上,“阿拉丁平台”是百度对现有搜索引擎体系的一个补充和延伸,早在百度两三年前推出贴吧、知道、国学等产品的时候,这一平台就开始系统化、有步骤的建立,并将成果逐步应用在
百度搜索引擎体系中。
据介绍,百度“阿拉丁平台”的具体执行策略,在后台方面,百度主要考虑的是如何使更多暗网信息web化,如
百度知道——将人脑中的信息web化,并便于搜索引擎的检索;百度图书搜索、法律搜索、
百度国学——为图书馆、国学文库这样的内部数据库信息提供web化条件,并便于百度索引。
而在前台方面,百度则主要考虑如何将搜索结果以信息融合的方式展现给用户。比如搜索“荣誉”,则需要既呈现关于“荣誉”的视频,也有关于“荣誉”的百科知识,更有各种关于“荣誉”的普通网页内容。
“借助‘阿拉丁平台’,百度正越来越接近通过一个搜索框满足不同用户搜索请求的理想。”业内专家评价认为,百度的“阿拉丁平台”计划,已经逐渐显露成效,其“结果页内容丰富程度,比其他搜索引擎要好得多,而通过阿拉丁平台,百度在信息融合的前沿工作也成为新的搜索引擎产业标准,
百度知道、百科等原属于‘暗网’的信息被越来越多其他搜索引擎纳入检索库。”
专家还特别指出,百度是世界上少数几个掌握搜索引擎核心技术的公司之一,此番借上海研发中心挂牌之际披露极具前瞻性的“阿拉丁平台”,标志着其对搜索引擎产业所进行的深入研究已经取得阶段性成果,“此举将对搜索引擎和
互联网产业的未来发展格局产生重要影响。”