网络计量学研究的应用与发展 于20世纪90年代中期,伴随着计算机网络技术的迅猛发展和网络信息资源的激增,使得传统的
文献计量学(Bibliometrics)、科学计量学(Scientometrics)、
信息计量学(Informetrics)已无法适应网络信息的测度和计量,这就促成了一种新型的网络信息计量工具的应运而生,即网络计量学的诞生。
产生和特征
1.1 网络计量学的提出
1997年T.C.阿曼德首次提出了“网络计量学”(Webometrics或Cybermetrics)的概念。阿曼德认为,网络计量学包括了所有使用情报计量和其他计量方法对网络通信有关问题的研究。“情报计量方法所使用的手段完全可以应用到万维网上,只不过是将万维网看作引文网络,传统的引文由Web页面所取代”。将传统文献计量方法使用在Web分析上,通常可统计诸如语言、单词、词汇、频次、作者特征、作者合作的能力和程度,还有对作者的引文分析,学科或数据库增长的测量,新概念、新定义的增长、信息的测量、信息措施的形式与特征。
1.2 网络计量学的特征
网络计量学是指在电子网络环境中,运用
文献计量学、科学计量学、
信息计量学的方法,对网上各种信息的组织、存储、分布、传递、相互引证及其功能和开发利用等做出定量描述并进行统计分析和研究,以揭示其数量特征和内在规律的一门新兴分支学科。通过对网上信息的计量研究,为网上信息的有序化组织和合理分布、为网络信息资源的优化配置和有效利用、为网络管理的规范化和科学化提供必要的定量依据,以改善网络的组织管理和信息管理,提高其管理水平。
因此,网络计量学作为一门新兴学科,顺应了网络信息时代的需求,对某一方向的发展趋势可进行全面统计,具有广阔的前景;它在对网络的信息数据进行科学统计、分析的过程中大量使用了概率论与统计学,计量方便、操作简单、结果准确,从而揭示了网络文献及信息资源的新规律;与传统手工检索工具相比较,网络检索系统有着不可比拟的优越性,为其方便快捷的检索途径和情报服务提供了更为广泛的实际应用。
理论研究
2.1 网络计量学研究的内容
作为全球信息网络,互联网提供站点、主页、电子邮件、讨论新闻组等媒介和内容,都将成为网络计量学的主要研究对象。它适用于网络文献检索研究、文献著者研究、引文分析、站点评价、搜索引擎研究、信息资源建设以及网络信息优化处理等,归纳起来主要涉及到三个层次:
⑴网络信息的直接计量
互联网的不断发展使人们一改传统的通过人工对文字、声音、图像等文本的注解,然后再进行的检索,人们不断发展的对情报需求的心理特点要求对网上各种信息进行直接准确的检索。这就要求我们:首先,建立容量足够大的多媒体信息数据库以完整保存信息;其次,以图像为例,构建各种特征
索引数据库,将颜色、纹理、形状等视觉特征内容通过绘制直方图、共生矩阵及轮廓线等数据模型进行量化;对声音的各种属性特征进行赋值,在检索时通过赋值检索或示例匹配方式,将其特征值限制在一定的相似范围内或通过选择示例声音进行匹配,从而得到精确结果;另外,也可选择具有声音服务的E—mail等网站进行单项统计,利用层次分析法将用户对声音的主观评价转化为对声音服务的要求的客观反映,以指导网站建设。
⑵网络文献、文献信息及相关特征信息的计量
网络计算学虽然包括了许多的计量内容,但其理论是在
文献计量学的基础上发展起来的,因此网络文献既保留了传统文献的特征研究,又具有其独特的新概念、新指标和新规律,例如:①对作者分布规律的研究;②对文献分散规律的研究;③对文献增长规律的研究;④对文献老化规律的研究;⑤对文献引文分析的研究。诸如此类对这些规律的理论解释和数学模型的研究。
⑶网络结构单元(站点)的信息计量
网站作为网络时代的“知识地图”成为网络计量学家所关注的问题,不仅网络文献保持着聚类关系,网站之间也有着独特的引用关系。网络文献之间不仅是参考文献的标注方式;更多的是使用了超级链接的方式;不仅是参考文献的条目,有可能是通过点击得到引用文献的全文。网络计量学研究的正是万维网(引文网)中的Web网页(引文)之间的引用关系,同被引与引文耦仍然可以用于揭示站点之间的相关性。而网络的动态性、高时效性也可成为我们研究的更有效的计量指标。
2.2 网络计量学研究的方法
网络计量学是网络技术、信息技术和文献计量学的有机结合,随着这十年来互联网的迅猛发展,对网络计量学的研究大致可分为四种类型:
⑴运用统计方法对数据进行统计分析
网络计量学使用概率论与统计学对网络中的数据进行科学分析,得出网络本身所适用的数学模型,从而揭示网络文献及信息资源的新规律。通过对网站和服务器的数量、网络用户特征以及网络发展的增长率指标进行统计分析。
⑵运用图论的方法对数据进行可视化研究
就是运用网络绘图和信息技术来研究网页超级链接的拓扑结构,直观反映网页间的链接关系。人们将图论方法和传统及新的研究方法综合应用,并扩充和确认了这种方法的研究和应用。
⑶运用提示数据聚簇和分散的工具进行数据挖掘研究
与统计方法相比,数据挖掘可用于对一个站点上的各种特征进行深度研究,包括站点的交通测度以及各个国家的IP地址的分配。数据挖掘在文献和引文数据库中所应用的方法之一聚类分析技术,在网络环境下也同样适用。
⑷运用解释和模拟网络结构和增长理论工具进行模拟研究
这种方法就是通过构建网络结构的模型来研究网络,诸如网络的相互链接及拓扑结构。主要用于研究各个国家的域的等级——频次分布、网页之间和网页内部、外部的超级链接。
应用分析
3.1在数字图书馆和情报科学中的应用
网络计量学对网络信息资源的研究成果将能有效地应用于数字图书馆,如在数字图书馆馆藏资源建设中的应用可以提高数字图书馆的管理水平,通过链接分析研究,及时掌握、判断网络信息资源情况,从而有效地指导数字图书馆的业务开展。一方面可以合理分配馆藏空间,另一方面可进行动态馆藏的维护,将网络计量学应用于网络信息资源的建设。
而对于情报科学的研究探索,要取得突破性的进展,需要解决两个问题:知识信息的表达与组织必须从物理层次的文献单元认识层次向知识单元或情报单元转换;知识信息的计量必须从语法层次向语义和语用层次发展。这两方面的突破有赖于网络计量学的深入研究和发展,从而使情报科学的社会功能得以实现,情报科学的地位与作用得以提高。
在网络环境下,信息用户一般是利用搜索引擎进行检索的,然而庞大的用户群所产生的信息需求是复杂多样的,且缺乏明确的信息检索所需的背景知识,因此要求网络信息的揭示方式以用户需求为出发点,通过用户对已有网站的点击率来统计分析用户的需求特点及倾向,从各个层次、角度完善网络全新的检索途径,建立容量庞大、语种多样的大型
数据库检索系统,使搜索引擎从单一的查询工具向网络全功能服务发展。搜索引擎数据组织机制较好的有Google采用的方式和IBM的算法。
同时,网络计量学可应用于网站信息资源评价及网站评价,就像引文分析可以用于确定网络信息资源的权威性和可靠性。由于缺乏规范的表达方式和组织管理,造成了网络信息检索和管理上的混乱无序,这给网络信息的分析计量工作设置了一定的障碍。因此,如果每个信息发布者都依照一定的标准表达和组织网络信息资源,即网络信息资源能以某种规范的形式存在,其规律就会比较容易发现,掌握用户的信息需求和上网习惯就会更准确,信息用户利用网络就会更便捷,而网络信息的价值也更能够得到体现。
具体的应用之一在于处理日志文件,这样可揭示一段时间内网站所接受的访问次数,对其分析类似于图书馆利用登到记录、流通统计等业务统计数据进行资源利用情况分析评价。日志文件的分析需要相应的软件收集数据,需专业人员从各种数据中分析出相关数据,这些数据主要包括:①服务器在一段时间内受到的访问量;②网站内每个页面受到的访问量;③用户浏览网站的整个过程的记录,如从何处进入网站,从哪个页面退出,用户在一个页面上停留的时间、下载一条数据的时间和字节数等。
3.3 在社会科学研究、科技发展和决策中的应用
在同一时期内,科学体系中的各个学科和其下面的各个研究主题并非均衡发展的,在某个时期总有一个或多个学科容易取得成果,科学上将这种易出成果且成果累累的学科叫做当采学科;同样,一个学科中易出成果累累的主题叫做当采主题。由于成果的多少可用文献的数量来表示,我们可借助搜索引擎或网络联机数据库,通过计量统计研究,分析出当采学科和当采主题在网络中的受关注程度,并得出科学的评价。
网络计量学的发展,科技活动中的信息和信息技术的日益普及,对科技发展和成效的科学计量学及网络计量学的分析变得越来越重要;同样,网络计量学对科研机构科技政策的实施也会产生影响,通过对因特网上有关学科的各类信息进行计量分析,从而对科技研究机构之间的合作、信息流动,以及科技政策的实施等作出了探索性的研究。
3.4 在社会生活中的应用
互联网及网络化趋势的出现和扩展,既是一种信息技术的创新形式与过程,也表现为一种特殊的社会现象和社会过程,导致了人类行为的领域开始向网络和网络化方向延伸。人类特有的信息、知识和情感之间的互动关系,在现实社会空间表现出来的社会问题,在网络空间也会如实体现出来。例如2003年10月15日中国自行研制的“神舟五号”载人飞船的成功发射,此事引起世界的惊叹和关注。在此段时间,我们可以每天甚至每小时都可用搜索引擎搜索有关“神五”的关键词,记录下命中的记录,进行内容单元分析,跟踪分析发射前后的变化、舆论导向作用、海内外华人的欢欣鼓舞和各国政府、媒体的评论,以及中国在国际上的地位及影响力等等。
3.5 在指导核心期刊评定中的应用
基于《
中国知识资源总库》的总体规划和建设方案,“中国学术期刊(光盘版)”电子杂志提出了基于知识元和知识网络的知识评价方法,即借助数据库和知识抽取技术、用知识点含量及知识点创新性比较,对期刊和期刊文献进行分析评价。同时主张引入网络影响因子,建立包括网上全文下载量等新的计量指标在内的科学评价体系,在新近出版的《中国学术期刊综合引证报告(2004)》中,上网期刊全文下载总频次作为一项新的计量指标公布,成为“期刊综合评价梯度”测定的一项网络计量评价指数,初步确立了网络环境下期刊评价的新指标体系,并将成为核心期刊评定中最可靠的科学依据。例如:根据《中国学术期刊综合引证年度报告(2003)》,在“
中国期刊网”中心网站2002年全文下载记录的统计,并经综合评价分析,《
遗传》2002年载文量168,总被引频次797,他引率0.8645,影响因子0.8456,Web下载量9980。总被引频次比上年(619)增加28.76%;影响因子比上年(0.6221)增加35.93%。在全国生物学期刊中排名第10位,已经跻身一级期刊之列,是《
中文核心期刊要目总览》(第四版)综合性生物类核心期刊。
发展趋势
网络计量学的产生和发展,给信息用户提供了多方面的决策点,这些将有助于提高查全率和查准率,对于改进网站质量、有针对性的提供信息资源具有重要作用。
网络计量学的发展使得文献计量学也很有必要对新媒体的出现作些思考。正如1990年Paisley提出了将情报计量方法应用到电子通信领域,他说:“现在的书、刊、报纸中的大部分文本信息将来都会被包含在电子数据库中,收藏的大量电子信息将来会成为文献计量学研究的主流。”21世纪的文献计量学也许真的会成为“网络计量学”,不论它的名称是否会有变化,我们都必须看到这样一种趋势:下个世纪的文献计量学必将实现向新的计量媒体的拓展,从而开始一个崭新的发展阶段。
4.2 有研究日渐成熟和规范化的趋势
搜索引擎的不断发展、完善以及查准率的提高将对网络计量学的发展产生积极的影响,特别是查准率的研究有可能使网络计量学最终经受起科学的检验并逐步完善。网络计量学的研究成果可以指导网络信息检索,帮助用户选取高质量的站点和搜索引擎。网络信息检索是一种多维检索,它有着更大的自由度,也更适合人类的联想思维方式,新出现的搜索引擎更具亲和力和人性化,更加贴近用户的心理,更能满足人们查找信息的需求,成为搜索引擎的又一个发展趋势。
4.3 有加强网络信息的控制和管理的趋势
在网络环境下,信息用户群是利用搜索引擎进行检索的,网络计量学研究成果可以指导网络信息检索,帮助用户迅速选取高质量的站点和搜索引擎,通过用户对已有网站的点击率来统计分析用户的需求特点及倾向,帮助网站人员建立最佳网站。对于网络用户的详细分析,根据用户特征调整网站风格、最优化地选取网络视点、焦点和卖点,科学配置网络资源,掌握其特有的规律形式,将使网络计量学更紧密地联系网站和用户多样化的实际,成为构建用户与网站良好关系的中介。
4.4 有促进各学科交流和发展的趋势
知识经济的核心是知识的创新、组织、利用和传递,网络计量学研究的突破带来信息计量的可操作性与有效性,必将为知识组织与管理提供有效的工具和方法,进而消除和缓解网络时代信息污染带来的知识积累与利用间的矛盾激化,使各学科的社会功能得以实现。随着网络的迅速发展,网络计量学研究不受国界限制,任何一名图书馆员都可以利用因特网进行资料搜集分析,随时将获得的网络计量学研究成果发表在万维网上,图书馆还可以通过BBS进行讨论,通过因特网视讯系统进行网上会谈与商榷。网络计量学的发展及其在图书馆的应用,缩小了学者国家间的差别,使网络计量学真正成为一门国际性合作的现代计量科学。网络计量学的产生和发展,也使得人们通过对HTML语言和都柏林核心元数据集(Dublin Core)的研究以进一步探讨网络计量学研究的新方法和新规则,网络计量学研究成果和分析结果给信息用户提供了多方面的决策点,有助于提高查全率和查准率。
在不断发展和变化的网络环境中,不断开拓新方向,发现新问题,采用新手段,开发新的网络计量工具与方法,是网络计量学的根本任务。探讨网络计量学研究规律、选取适当的搜索引擎对数据进行正确分析和量化处理也是网络计量学研究取得新进展的必然要求。由于网络文献的特殊性,以及所具有的传统文献的普遍性,网络计量学的发展还必须借鉴、移植传统文献计量学、信息计量学方法。通过网上信息计量研究,为信息的有序化组织和合理分布,为网络管理的规范化和科学化提供必要的定量依据,从而改善网络的组织管理和信息管理,提高其管理水平,促进其充分发挥经济效益和社会效益。
参考文献
1 徐久龄,许莲莲.网络计量学.情报科学,2002⑴
2 李长忠,李东洋,齐源.网络计量学的研究对象与方法.情报科学,2002⑴
3 龚立群,朱庆华.网络计量学的研究方法及应用.新世纪图书馆,2003⑹
4 吴华香,钟少丹.网络计量学的应用分析.图书情报工作,2003⑻
5 夏旭,李健康,葛驰.网络计量学研究:现状、问题与发展.图书馆论坛,2001⑹
6 赵启民.网络计量学研究的构建和发展方向.吉林师范大学学报(自然版),2003⑵
7 张晓雁.网络计量学初探.情报杂志,2003⑶
8
邱均平.信息计量学(一),情报理论与实践,2000⑴