信息计量在科技创新政策研究中的应用——现状、局限与前景

时间:2018-09-10 编辑整理:唐 莉 来源:早发表网

摘要:从科技创新政策研究和信息计量的发展视角人手,该文回顾了信息计量在科技创新政策研究中的应 用背景与演化历程。通过举例详细分析了当前信息计量在该领域的前沿研究、存在的不足和未来发展中亟 待解决的重要议题。文章指出科技创新政策作为一门新兴交叉学科,目前在大数据研究中尚处于起步阶段。作为一种非常实用但有待继续挖掘的研究工具,信息计量可以也应当与其他领域的研究理论与方法有机结合,从实践管理操作、学术研究推进和学科自身发展三方面在科技创新政策研究领域发挥更大作用,汲取其他领域研究成果的营养促进自身学科的发展建设。

关键词:信息计量;科技创新政策;学科建设

 

科技创新(sciencetechnoIogyand innovation, 缩写为sTI)是全球范围内国家竞争力的关键因素。 当前,科技创新政策对国民经济的影响日益增强,成 为各国对科学技术以及创新资源配置的重要手段。 作为一个快速发展的新兴研究领域,较其他发展成 熟的学科而言,科技创新政策研究的内涵界定尚未 达成共识,但学界一般认同科技创新政策涵盖科学 (science)、技术(technology)、创新(innovation)。三 者密不可分,有机整合H儿…。在科技创新政策研究 的几十年发展历程中,经济学、行为科学、心理学、政 治学、心理学、历史等学科的理论方法发挥了重要作用。作为一门有众多学科支撑的具有鲜明特色的交 叉学科,科技创新政策研究中理论与研究方法纷呈, 丛林bush effect现象显著。本文聚焦近年来信息计 量学在科技创新政策研究中的应用,举例分析了信息计量在科技创新政策研究中的发展现状、面临的亟待解决的七大瓶颈问题及未来发展前景。

 

1.STI政策研究的发展变迁及基于实证的主流议题

 

20世纪50年代,以微电子技术为主导的新技术革命的蓬勃兴起,推动了技术的进步和经济的增 长。Nelson及其同事1959年在Joumal of Public Economics1977Research Policy上的文章可谓是 最早致力于科技创新政策引发机制的理论探讨的经 典文献¨儿“。之后,基于实证的(evidencebased) 的研究长期占据西方社会科学研究主流,为欧美国 家学界所推崇。科技创新政策研究也不例外。比如,公共政策分析与管理协会(Association of Public P01icy and Management,简称APPAM)2015年的年会 主题为The Golden Age of EvideneeBased P01icy, 延续基于实证的政策制定与评估的传统范式。2016 年的APPAM主题为The Role of Research in Making G0vemment More Effective,再次强调科研在有效政 府中的作用。而国际上两年一度的科技政策顶级会 议亚特兰大科技创新政策会议每次召开之前的预备会议均为数据挖掘主题的Global TechMining。这是信息计量学在科技创新政策研究中崛起的表征。

 

伴随着科技体制改革的不断深化,我国科技创新政策研究稳步发展,也出现宏观层面的研究著作,但早期许多研究工作缺乏系统的研究和科学的方法。在过去十年(20072016),科技创新政策研究突飞猛进,发表数量上呈明显上升趋势。在csscI索引期刊中搜索主题词为“科技政策”或俐协馆情报 “科技创新政策”,近1400篇。研究内容、视角、及方法亦呈现出多样化。

 

2信息计量学的界定与发展

 

 21 信息计量学的界定与分类

 

任何一门学科的创立、发展与建设,都植根于外部社会环境与内在科学逻辑的交汇¨1。信息计量学亦不例外。在sTI政策研究迅猛发展的同时,随着全球信息化进程的加快,信息计量学也在蓬勃兴起。最初信息计量多用于文献检索。洛特卡定律、布拉德福定律及齐普夫定律等三大定量相继提出。20世纪90年代后期逐渐兴起了引文时序网络分析和知识图谱研究。各种数据挖掘和可视化软件 (GephiPajakueinetVantagePoint)也相继 开发使用。之后,信息计量研究的对象逐步增加,研究领域迅速扩展。随着科技的迅猛发展和信息技术的广泛渗透,信息计量学越来越多的应用到科技创 新政策的研究之中。

 

同科技创新政策研究类似,作为一门新兴的交叉学科,学界对信息计量学的界定虽无共识,但主流倾向有狭义和广义之分②。狭义的信息计量学也称为情报计量学,是文献计量学和科学计量学的继承和发展。根据我国最新国家标准《学科分类与代 码》(GBT137452009),文献计量学、科学计量学和情报计量学分别列在二级学科文献学(学科代码 87020)、情报学(学科代码87030)和科学学与科 技管理(学科代码63035)的子目录下。横跨管理 学(学科代码630)与图书馆、情报与文献学(学科代 码870)两大一级学科。广义的信息计量学学界有 四计之说(1所示)@:即文献计量学Bibliometrics、科学计量学scientometrics、情报计量学Informetrics、以及方兴未艾的网络信息计量学webmetricscybermetrics∽‘1“。这也是本文采纳的信息计量学的界定。

 

 

 

顾名思义,文献计量学Bibliometrics的研究对象是文献,主要应用领域是图书馆情报学。科学计 量学scientometrics目前应用最为广泛,以数学统计 等计量方法来研究科学发展整体和相关组成的发展 规律。情报计量学或狭义的信息计量学Infometrics 则与信息资源管理研究有更多的交叉重叠部分。近 年来,随着经济学院与商学院学者的加入,该领域研 究也包括专利计量Patentometrics。而新兴的网络信 息计量webmetrics,一般学界认同是20世纪90年 代由丹麦学者埃尔蒙德和英格沃森所提出,使用各 种定量方法对网上信息的组织、存贮和分析。随着 互联网、商业搜索引擎以及网络爬虫软件的发展,网 络信息计量学迅速成为广义信息计量研究新的增长 点。对于以上“四计”各信息计量分支的产生背景、 发展历程以及热点前沿问题,国内外学者阐述众多, 在此不做赘述。如图一所示,以上“四计”均有搭界 和重合之处,其共性在于对信息、特别是文本数据 且往往是非结构化文本数据的量化。信息计量学界 的两本顶级期刊Journal ofthe Association for Inf0mation Science and Techn0109y(JASIST)Journal of Informetrics(JOI)以及权威期刊Scientometrics的创 刊及发展,成为该领域研究制度化的重要标志。

 

22信息计量学在中国的发展

 

20世纪90年代,随着科学计量学方法在中国 引入,尤其是梁立明所著中国科学计量学界“第一 部女书”《科学计量学指标·模型·应用》问世,信息计量学在中国发展迅速。国内一些学者对国外信息计量学的研究热点与最新前沿方法做了详尽介绍,内容涉及期刊影响因子、h指数、知识频谱、社会网络分析、可视化、同被引分析的步骤及各种关键技术等,并涌现出一大批高水平的研究成果。信息计量领域著书与科研论文的发表、信息计量国际 期刊编委和审稿人的急剧增加,特别是三大国际信息计量会议Issl年会、collnetwIssTI在中国的相继承办也继续奠定了我国在该领域研究的国际地位。

 

3信息计量学在科技创新政策领域的应用和新发展

 

近年来,国际上使用信息计量方法研究科技创 新政策的文章在Proceedings of the National Academy of SciencesNationaJ Bureau of Economic ResearchThe American Economics ReviewNature等国际顶 级期刊上的发表频现。但科技创新评估依然是信息 计量在科技创新政策研究中应用的主战场。利用科 学有效的科学计量指标和体系来评价国家、地区、机 构或个体层级的科研创新活动,从而在公共资源有 限的条件下,集中力量发展国家优势学科和关系国 计民生的重要研究领域。从分析单位上看,除了最常见的在个人、组织和国家层次上科研创新产出的 数量与质量分析之外,当前信息计量研究的分析单元从文献单位(文章、专利、书册)拓展到知识单元 内部如章节(致谢部分、方法论、协作分工注释等)。 除了科学文献、专利、网站之外,科技外交年鉴、法律 条款、地方志、奏折等均成为信息计量的研究对象。

 

随着知识频谱(citespace分析软件)、数据 挖掘(VantagePoint)、社会网络(ucinetPajek)、科学覆盖图(science overlay map)等分析软件 和应用程序的开发,信息可视化在科技政策的研究 中长期占据主流位置。有代表性的研究包括通过关 键词与共词分析来研究学科演进、研究现状和热点 议题@。其中影响巨大的有西班牙学者Rafols等人 研发的科学覆盖图science overlay map,分别对特定 研究领域按时间顺序进行“快照”,然后把这些“快 照”连接起来,演绎出学科发展研究热点的变化过 程和发展趋势。还有学者将ArcView地理信息系统软件的可视化地图与社会网络分析软件Pajek 相结合,勾勒科研合作在地理空间上的分布与合作领域变化的动态趋势;或有研究聚焦关键主题词的空间动态转移,使用相关性统计分析和生物学上的热图(heatm)对标准化后的关键主题词进行聚簇可视化研究。

 

其他主流或前沿研究还包括知识溢出和政策 创新扩散研究;切入组织行为学的相关文献的引文网络分析;网络舆情、政策传播模式分析;以及通过科研资助信息对科研投入和产出效果及效率的研究等。

 

特别值得一提的是,信息计量研究的新应用方 向是方兴未艾的历史量化分析:即通过对历史文本材料的系统编码和定量转化来研究特定议题。譬如,通过内容分析法特别是关键词的识别,北京科技大学潜伟、吕科伟等以《宋史》本纪中记载科技内容为计量对象,分析了宋代帝王对各学科的关注程度。通过对《清实录》和地方志相关文本资料的 检索,龚启圣、马驰骋构建了清代16441910年间山东107个县的面板数据,分析农民暴动与儒家文化之问的关系。研究发现儒家价值观在自然灾害发生之际起到减少暴力冲突和促进社会稳定的积极作用。以往历史质性研究中多依赖个案分析,具有较强的主观选择性。而信息计量在历史量化领域的新应用,在一定程度上终结了把“历史变成任意打扮的小姑娘”的研究时代。

 

4局限性与问题

 

任何一种研究视角都有它的局限性,信息计量也不例外。如前所述,近年来国内外涌现出一大批信息计量在科技创新政策中的应用研究,该领域的进一步发展亟待突破以下瓶颈环节。

 

41 人名消岐(Name Disambiguation)依然未得到有效解决

 

scI之父尤金·加菲尔德创建文献索引数据库以来,人名歧义(who is who problem)一直是海量数据文献计量悬而未解的难题。简单的讲,人名歧义是一种身份不确定的现象,指的是文本中具有相同姓名的字符串指向现实世界中的不同实体(即 作者重名);或者不同的字符串实际指向的是现实 中同~实体(如姓名在不同语言的表达或西方女性 婚后更姓等)④。无疑,在信息爆炸的时代,从海量数据中快速准确的进行人名消歧是信息计量和科技 评价研究亟待解决的一个重要问题。常用人名消歧方法的判断依据多基于姓名拼写的相似度和文献中 的其他属性相似度(即科研单位、研究领域、合作网络等)。但随着:(1)科技数据库规模的急剧扩大 =>姓名拼写相似度现象增多;(2)交叉学科的迅 猛发展=>依赖研究领域辨识学者的难度增加; (3)全球化进程中科研人员尤其是杰出科学家的流动加快=>依赖研究单位辨识学者的可靠性降 低;(4)非英语国家在科技文献发表上的崛起=> 人名以及科研单位英文翻译中的标准化问题凸显, 常规人名消歧判断依据的局限性也日益增加。不依赖于个体人名(以有效避免西方女性婚后更姓、人名印刷错误、以及姓名在语言翻译过程中的系列问题)、不依赖于作者发表时所在科研机构(以有效避免科研机构名称标准化问题以及科技工作者变更学 习、工作单位情形),在合理时间内获得较高准确度的算法尚待发现。

 

42 信息计量中数据单一和数据代表性问题

 

当学者谈论数据驱动(datadriven)或者基于 实证(evidencebased)的政策制定时,我们首先已 经假设数据真实、可靠、有代表性。但现实中一些信息计量研究是否对原始数据下载信息(特别是翻译的人名地名)的准确性、依靠特定搜索引擎所获取的样本数据的代表性(如敏感问题的网滤)、或网上 发放问卷有效回收数据的代表性进行充分考虑并加 以调整,尚未知晓。计算机科学有一习语GIGO (garbage ingarbage out:废料进、废料出),是对所有信息计量研究者的警戒。如何获取高质量的数据、如何防止(或后期识别并矫正)相关数据、信息 或证据被污染(data contamination)是包括科技创新 政策在内的公共政策研究所面临的很大难题。如果输入的信息不精确甚至不正确,无论使用的研究方 法多么复杂,分析的结论都难免流于片面或有偏见,基于实证的政策建议可信度也会大打折扣。

 

43信息计量指标的信度与效度问题

 

信息计量学注重对信息的定量分析方法,这是 信息计量学研究的核心。但每一种定量分析的方法 都是基于特定理论假设和应用场景。当假设条件不 成立或者场景不适用,得出的结论可信度也会降低。 以科技政策研究中的科研合作为例。当我们用信息 计量的指标合著(coauthor)来衡量科研合作(scientific coIlaboration)的时候,我们已有很强的假设:即 凡是合作的都在coauthorship中体现,即无侵占他人 成果的署名出现;而凡被列为coauthor的都是在以 科研发表为表征的知识创造上做出了重大贡献,即 没有搭便车者的存在。但该假设是否成立、何时成 立、何时不成立以及怎样不成立在信息计量研究中 难以解答。这既是计量指标信度和效度的测度问 题,本身也是一个值得研究的科技政策和科研管理 议题。

 

44描述性强但解释力弱

 

传统的信息计量研究多采用横截面数据,适于描述性议题而非解释性议题。以国际科研合作对知识溢出影响的研究为例。由于知识本身的不可编码 (uncodifiable)和隐性特征(tacit nature),科学工 作者不能有效衡量:(1)国际科研合作是否真的产 生跨越国界的知识溢出;(2)其知识溢出的方向是 怎样;(3)如何量化比较知识溢出的程度。随着大型电子数据库的出现和完善,第一个问题目前得到 初步解决。根据研究对象的不同,一般来说作者A 和作者B合著,考虑到在合作过程中作者之间的协 同交流,我们认为AB之间存在着知识溢出。但 知识溢出的方向和程度的问题仍未得到解答。其主要原因之一在于简单的信息计量描述或截面数据的 回归只能建立相关性(correlation),而不能确立知识 溢出的方向与程度(causalimpact)。这亟待信息计量与其他经济统计方法通过基于个体识别的面板数 据来量化知识溢出。该方法不仅可获得更多样本观察数据,还可以有效控制个人的自选择效应和异质 性。对于可能出现的不平衡面板数据模型的情形,亦可采取Heckman的两步样本选择估计法来检测降低其样本破损的弊端。

 

45竞争性解释的剔出和相关性讨论

 

与信息计量分析描述性强,但解释力弱的局限性紧密相关,传统的信息计量研究很难对竞争性解释进行剔除。以论文被引频次与文章质量为例。除 了文章本身的质量之外,影响论文被引频次、包括期 刊影响因子的因素很多,如语言、学科的差异、合著 人数的多少、作者本身的知名度以及文章的发表日 期等,都会影响论文被引次数,继而影响所在期刊影 响因子。比如,同等质量的用英文写作的文章无疑 比用中文、俄文、法语写作的科研文章在全球范围内 有更广泛的读者群,因而更可能被引用。再如学科 差异,即使在纳米研究领域,从事纳米生物研究的科 学家人数远远多于从事纳米电子的学者,所以纳米 生物文章可以发到影响因子高达38ceU杂志上, 而最好的电子类期刊之一Progress in Quantum Electronics影响因子也不过7⑨。这也是部分学者批判 期刊影响因子和论文被引频次被滥用的一个重要原 因。因此,为减少或剔除以上干扰因素对基于引用 次数相关指标的影响,可适时引用统计建模控制相 关变量,来量化质量与科技文献影响力的之间的相 关度大小。换言之,为剔除竞争性解释,发现特定自 变量的独立效用,信息计量研究需与经济统计分析法(如多元回归分析、因子分析、断点回归、甚至实 验等等)相结合,在多种假说或理论下,将量化的信 息变量与政治、社会、经济和组织等功能性变量置于 适宜回归分析框架,从而找出各个部分内容之间的联系甚至因果关系。

 

46 (过度)依赖信息计量指标产生的反身性问题

 

过度依赖信息计量分析的科技评价指标和体系,必将产生“上有政策,下有对策”的现象。这一 反身性问题在Nature上发表的“莱顿宣言”中也被 强调¨…。中国当前scI论文的大跃进无疑与其曾 经靠发表篇数来评定晋升的激励政策紧密相关。在 双一流学科建设下,国内高校对sCI一区文章和全 球高被引EsI文章的激励,是基于国际合作的高被 引文章和学科一区文章数量激增的原因之一。在技术创新领域,无论是之前国家专利局SIPO高校申请 专利的膨胀,还是未来很可能出现的高校技术转让的高峰,过度依赖信息计量指标产生的反身性问题不能忽视。

 

值得深思的是,虽然基于信息定量的评价体系诟病颇多,业界仍然倚重。原因不外乎是两害相权取其轻(与对中国高考的态度相仿)。换句话说,除了构建开放、透明的数据采集系统和科学的指标构 建体系之外,培养一个完善的公正的评估专家市场 是信息定量评估成为有效支撑定性专家评估的关键。

 

47信息计量与质性研究相结合,经验论者与价值话语并存

 

信息计量研究有其适用的限定场景。sTI政策 研究的异质性决定了信息计量是一种有效的分析工 具。适宜的定性研究方法(包括但不限于案例分析 或从行为主体角度的质性探索)将对实证分析的结 果做出进一步诠释和补充,从而更好地了解数字背 后的故事、运行机制和规律。此外,当代公共政策研 究的一个重要趋势是经验论证与政策价值话语并 存,基智求善、基真求同。2…。科技创新政策研究亦 是如此。尽管信息计量方法已经并继续会对基于实 证的科技创新政策研究起到重要的推动作用,我们 同时也应认识到,该方法的技术量化性不能超越政 治、社会及研究的大环境。从这个意义上说,为了尽 可能的接近实然真相,从而为科学决策和评价打下坚实基础,信息计量应始于但不能终于“用数据说话”。

 

5 信息计量在科技创新政策研究中的前景

 

在大数据时代,信息计量在科技创新政策研究中具有广阔的应用前景。随着计算机技术和大规模 数据库的迅猛发展,随着TB、甚至PB级别海量信息 的迅猛增长和计量理论和方法的不断发展,信息计量以其客观、透明和可重复性的特征正在也必将继 续成为科技创新政策研究的重要工具。信息计量学自引入中国以来,紧追世界前沿,取得了突飞猛进的 发展。国际上,信息计量与其他学科经典理论与前 沿研究相结合的跨学科研究正成为研究科技政策的 热点和前沿。信息计量学的经典与前沿研究方法能 很好地回答5W问题:whenwhowhatwhomwhere,而其他学科领域相关理论包括定量、定性及混合研究方法则会对whyhow的问题进行诠释。 因此,跨学科的有机融合将使我们更了解、理解真实 世界、预测未来发展、并适时采取政策干预,从而帮助科技政策制定者和科研管理者更加系统地理解科 技创新活动的规律,更好地服务于我国政府科技政策的制定和管理实践。从实践操作的视角来看,信息计量学对科技政策的制定、执行与评估的战略性和系统性方面起到重大支撑作用,其有效应用会使科技创新政策的制定特征更具战略性和系统性。从 学术研究的视角,信息计量学与其他研究领域的前沿理论与方法适时结合,可在科技创新政策领域做出创新性的应用。从学科发展视角,信息计量学也会由此在移植其他学科的理论与研究方法中进一步得到发展,这也是信息计量学这门学科发展的需要和必然选择。


职称
论文

期刊
发表

加急
见刊

写作
咨询

课题
专答

编辑
顾问

关注
我们

返回
顶部