返回
首页 > 国际贸易
27 页 客服微信号: bylw8com 客服QQ:3346581880

  2.2数据处理与模型拟合

  由表1可见不同期刊的发表时滞各不相同,平均发表时滞为半年,其中《图书情报工作》半月刊和《现代图书情报技术》月刊的发表时滞最短,从收稿到发表平均不到3个月,《图书馆理论与实践》月刊和《情报科学》月刊发表时滞偏长,平均接近一年。其中原因,已有学者做过详细的分析和阐述,本文不再赘述24。以期刊为单位进行观察,国内图书情报学16种核心期刊的影响力与其当年的平均发表时滞之间并没有显著的相关关系,可以说明发表时滞并非期刊和论文质量的主要影响因素。

  本文主要以论文为单位考察发表时滞与论文被引频次之间的关系。将每一篇论文的发表时滞和被引频次数据对应组合,得到3785组数对,其中有很多论文的发文时滞相同,进一步统计得不同的发文时滞数据共542个,其中最短5天〔0.014年〕,最长884天422年〕。这些数据要根据分析所需进行一定的统计和处理,因此有必要对一些参数进行符号定义和说明。

  2,2.1发表时滞分布函数的拟合

  观察发现,大量论文的发表时滞相同,其中发表时滞为137天的论文数量最多,有32篇,且在其周围的时滞区间内论文数量明显集中;另外发表时滞极长或极短的区间内通常论文数量较少,且存在不连续现象,说明发表时滞过长或过短的现象都具有一定的偶发性。

  为了保证数据的连续性,本文将每组10个数据划为一个时滞区间,以每个闭区间的上界数字为该区间的代表,整理出一组包含54个数据的发表时滞数列,单位为年,统计时保留后3位,由此统计得到的数据如表3。

  将这组数据导入专业的统计软件皿;“I此17中

  进行拟合,发现与双参数威布尔分布的拟合效果较好(图1〉。

  威布尔分布〔贾6出〇11 是瑞典物理

  学家贾‘威布尔教授在其1951年的《一个具有广泛适用性的统计分布函数》25—文中首次阐述的一种随机变量分布,通常用于描述机械电子类产品的磨损累计失效率,经过数十年的发展与应用,威布尔分布已经成为可靠性分析和寿命检验的理论基础,被广泛应用于各个领域解决实际问题。本文拟合发表时滞的双参数威布尔分布是一种单峰偏正态分布函数,其概率密度函数表达式为:

  发表时滞数据。利用皿“I此17的参数估计功能, 〇 9385,拟合所得的概率密度函数曲线记为匕1。^2^2发表时滞-被引频次函数曲线拟合

  按照上文中对发表时滞数据了的整理,分计算54个时滞区间内所有论文的被引频次均值^,象征某个发表时滞区间内论文的整体影响力。由于不同时滞区间内论文数量有很大悬殊,直接计算每个时滞区间的被引频次均值会造成统计结果的不客观,因此对初步计算结果添加一个抗偶发系数七。为了方便与上文拟合的概率密度函数一起比较,再将计算结果与常数系数^10.235相乘,即可得与发表时滞区间相对应的论文影响力I,计算公式为:

  以时滞区间7;为横坐标,与之对应的论文影响力1.为纵坐标,绘制包含54个坐标点的散点折线图,记为匕2。

  观察发现代表发表时滞与论文影响力之间相关关系的折线图匕2的走势与此前拟合的概率密度函数曲线匕1类似,因此以双参数威布尔分布的概率密度函数方程为范本对匕2进行曲线拟合,以便对两条曲线进行比较,并最终找到能使论文影响力最大化的发表时滞区间。利用式0〕对该拟合曲线的参数进行初步估计26,再通过微调使曲线获得最好的拟合效果:反复实验发现在式〔1〕中的^I1.675,0=0.538时拟合效果较好。为该式添加常数系数、^0.560后即可与上文生成的两条曲线在同一坐标系中进行展示,由此而得本文发表时滞与论文影响力相关关系方程,记为匕3。

  3结果分析

  3.1实验结果分析

  曲线匕12是20xx年图书情报学中文核心期刊发表时滞的概率分布曲线,用于描述连续随机变量取值的密集程度。横轴数据为发表时滞,以年为单位;纵轴数据为发表时滞分布的概率密度,其现实意义是不同发表时滞区间内论文的分布概率。

  曲线匕2的峰值出现在^^0.506时,对应的发表时滞约为185天;概率密度函数值在0.6以上的发表时滞在51~320天之间,该区间长度约占时滞区间总体的30,4%,说明大多数论文的发表时滞在这个区间之内,且发表时滞在半年左右的论文数量最为集中,统计数据显示在51~320天内发表的论文共计3024篇,占总数的79^9%,对总体样本有很好的代表性。

首页 上一页 11 12 13 14 15 16 下一页 尾页

猜你喜欢

版权所有 Copyright©2006-2024 毕业论文网 版权所有

苏ICP备14005682号

联系邮箱:Lw54@vip.qq.com