• 理论探索 •
陈道兰 毛一波
摘要: [目的/意义]研究在数据采样不完全情形下广义洛特卡分布特征参数解区间的波动情况。[方法/过程]以《情报理论与实践》期刊为例,对完整数据随机采样得到非完全采样的作者信息,计算广义洛特卡分布特征参数的解区间,描述解区间受数据采样不全引起的波动情况。[结果/结论]数据采样不全将影响解区间的范围,但二者的关系又不完全是负相关关系。数据采样的完整程度达到70%以上可使解区间的中心的波动幅度控制在5%以内,而当数据采样的完整程度达到80%以上,解区间的半径波动幅度能勉强小于20%。为使解区间的估计更接近真实值,应尽可能地对数据进行完全采样。