首先,我所依据的理论经验,多是盲人摸象式的观察和感受得到的。这种有偏感受的代表性,自然要影响到模型的质量。由于西方主流经济学的形式化片面发展,使得其经济理论很难符合我国的现实,其解释力也很有限,而我们的很多学者又以学习和借鉴西方理论来构建模型,所以这是目前的大量模型无效的根本原因。
其次,计划经济的实验性道路的失败,社会主义市场经济的初建时间不长。还有很多理论和猜想需要实践的检验。在没有实践检验之前,我们的猜想所产生的任何偏差都会引起模型的无效。
三、对现实观察的恰当性。
统计观察数据是决定模型有效的另一个重要因素,即在模型的初步设计后,我们多会感觉到观察数据的短缺,于是会产生很多获取统计数据途经,进而就会产生一系列的数据代表性问题。这在论文写作中又是普遍存在的较严重的问题,其具体的表现及成因可能有如下几个方面:
第一,有相当一部分论文采取以相关数据来替代实证所需的观察数据,而已有数据的代表性就成为模型有效与否的主要问题。由于已有数据多是国家统计局的公开信息,因此很多模型的内涵不同,实证的结果却都很相近,甚至模型的经济意义都变了味道。
第二,有部分论文采取了自己组织问卷或采访等方式来获取所需数据。这是值得提倡的做法,但是由于观察范围的有限,很难获得会面有代表性的系统数据。进而使得模型也不具有代表性了。
四、模型应用的条件及其恰当性。
反映社会经济现象的系统性模型很多,常见的模型及其应用条件是人们经常忽略的问题,现总结如下:
第一,最简单和最常用的系统模型就是期望值为零,方差为固定常数的随机干扰系统。它是计量经济模型的重要组成部分,建模过程中以残差的方式出现。如果模型中的解释变量能够很好的解释被解释变量的话,则残差将是零均值、同方差、无自相关的平稳变化的随机干扰子系统。否则,残差将表现出存在异方差或自相关等严重问题。
第二,对社会经济现象的动态规律的研究,可以通过自相关、偏自相关、互相关等函数的分布特征,来确定计量经济模型中各变量的滞后阶数。即当某变量的自相关函数是拖尾的,而偏自相关函数表现为 P 阶截尾的特征时,则说明该变量为 P 阶自回归过程 AR(P);如果某变量的自相关函数是 Q 阶截尾的,而偏自相关函数却是拖尾的,则该变量为 Q 阶移动平均过程 MA(Q);如果一个变量的自相关和偏自相关函数都是截尾的或都表现为拖尾的特征时,则该变量就是自回归移动平均过程 ARMA(P,Q)。在回归模型中如果被解释变量是自回归过程,则该模型就叫做自回归模型 ARM;如果解释变量是自回归过程,则该模型叫做分布滞后模型 DLM;如果两者都是自回归过程,该模型就叫做自回归分布滞后模型 ADLM。ADLM 的分布滞后阶数可以通过互相关系数的阶数,或格兰杰因果检验等方法来分析判断。
五、模型的估算和检验的恰当性。
模型的估算和检验多是采用固定的程序进行的,其中的算法、应用条件、使用原则等方面的不恰当使用,或者根本不进行检验等情况的广泛存在,使得模型的有效性大大减弱。常见错误的主要表现如下:
(一)没有进行各类检验或检验内容不全面的问题。
在上期有关计量模型的检验知识介绍中,我们将对模型的检验分为四类,其中的绝大多数检验都是要做的。而我们会看到很多不做检验就使用的模型,这在科学研究中是很避讳的事情,然而这种避讳却是目前很容易出现问题。模型构建中的某些检验是必须要做的,如变量的显着性检验、残差的异方差性和自相关性检验等等都是不能缺省的。
(二)模型估算上的主要问题。
目前在计量建模中的估算方法很多,尤其是机器学习思想引导下,新的人工智能研究所得到估算方法更多。而这些算法所产生的偏差及随机干扰性的误差,多数是不可控制的。其中经过证明的最佳线性无偏估计很少,很多方法需要逐步修正来完善。而这一完善过程需要收敛集中才有意义。可在实际建模中,却存在着大量的只适合内插预测,不适合外推预测的估算模型。
如大量的存在条件异方差、自相关的各类模型,以及向量自回归的、两点法、三点法、指数平滑和移动平均等方法得到的估算模型,往往都存在着这类不收敛问题。