(三)回归与协整分析的恰当使用问题。
回归分析的方法在自然科学的研究中广泛使用,且效果很好。但是在社会科学的研究中,却广泛的存在着伪回归的问题。为了避免伪回归,恩格尔和格兰杰等学者研发出协整分析的相关内容,并因此而获得了诺贝尔经济学奖。然而我们在使用和理解这些知识时却产生了很多问题:
首先,将协整与回归分裂开来,并视为豪不相关的东西。在自然界的大量平稳现象中,回归关系是稳定的,所以回归分析是科学研究中最常用的方法之一。但是在经济学的研究中,人们发现社会经济现象绝大多数都是非平稳的(即单整过程)。在非平稳的现象之间建立回归方程,很容易产生伪回归的结果。即本来豪不相关的现象,往往被认为是因果关系,且统计上是显着的。只有协整系统所表现出的回归关系,才是真正的因果关系,我们称之为协整回归。
协整系统是指由一系列不平稳的单整序列构成的复杂稳定系统。在该系统中,就各个单整序列而言,都是不稳定的。而它们综合在一起时,却表现为平稳的状态。所以在求解回归方程时,需要进行协整性检验,即观察其残差项是否为平稳的,若残差平稳,则回归方程就是协整的回归。
其次,为了避免伪回归,提高寻找协整回归的效率,在建立协整回归之前,先要对各回归元素进行平稳性检验。一般要求各回归元素都是同阶单整过程,若单整阶数不同,则要求被解释变量的单整阶数不能单独高于解释变量的单整阶数,且最高阶的单整变量要在两个以上。这是保证多阶协整关系存在的必要条件。
六、模型能否好用问题。
模型的作用一般认为是预测、政策模拟、结构分析、理论验证等四个方面。其中经济预测是最基本的使用,所以保证能够预测是对模型好用与否的最基本要求。由于早期的计量经济建模多是截面数据模型,用于动态性预测时很不准确,后来人们又开发出很多时序分析的方法。然而时序分析用于预测时,又多基于“鉴往知来”的统计经验规律进行的,所以在不平稳的现实社会经济问题中,由于历史重演的可能性不大的,因此预测也很准确。这样人们比较热中的向量自回归 VAR、AR、ARMA、DLM 等一系列序列模型的使用都未必是有效的。也正因为如此,目前倍受关注的面版数据模型,可以使用静态数据验证动态规律,使用动态数据来验证静态规律,这很可能是较为有效的建模途径。
上述所涉及的各类问题,都是我在教学和科研中发现的,多数同学容易犯的错误。而处理原则也只是我个人的体会和经验,仅供同学们参考使用。
伴随着经济统计发展,经济统计的经验累积,目前的经济统计所需要统计的数据已经非常庞大,数据统计者在进行数据统计时,如果仅适用数理知识的采集,并不会对数据进行深入挖掘,造统计结果不准确。统计数据的数量逐渐增多,数据类别也同样增加,对此,如果仅仅是使用以往的数据统计方式,并不能准确、全面的实现数据分析并统计的工作。数据挖掘技术是目前全新的统计方式,其具备良好的数据统计方式,能够横向的对数据进行挖掘,进而更好的对经济数据进行统计,更好的满足社会对经济统计数据的需求。
一、数据挖掘技术概论。
数据挖掘技术简单的说就是对数据信息进行深入挖掘的一种技术,在实际的使用过程中,能够将复杂的数据库变得更加的简化,进而从中发现能够利用的数据信息,并加以分析和整理,进而达到庞大且散乱的数据得到充分的利用。目前我国的经济数据统计信息量非常庞大,并且还带有数据不完整、随机性强的特点,这些都造成常规的数据统计方式和系统无法充分的分析并统计经济数据。数据挖掘技术能够将这些具备随机性强、完整性低的原始数据进行分析和统计,最终形成一套能够合理利用的统计数据形态,以便于数据使用者更好的对数据进行应用和提取。这样能够将数据进行更准确、更全面的收集、分析和加工的技术被称为数据挖掘。
数据挖掘的特点是能够自动的将有价值的数据发现并收集,然后对其进行处理、加工,将大量的信息处理、加工之后对其进行分析和统计,进而实现数据的有效性、准确性和实用性。