奇宝库 > 什么是数据品质?

什么是数据品质?

数据品质(Data Quality)数据品质是什么数据品质是指数据为了满足特定需要应具有的特性和质量。无论是哪一类模型和分析方法,反映客观事实的数据都是必不可少的。经济计量分析技术与方法的发展,提出对经济计量模

数据品质(Data Quality)

数据品质是什么

数据品质是指数据为了满足特定需要应具有的特性和质量。无论是哪一类模型和分析方法,反映客观事实的数据都是必不可少的。经济计量分析技术与方法的发展,提出对经济计量模型的分层级检验和提高了对经济数据品质的要求。然而,这种做法是在逐级进行经济意义、统计学、计量经济学和延伸的拟合预测检验的同时,也默认地接受了处于更基础层面的假设:建立理论所依赖的基本假设与现实环境的一致性(事先接受了理论无偏性假设),和能够获取真实合理地反映经济现象与运行结果的数据。

数据品质与计量分析

通过数据和定量分析揭示经济运行规律,是认识真实经济世界的一种有效方法,同时也必然对数据的质量和定量分析方法的科学性及相互之间的内在联系提出相应的要求。若缺乏对数据质量的检验,就好像“巧妇难为无米之炊”,原料品质不行,而且不可替换,再好的烹饪大师和厨具条件也难以做出上等佳肴。

客观上经济数据大都具有互为因果的交互性、解释变量之间的共线性和非参数形式的隐函数模型结构等属性,而传统定量分析方法无法突破和消除这些局限性。基于新古典理论的经济计量方法,用外生给定的方法寻找分析起点,回避交互性、共线性和隐函数性等问题。于是,像定义在商品集上的偏好序关系、风险态度、时间价值、技术水平等假设都需要预先给定,因而难以解释和处理新经济增长理论中技术进步内生化的问题。虽然经济计量学的新进展也在不断地放宽约束限制条件,但难以取得根本性突破。实际数据是诸多因素综合影响的结果,在现有的理论框架中,很多因素的影响方式和程度是不可能明确和确切地表示出来。

实验经济学(与行为经济学联袂)的形成动因和主要功能之一是检验经济理论,尤其是逐一验证基本行为假设,如风险态度、偏好稳定性、效用价值、市场竞争、信息和制度规则等对决策行为的影响(Smith,1982,1987,1994;Kahneman, 2003)。由于我国的经济环境并不是原发和培养现代经济学的土壤,理论的系统偏差和数据的复杂性并存,那么就更应该注意到:进行经济定量分析,必须要通过第一层次准则的理论无偏性检验,即检验最基本的行为假设的合理性和建立模型所依据的理论与实际研究对象的符合程度,不能凭经验、按习惯和随“大流”,更不能靠想当然。既要注意实证分析的基础理论与现实的关系,还要看采用什么样的数据才算符合基本要求,数据标准不仅要进行常规的经济理论准则、统计学和计量经济学检验,而且要充分考虑数据的采集和信息来源渠道,注意避免“GARbage in,garbage out”。若对这两方面考虑的不充分,任何高深、先进的定量分析方法都不足以收到良好效果,甚至会南辕北辙。

由于历史不可能原样复制,按现行的统计口径和方法,得不到平行数据,也不会是严格意义上随机抽样获取的数据。迄今为止,经济计量方法并没有明确的平行性检验的要求和做法,采用的逻辑和方法是相对最小化和类比检验,即对于不同国家的经济总体、不同类型的事情和问题多次运用同类方法,如此做法对理论和方法有一定的贡献,但对解释现实问题来说,是必要的但不是充分的。

而平行性检验就是要看来自同一总体的两组不同的样本值,在相同的标准、方法和程序下进行假设检验,要么都接受,要么同是拒绝原假设。这对要检验的命题或假说,逻辑上讲也只是一种必要性而非充分性的检验,仅意味着相对这一组样本值来说没有被证伪,但决不能说明由此已被证实。而实验经济学能够进行平行性检验,在同一次实验中设计多个平行选择项加以验证,又经过由不同的受试着参加、在不同实验室的多次反复实验加以强化。而且实验室环境与真实环境的差异和两种环境下主体行为的差异是可直观感受的,并能控制在一定的范围之内。这些并不像经济计量方法那样严格地受数据限制。

参考文献↑ 王国成 .《理论无偏性与数据品质的提升 》[J].《数量经济研究》.2006年3 期
本文来自网络,不代表本站立场,转载请注明出处: