灰色收入和收入差距是否被夸大

2011-07-04 12:19 作者:王小鲁

我的《灰色收入与国民收入分配》研究报告自2010年发表后，引起了不少关注和争论。其中，罗楚亮、岳希明、李实的一篇文章，对这个灰色收入报告提出了一系列质疑，认为我对灰色收入的估计结果“超出人们常识”，方法上有“比较严重的缺陷”，表示“不认可”这项研究(两文分别见中信出版社《比较》第48辑(2010)和第52辑(2011))。我对这一质疑表示欢迎，并期待学术界更多的讨论和研究。鉴于我与三位质疑者在一些基本看法上，及研究方法和治学态度上都存在分歧，有必要对上述质疑作一个答复。

1. 灰色收入和收入差距是否被夸大

我在灰色收入报告中指出，目前的居民住户统计数据严重低估了高收入居民的真实收入，也低估了收入差距。这有两个原因。其一，样本中的高收入居民，有明显低报收入的倾向，特别是灰色收入，基本上不可能反映出来；其二，现行的住户统计调查对高收入样本有遗漏。两者都会使数据发生系统性偏差。我的报告主要对低报收入的偏差进行了估算和纠正。这是一个初步的探索，未必完善，其中对最高收入居民人均收入的推算可能仍是偏低的。

质疑者承认现行统计数据存在这两方面问题，但对我估算的收入差距和灰色收入数量提出了严重质疑。依据是，既然我的研究只试图解决低报收入问题，而没有对遗漏样本的问题进行纠正，那么实际上“隐性收入”或“灰色收入”就会更大，“也许大到了让人难以置信的程度”。他们说，“面对这些超出人们常识的估计结果，让人不得不理性地对待这些结果的合理性。”

显然，质疑者首先是不认同我的研究结论，认为我估计的隐性收入和灰色收入都太大了。可惜他们并没有提出有说服力的论据，而只以含糊的“大到让人难以置信”、“超出人们常识”作为否定的根据，然后就转而对我的研究和调查方法进行批评。

在讨论方法问题之前，不妨先澄清一下，上述说法是指谁难以置信？超出了谁的“常识”？我的报告发表后，新浪网推出了一项网上调查，截至2011年5月14日，参加调查7918人，认为我的研究高估了灰色收入的占10.3%，认为没有高估的占83.7%。从这些情况看，三位质疑者的常识和大多数公众的常识有很大差距。

撇开所谓常识和我的推算结果不谈，只要仔细看看不同统计数据之间的差异，也能得出理性的判断。首先，根据统计局住户收入数据计算，2008年全国居民可支配收入13万亿元，比国家统计局“资金流量表”中基于全国经济普查计算的居民可支配收入少了5.2万亿元。经济普查覆盖面更广，显然说明住户调查数据有大量遗漏。

其次，根据国家统计局的银行存款、各类投资等统计数据推算，2008年居民储蓄总额应为11—11.5万亿元，而不是按住户统计数据推算的3.5万亿元。加上消费，居民可支配收入应在22.1—22.6万亿元之间，而不是按住户统计计算的13万亿元。请问相差的这9万多亿元是从哪里来的？以上这种情况，每年都在发生。按2009年数据推算，两者的差额超过10万亿元。

其三，用历年商品房销售统计、汽车销售统计、居民私人出国出境旅游统计等数据来推算，居民支出水平都远超出了居民收入统计能够解释的范围。

无需更多的例证，我的报告是否夸大了隐性收入和灰色收入，本着实事求是的态度，人们是能够做出合理判断的。

2. 关于灰色收入课题的研究方法

三位质疑者除了不能接受我的结论，也对我的研究方法提出了许多批评，如我的方法“缺乏稳健的方法论基础”、“缺乏合理的逻辑基础”、模型解释力低、结果的数字不精确、不同方法的推算结果之间有差异，等等。这些理由之间，有些是自相矛盾的，还有一些曲解了报告原意，但指向都很明确，即试图证明我的分析结果“不可信”、“荒谬”。下面择要予以回答。

(1)关于“缺乏稳健的方法论基础”(意思是没有现成的文献依据)，涉及一个更根本的问题，即怎样评价一种研究方法的好与坏？在经济学中有大量问题可以使用学术界公认的现成方法来研究，但还有许多问题是学术界很少涉及，没有现成方法可用，或只有某些不成熟的方法可以参考。对于这类问题，评价研究方法好坏首先要看其对解决悬而未决的问题有无帮助，而不是看有没有前人的现成方法作依据。

(2)质疑者对我的模型R2过低提出了批评，这是合理的，也是其十几条理由中唯一站得住脚的理由。这是这项模型分析的一个不足之处，需要继续改进。但在这一问题上，质疑者也回避了两个重要之点：其一，模型的大多数变量估计值都达到了很高的统计显著性(1%水平)，说明这些解释变量与被解释变量间确实存在预期的相互关系；其二，为了检查结果的可靠性，我用不同的方法和数据进行了交叉检验，结果与模型分析法推算结果非常吻合。这些检验弥补了模型R2较低的缺点，验证了其可信度。

(3)质疑者说，用我的分组比较法，再用他们自己的城镇住户样本数据，按收入排序并按累计的恩格尔系数分组、计算人均收入，然后再与平均分组的人均收入进行比较，发现两者不完全一致，多数组有3%—6%的误差，最高收入组的误差有16%。他们由此作出结论：我的方法“不可行”。

首先，不同方法的计算结果间有3%—6%的差异，并非不可接受的误差。相比之下，国家统计局的住户收入数据和国民经济核算中的居民收入数据之间，差了5万多亿元(以2008年为例)，误差率高达30%(以住户数据为基数则误差40%)。几位质疑者多年来使用统计局住户数据做研究，对这样巨大而且显而易见的误差，不知为何此前从未提出过质疑？

其次，质疑者不会不知道他们使用的高收入样本(应为国家统计局样本的一部分)的收入数据是不够真实的。而对这些收入数据欠真实的样本按不同方法分组，自然产生较大的不一致。但这是他们自己数据产生的问题。

再次，质疑者还使用了不正确的计算方法。他们计算的分组恩格尔系数使用的不是平均法，而是累计法，这种方法实际上给了不同收入水平的住户以不同的权重。因此自然产生一定误差。

(4)质疑者用他们自己的样本数据，计算了不同省份人均收入和恩格尔系数，发现江苏各组比甘肃的恩格尔系数更高，而收入水平也更高，两者相差近一倍。质疑者据此证明，用恩格尔系数推算收入水平的方法，是“荒谬”的。他们没有提供原始数据和具体计算方法，无法检验他们的计算是否正确。但仅从已有信息中，可以发现如下问题：

其一，质疑者使用的数据存在反常。无论是用我们的调查样本数据还是国家统计局的全国样本历年数据，按收入十分组的恩格尔系数都非常有规律地随收入水平上升而下降。这在经济学中是有解释的。而质疑者的江苏样本第二、三、四组的恩格尔系数反而都远高于第一组，第六组高于第五组，第七组高于第五、六组；甘肃第三组高于第二组，第六、七组高于第五组。这样严重反常的情况若不是来自他们数据的质量问题，就是来自他们的计算错误。但他们用自己反常或错误的数据，想要证明别人的方法“荒谬”，是有点幽默感的。

其二，如前述，质疑者已经知道自己的数据存在高收入居民低报收入等系统性偏差；在未采取任何纠正措施的情况下，进行这种分组比较，自然更不可信。

其三，又如前述，质疑者的恩格尔系数计算方法不正确，这也同样会影响两省分组比较的结果。

其四，恩格尔系数不仅与收入水平有关，还和其他一些变量有关(例如教育水平、家庭规模、就业面、地区消费习惯差异等)。我的模型分析法控制了这些变量，分组比较法在我的报告中只是作为参考。而质疑者单挑出分组比较法来，算出某些不正常的结果，是偷换了问题。

5)我在报告中指出，调查发现，高收入居民常常有低报收入的倾向，但他们报告的消费数据偏差小得多。此外当家庭消费被低报时，其食品消费一般也会被低报。而恩格尔系数是这两者的比值，两者的偏差是同方向的，能够互相抵消。因此我们仍然可以得到比较可靠的恩格尔系数。这是我使用恩格尔系数法进行收入推算的前提。

质疑者不会看不懂这些说明，但他们绕开了这些技术问题，笼统地指责我不相信统计局住户调查数据的真实性，却相信住户调查的恩格尔系数的真实性，因此“从一开始就陷入了一种悖论”。这种论证容易误导读者，然而是牵强附会的。

3. 关于灰色收入课题的调查方法

质疑者还列举了很多理由批评我的调查方法，其中许多论点逻辑不清或自相矛盾。归纳一下，大致可分两类：

第一类批评是想证明我们的调查不如统计局的调查可靠，比如，说我们的调查人员“通常”不能保证其专业性，“至少不能说比国家统计局的调查员更专业”；他们还可能会有“职业道德”问题(言外之意就是问卷造假)；我借鉴的社会学典型调查方式“必须满足一个前提条件：所有的个体都是相同的”，否则就“未必合适”。

这些逻辑都有些奇怪。我们的调查员可能有“职业道德”问题，统计局的调查员就不会有同类问题吗？在社会科学领域，根本不存在“所有个体都相同”这样的条件，也没有任何两个个体会完全相同。这是一个根本站不住脚的理由。

质疑者的第二类批评，是说我们的调查方式“与国家统计局并没有实质性的差异”，因此“不能避免国家统计局住户调查中所存在的问题”，我们的方法“没有特别之处”，“看不出……有多么先进”。我的调查样本与统计局样本“收入构成也没有明显的不同”。质疑者还举例说，某些采用询问方式的调查，与统计局的记账式调查结果“非常接近”。

这些说法，看来是想说明我的调查并不比统计局调查更好，但首先就否定了他们自己的第一类批评，说明所谓我的调查方法比统计局的调查方法必然更不可靠的说法，有强词夺理之嫌。我们的调查的确“没有什么特别之处”，只不过是采取了种种可能的措施保证数据真实可靠。我们舍弃随机抽样调查方式，而采用了针对调查员熟悉和了解家庭情况的人群的定向调查方式，并选择匿名调查，就是为了取得更真实的数据。我们还对受访者作了并认真执行了信息保密承诺。我们在调查方法和问卷设计上考虑了受访者的心理反应，这样即使受访者试图低报收入，也很容易从分项支出数据中发现问题。我们还慎重选择了调查的合作对象，规范了调查员资质和经验，认真对各地调查员进行了直接培训和调查指导，及时跟踪处理了调查中遇到的问题，并对调查结果进行了严格的质量检查。相信一些“公事公办”的调查，未必能做到这样的认真程度。

这里有必要回答几个被重点质疑的问题。

(1)调查人员直接调查自己熟悉和了解其家庭经济状况的人群，真能提高调查数据的可靠性、避免低报收入吗？

质疑者表示不相信。还有人说，这反而会增加受访者低报收入的倾向。但这毕竟是他们的主观想象。看调查结果，我们的中、高收入样本在同等消费特征的情况下，报出的收入水平显著高于统计局样本的收入水平。而且收入水平越高，差异越显著，规律性非常明显。这一结果本身明确否定了质疑者的上述想象，说明我们的调查方式和辅助措施有利于提高数据的真实性。

(2)无记名调查方式是否会增加调查员问卷造假的可能性？

无记名调查会减少受访者的顾虑，有利于获得真实信息，但对问卷的质量保证又是一个不利条件。如没有适当的质量控制和检查措施，可能增加造假的概率。对此，我们选择了有良好诚信记录的合作伙伴；对调查员的文化程度、工作态度、调查经验和当地生活背景都提出了明确要求；在培训中强调了杜绝造假的纪律和保证数据真实性的意义；加强了对调查过程的监督和事后复核；并通过严格的问卷质量核查剔除了相当一批有疑问的问卷。实践证明，这些措施是有效的。

(3)我们是怎样对问卷进行核查的？

调查过程的核查：所有调查员在完成每份问卷调查后，都必须按要求填写详细的调查后记，陈述他(她)与每位受访者之间的关系、互相了解的程度、调查时间和过程、受访者对调查的态度、以及调查员对问卷一些主要信息可靠程度的判断。这些给调查督导控制质量、判断信息的真实性提供了帮助。有些不合格的问卷，在督导核查过程中就筛除了。

问卷的事后核查：包括信息的完整性检查、一般逻辑检查、及收支关系检查。后两者主要针对受访者提供不真实的信息，和个别调查员进行造假的可能性。通常，提供虚假信息者很难保证整个问卷信息前后一致，不发生逻辑矛盾。我们设计了专门的检查程序对逐个问卷进行检查。结果在4909份问卷中剔除了714份质量不合格的问卷，约占15%。这些严格的检查，在总体上保证了调查结果的可靠性。

4. 请勿误导读者

在学术讨论中，应该本着客观诚实的学术态度，切忌弄虚作假、误导读者。而质疑者的若干批评，有失上述准则。仅举两例：

(1)为了证明我的研究不可信，质疑者说，我“把所有低报的收入都算作‘灰色收入’”，而且根据我的推算，“最低收入居民的灰色收入增长最快”。这一批评是无中生有的。我在研究报告中明确区分了“隐性收入”和“灰色收入”。前者指居民收入统计没有反映出来中的收入，后者指“无法明确界定、不能清楚地判断其合法或非法的收入”。我推算的2008年居民隐性收入为9.3万亿元，灰色收入为5万亿元。在分布上，我的结论很明确：隐性收入和灰色收入的80%以上都集中在占城镇家庭20%的高收入居民。我推算的最低收入居民收入和统计数据也有较小的差异，但这基本上是普通的统计遗漏和误差，而不是什么灰色收入。

而质疑者却把这些小额遗漏和误差项，牵强附会地解释成所谓“最低收入居民的灰色收入”，还别出心裁地用两个不同年份的最低收入居民遗漏和误差项相除，计算出一个所谓“最低收入居民的灰色收入增长率”。这更远离了我的原意。

质疑者还刻意避开了我所采纳的模型分析法结果，而用我没有采纳的、误差较大的2008年分组比较法结果，去和2005年结果相除，算出一个所谓“最低收入居民的灰色收入增长最快”的结果，试图证明我的推算何等荒谬。但这种论证不仅方法荒谬，而且不诚实。

(2)质疑者的另一个理由，是说根据我的数据计算，中国的基尼系数高达0.685，“把所有的拉美国家都抛在了后头”。因为中国的情况不可能这么坏，由此证明我的研究结果是荒谬的。

但质疑者的这些“计算”，背离了基本的学术准则。

首先，他们改变了我的数字。我推算的2005和2008年城镇居民人均收入与统计局数据的差异，分别是1.78倍和1.90倍(见原文表8)，而他们却说是2.53和2.25倍。仅这一点，就会使基尼系数的计算相差甚远。

其次，要计算全国居民收入的基尼系数，必须有城乡合一的样本数据。国家统计局历来的城镇住户和农村住户调查都是两个互不衔接的样本，且从未公布原始数据。我计算的是城镇居民分组收入，没有涉及农村。而仅仅根据这七组城镇收入数据，无法计算全国基尼系数。因此我自己从未做过这样的计算。而质疑者声称对我的数据进行了“变换”，又与他们自己的农村样本“合并”，从而计算出了一个0.685的“基尼系数”。他们根本没有说清楚，怎样能够把城镇分组数据“变换”成原始样本数据，又怎样和农村的样本数据进行“合并”，只是提供了一个含糊不清的“计算公式”来进行所谓的“变换”，但连公式的含义、理论依据、计算过程、变量各自代表什么都一概没有交代。要把分组数据“变换”回样本数据，就像要把煮好的面条“变换”成原来的小麦。这在理论上肯定站不住脚，在计算上必然漏洞百出。想用这种经不起检验的“论证”来推翻他人的研究，本身是不能成立的。

顺便说说，如果在可靠的数据、合理的方法的基础上，真的计算出了一个很高的基尼系数；如果客观数据及研究结果与我们头脑里先入为主的观念发生冲突，我们应该更相信客观的研究结果，还是相信自己的主观感觉？如果只相信后者，我们为什么还要做研究？

最后，我们说中国存在灰色收入问题，存在低估收入差距的问题，并不意味着其他国家不存在同类问题。因此对灰色收入的研究，也应该是一个有国际意义的课题。但我们既不应该因为自己的问题严重而拒绝承认，也用不着以别人有类似的问题而暗自庆幸，需要的是客观面对和解决自己的问题。

(文章仅代表作者个人立场和观点)

本文短网址： http://m.kzg.io/gb1iwT