中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題
中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題聶輝華江艇楊汝岱內(nèi)容提要在經(jīng)驗研究中,企業(yè)級的微觀數(shù)據(jù)正受到越來越多的重視。中國工業(yè)企業(yè)數(shù)據(jù)庫成為國內(nèi)外學(xué)者研究中國企業(yè)行為和績效的主要數(shù)據(jù)庫之一。
但是該數(shù)據(jù)庫存在樣本匹配混亂、變量大小異常、測度誤差明顯和變量定義模糊等嚴(yán)重問題,忽視這些問題可能會導(dǎo)致研究結(jié)論錯誤。本文介紹了該數(shù)據(jù)庫的基本情況和使用現(xiàn)狀,指出了該數(shù)據(jù)庫存在的缺陷,并根據(jù)現(xiàn)有研究提出了改進(jìn)建議。
一引言數(shù)據(jù)是經(jīng)驗研究的細(xì)胞,因此數(shù)據(jù)質(zhì)量的好壞直接決定了經(jīng)驗研究的活力。最近十多年來,國際經(jīng)濟(jì)學(xué)界越來越重視使用微觀面板數(shù)據(jù)longitudinal micro-level da ta的研究。相對于宏觀數(shù)據(jù)或行業(yè)數(shù)據(jù),微觀的企業(yè)數(shù)據(jù)或個體數(shù)據(jù)的優(yōu)勢是非常明顯的:第一,微觀面板數(shù)據(jù)包含了更多信息,例如企業(yè)的所有制、規(guī)模和出口等狀態(tài),這些信息對于企業(yè)行為的研究必不可少;第二,微觀面板數(shù)據(jù)同時包含了時間維度和個體維度,有助于解決計量經(jīng)濟(jì)學(xué)中的個體異質(zhì)性問題,更容易保證估計的一致性;第期第年濟(jì)經(jīng)界世聶輝華:中國人民大學(xué)經(jīng)濟(jì)學(xué)院中國人民大學(xué)企業(yè)與組織研究中心100872 263.net;江艇:中國人民大學(xué)經(jīng)濟(jì)學(xué)院中國人民大學(xué)企業(yè)與組織研究中心電子信箱:econjiang gmail.com;楊汝岱:湘潭大學(xué)消費研究院電子信箱:rudaiyang gmail.com.
作者感謝何帆對本文提出的建議,感謝屠順杰提供的助研工作,同時感謝兩位匿名審稿人指出的有益建議。
本文的研究得到姚洋主持的國家社科基金重大項目我國中長期經(jīng)濟(jì)增長與結(jié)構(gòu)變動趨勢研究09&zd020以及聶輝華、楊汝岱分別主持的教育部新世紀(jì)優(yōu)秀人才項目的資助,特此感謝。當(dāng)然文責(zé)自負(fù)。
三,微觀面板數(shù)據(jù)增加了觀測值個數(shù),使估計更有效率。對于產(chǎn)業(yè)組織理論、企業(yè)理論、公司金融、國際貿(mào)易、收入分配和勞動供給等研究領(lǐng)域來說,經(jīng)驗研究的數(shù)據(jù)主要就是微觀數(shù)據(jù)。
伴隨微觀計量經(jīng)濟(jì)學(xué)的引入和國內(nèi)外微觀數(shù)據(jù)庫的開放,中國經(jīng)濟(jì)學(xué)者越來越重視微觀數(shù)據(jù)的開發(fā)和使用,產(chǎn)生了很多基于微觀數(shù)據(jù)的研究成果。一些中國數(shù)據(jù)庫甚至被全世界各國學(xué)者使用,這一方面表明中國問題越來越受到國際經(jīng)濟(jì)學(xué)界的重視,另一方面也表明中國數(shù)據(jù)的質(zhì)量得到了越來越多的認(rèn)可。特別是相當(dāng)多的國內(nèi)外學(xué)他們的研刊上。作為一個由中國國家統(tǒng)計局收集的數(shù)據(jù)庫,它的優(yōu)點是樣本大、指標(biāo)多、時間長。但是,它畢竟不是一個由學(xué)術(shù)機(jī)構(gòu)發(fā)布的數(shù)據(jù)庫,因此在很多方面還不太符合學(xué)術(shù)研究的嚴(yán)格要求,其缺陷包括樣本匹配混亂、指標(biāo)存在缺失、指標(biāo)大小異常、測度誤差明顯和變量定義模糊等問題。如果研究者沒有察覺到這些數(shù)據(jù)存在的缺陷,并且沒有采取有效的方法緩解或消除這些缺陷,那么就會對經(jīng)驗研究的結(jié)果產(chǎn)生負(fù)面影響,甚至?xí)贸鲥e誤的結(jié)論。而錯誤的結(jié)論對于理論和經(jīng)驗研究來說,不僅浪費了學(xué)者們時間和精力,還可能產(chǎn)生誤導(dǎo)作用。鑒于此,我們認(rèn)為有必要詳細(xì)、嚴(yán)謹(jǐn)?shù)赜懻撝袊I(yè)企業(yè)數(shù)據(jù)庫的基本情況、使用現(xiàn)狀,指出其存在的問題,并盡可能提供解決問題的建議。我們希望,本文的分析不僅有助于潛在使用者了解該數(shù)據(jù)庫的研究現(xiàn)狀和未來方向,還能有助于他們更準(zhǔn)確地使用該數(shù)據(jù)庫,從而推進(jìn)相關(guān)領(lǐng)域的研究發(fā)展。當(dāng)然,作為該數(shù)據(jù)庫的使用者之一,我們并不能保證我們?nèi)娴厥煜ち嗽摂?shù)據(jù)庫,并且我們對問題的分析不可避免地包含了一定的研究傾向。
二數(shù)據(jù)庫基本信息我們首先簡單地描述該數(shù)據(jù)庫的基本情況。中國工業(yè)企業(yè)數(shù)據(jù)庫由國家統(tǒng)計局建立,它的數(shù)據(jù)主要來自于樣本企業(yè)提交給當(dāng)?shù)亟y(tǒng)計局的季報和年報匯總。該數(shù)據(jù)庫的全稱為全部國有及規(guī)模以上非國有工業(yè)企業(yè)數(shù)據(jù)庫,其樣本范圍為全部國有工業(yè)企業(yè)以及規(guī)模以上非國有工業(yè)企業(yè),其統(tǒng)計單位為企業(yè)法人。這里的工業(yè)統(tǒng)計期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱口徑包括國民經(jīng)濟(jì)行業(yè)分類中的采掘業(yè)、制造業(yè)以及電力、燃?xì)饧八纳a(chǎn)和供應(yīng)業(yè)三個門類,主要是制造業(yè)占90以上。這里的規(guī)模以上要求企業(yè)每年的主營業(yè)務(wù)收入即銷售額在500萬元及以上,2011年該標(biāo)準(zhǔn)改為2000萬元及以上?;谏鲜鼋y(tǒng)計口徑的數(shù)據(jù)庫自1998年開始采集,多數(shù)學(xué)者使用的工業(yè)企業(yè)數(shù)據(jù)庫涉及的年份在1999~2007年之間。由于該數(shù)據(jù)庫的主要成分為制造業(yè)企業(yè),在統(tǒng)計口徑上與其他國家的產(chǎn)業(yè)分類比較一致,而且一些變量例如資本、研發(fā)投入和出口交貨值更容易度量,因此使用者通常析出該數(shù)據(jù)庫中的制造業(yè)企業(yè)。制造業(yè)的統(tǒng)計口徑包括從農(nóng)副食品加工業(yè)、食品制造業(yè)到工藝品及其他制造業(yè)、廢棄資源和廢舊材料回收加工業(yè)等30個大類二位數(shù)行業(yè),對應(yīng)于國民經(jīng)濟(jì)行業(yè)分類與代碼gb/ t4754-2002中的代碼13~43不含38.為了保持企業(yè)樣本的完整性,同時與現(xiàn)有研究具有可比性,我們以1999~2007年全部國有及規(guī)模以上非國有工業(yè)企業(yè)作為我們分析該數(shù)據(jù)庫的主要樣本。
1999~2007年中國工業(yè)企業(yè)數(shù)據(jù)庫包括了200多萬個觀測值,每年的樣本企業(yè)數(shù)量從1999年的大約16萬家逐年遞增到2007年的大約33萬家。
在9年樣本期內(nèi),包括上市公司,總共有大約55萬家企業(yè)出現(xiàn)。顯然,這是一個巨大的非平衡面板數(shù)據(jù)。由于企業(yè)關(guān)閉、改制、重組等各種原因,只有46 000萬多家企業(yè)約占樣本企業(yè)總數(shù)的8連續(xù)出現(xiàn)在整個樣本期內(nèi)。該數(shù)據(jù)庫樣本占據(jù)了中國工業(yè)企業(yè)的絕大部分比例。根據(jù)具有可比性的2004年第一次全國經(jīng)濟(jì)普查年報,當(dāng)年工業(yè)企業(yè)銷售額為 442.81億元。而中國工業(yè)企業(yè)數(shù)據(jù)庫當(dāng)年全部樣本企業(yè)的銷售額為195 600億元,約占全國的89.5.
目前,除了經(jīng)濟(jì)普查數(shù)據(jù)庫之外,中國工業(yè)企業(yè)數(shù)據(jù)庫是可獲得的最大的企業(yè)級數(shù)據(jù)庫。表1描述了1999~2007年企業(yè)總數(shù)和國有、集體、民營、外資企業(yè)含港、澳、臺企業(yè)的份額變化??梢钥闯觯瑖泻图w企業(yè)的比例在顯著減少,從1999年的2 /3下降到2007年的不足1 /10,而民營企業(yè)的比例從不足20迅速增加到超過70.該表從一個側(cè)面反映了中國市場經(jīng)濟(jì)結(jié)構(gòu)的劇烈變動。
事實上,工業(yè)企業(yè)數(shù)據(jù)庫是最全面的企業(yè)數(shù)據(jù)庫。該數(shù)據(jù)庫包括企業(yè)的兩類信息:一類是企業(yè)的基本情況,另一類是企業(yè)的財務(wù)數(shù)據(jù)。企業(yè)的基本情況包括:法人代碼、企業(yè)名稱、法人代表、聯(lián)系電話、郵政編碼、具體地址、所屬行業(yè)、注冊類型所有制、隸屬關(guān)系、開業(yè)年份和職工人數(shù)等指標(biāo)。企業(yè)的財務(wù)數(shù)據(jù)則包括:流動資產(chǎn)、應(yīng)期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題學(xué)者們使用的該數(shù)據(jù)庫可能有幾個不同的來源,但是內(nèi)容相差很小。
經(jīng)濟(jì)普查的工業(yè)企業(yè)銷售額來自國家統(tǒng)計局網(wǎng)站《第一次全國經(jīng)濟(jì)普查主要數(shù)據(jù)公報第二號》,工業(yè)企業(yè)數(shù)據(jù)庫中的工業(yè)企業(yè)銷售額來自作者計算。
收賬款、長期投資、固定資產(chǎn)、累計折舊、無形資產(chǎn)、流動負(fù)債、長期負(fù)債、實收資本、主營業(yè)務(wù)收入、主營業(yè)務(wù)成本、營業(yè)費用、管理費用、財務(wù)費用、營業(yè)利潤、利稅總額、廣告費、研究開發(fā)費、工資總額、福利費總額、增值稅、工業(yè)中間投入、工業(yè)總產(chǎn)值和出口交貨值等指標(biāo)。全部指標(biāo)大約為130個。特別的,2004年為第一次全國經(jīng)濟(jì)普查年,因此在數(shù)據(jù)庫中當(dāng)年的企業(yè)指標(biāo)還包括了不同學(xué)歷研究生、本科、大專、中專、高中、初中及以下、不同職稱技術(shù)職稱和技師等的男職工和女職工的相應(yīng)數(shù)量。此外,還包括了企業(yè)是否加入工會以及加入工會的人數(shù)等其他年份所沒有的信息。
中國工業(yè)企業(yè)的類型、數(shù)目和比例年份國有集體民營外資總數(shù)數(shù)據(jù)來源:作者根據(jù)數(shù)據(jù)庫計算得出。
毋庸置疑,工業(yè)企業(yè)數(shù)據(jù)庫的優(yōu)勢非常明顯。第一,它的樣本量非常大,涵蓋了全國所有的國有工業(yè)企業(yè)和規(guī)模以上的非國有工業(yè)企業(yè)。9年的觀測值總數(shù)超過200萬個。2006年之后,每年的樣本企業(yè)數(shù)目超過30萬個。除了普查數(shù)據(jù)庫,還沒有哪個企業(yè)數(shù)據(jù)庫在樣本量上能與之匹敵。從統(tǒng)計學(xué)或計量經(jīng)濟(jì)學(xué)的角度講,大樣本的優(yōu)勢在于降低估計的近似偏誤,提高估計的效率。第二,它的指標(biāo)非常多,包括了企業(yè)的基本情況和企業(yè)的財務(wù)數(shù)據(jù),比較全面地反映了企業(yè)的市場進(jìn)入、投資、借貸、廣告、研發(fā)、出口等行為和企業(yè)的短期與長期經(jīng)營績效,并且企業(yè)加總數(shù)據(jù)反映出企業(yè)所處行業(yè)或地區(qū)的市場結(jié)構(gòu)。從產(chǎn)業(yè)組織理論的角度講,一旦可以獲得市場結(jié)構(gòu)、企業(yè)行為和績效的數(shù)據(jù),學(xué)者們幾乎就可以進(jìn)行任意主題的研究。公司金融、企業(yè)理論、國際貿(mào)易和產(chǎn)業(yè)集聚等相關(guān)領(lǐng)域的研究者們也可以對該數(shù)據(jù)庫各取所需,包括進(jìn)行跨專業(yè)研究。如果將該數(shù)據(jù)庫和其他數(shù)據(jù)庫合并,那么學(xué)者們將會發(fā)現(xiàn)更加豐富的研究視角。
指標(biāo)越多,在構(gòu)建計量方程時解釋變量和控制變量就越多,這樣可以減少遺漏變量問期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱題。第三,它的時間序列比較長。工業(yè)企業(yè)數(shù)據(jù)庫最早的建立年份是1998年,目前已經(jīng)更新到了2008年,前后跨期11年。這使得研究者采用動態(tài)面板方法具有可行性,從而有助于反映歷史因素的作用,以及從動態(tài)的角度研究企業(yè)和產(chǎn)業(yè)的演化過程。
相對而言,目前流行的其他幾個企業(yè)數(shù)據(jù)庫,例如萬得金融數(shù)據(jù)庫、色諾芬經(jīng)濟(jì)金融數(shù)據(jù)庫、國泰安上市公司數(shù)據(jù)庫,樣本企業(yè)都是上市公司,它們的指標(biāo)更全面、準(zhǔn)確,提供指標(biāo)的頻率也更高。比如,這些上市公司數(shù)據(jù)庫通常包括了主要股東持股情況、董事會成員和高管的個人特征以及職位變動,從而可以研究公司治理結(jié)構(gòu)。另外,上市公司數(shù)據(jù)庫不僅包含工業(yè)類上市公司,還包含了金融類和服務(wù)類上市公司,這也是工業(yè)企業(yè)數(shù)據(jù)庫所缺乏的。此外,一些特定的調(diào)查項目也催生了企業(yè)數(shù)據(jù)庫。例如,2006年世界銀行和國家統(tǒng)計局對中國12個省的1200多家企業(yè)進(jìn)行了調(diào)查,內(nèi)容涉及企業(yè)社會責(zé)任、內(nèi)部管理、質(zhì)量管理、勞動管理、環(huán)境管理、市場競爭以及技術(shù)改造等方面。從1991~2006年,中央統(tǒng)戰(zhàn)部和全國工商聯(lián)陸續(xù)對全國民營企業(yè)的經(jīng)營情況進(jìn)行了抽樣調(diào)查,內(nèi)容涉及企業(yè)基本情況、管理體制、企業(yè)家背景以及勞資關(guān)系等方面。
三數(shù)據(jù)庫使用現(xiàn)狀由于工業(yè)企業(yè)數(shù)據(jù)庫的獨特優(yōu)勢,近幾年來每年都有大量的海內(nèi)外經(jīng)濟(jì)學(xué)者使用該數(shù)據(jù)庫撰寫和發(fā)表論文,主題涵蓋產(chǎn)業(yè)組織理論、企業(yè)理論、公司金融、轉(zhuǎn)型經(jīng)濟(jì)學(xué)、國際貿(mào)易、勞動經(jīng)濟(jì)學(xué)和區(qū)域經(jīng)濟(jì)學(xué)等學(xué)科。下面,我們簡要介紹工業(yè)企業(yè)數(shù)據(jù)庫在上述經(jīng)濟(jì)學(xué)分支中的使用現(xiàn)狀。一方面,我們希望這有助于感興趣的研究人員了解人們在不同領(lǐng)域已經(jīng)用該數(shù)據(jù)庫做了什么,還可以做什么;另一方面,我們希望這有助于感興趣的讀者了解現(xiàn)有研究者是如何做這些研究的。當(dāng)然,囿于篇幅和精力,我們不可能囊括所有使用該數(shù)據(jù)庫的文獻(xiàn),而是將目光聚焦于國內(nèi)外的主要學(xué)術(shù)期刊或者流傳較廣的英文文章。
一生產(chǎn)率在所有使用該數(shù)據(jù)庫的相關(guān)研究文獻(xiàn)中,企業(yè)生產(chǎn)率是最受關(guān)注的主題之一。因為生產(chǎn)率是最重要的效率度量,正如克魯格曼krugman,1997所言:生產(chǎn)率不是一切,但是長期來看生產(chǎn)率近似于一切。而且,對于計算企業(yè)生產(chǎn)率而言,工業(yè)企業(yè)數(shù)據(jù)庫提供了加總數(shù)據(jù)所沒有的獨特優(yōu)勢。利用工業(yè)企業(yè)數(shù)據(jù)庫中提供的銷售額或經(jīng)期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題關(guān)于其他的企業(yè)數(shù)據(jù)庫,感興趣的讀者可以訪問香港中文大學(xué)中國研究服務(wù)中心的網(wǎng)站。
濟(jì)增加值表示y、固定資產(chǎn)表示k和職工人數(shù)表示l,采取相應(yīng)的價格指數(shù)進(jìn)行平減,可以計算出每個企業(yè)的勞動生產(chǎn)率和全要素生產(chǎn)率total factors productivity,簡稱tfp.鑒于勞動生產(chǎn)率不能反映資本的效率,因此多數(shù)文獻(xiàn)以tfp作為生產(chǎn)率的度量。又因為制造業(yè)口徑與國際產(chǎn)業(yè)分類更具可比性,所以現(xiàn)有文獻(xiàn)在計算tfp時幾乎都以制造業(yè)企業(yè)為樣本。一些學(xué)者采取了傳統(tǒng)的索洛殘差法solow residual計算tfp,例如謝千里等2008與hsieh和klenow2009;一些學(xué)者采取了主流的op方法olley和pakes,1996,例如張杰等2009、余淼杰2010、聶輝華和賈瑞雪2011、楊汝岱和熊瑞祥2011以及brandt等2012;一些學(xué)者采取了lp方法levinsohn和petrin,2003,例如周黎安等2007;一些學(xué)者采取了隨機(jī)邊界方法sfa,例如劉小玄和李雙杰2008.
二國際貿(mào)易與生產(chǎn)率研究密切相關(guān)的是國際貿(mào)易,更具體地說是考察企業(yè)出口與生產(chǎn)率的關(guān)系。根據(jù)著名的企業(yè)異質(zhì)性假說melitz,2003,生產(chǎn)率高的企業(yè)會傾向于選擇出口,即生產(chǎn)率和出口正相關(guān)。利用工業(yè)企業(yè)數(shù)據(jù)庫,一些學(xué)者檢驗了這一假說對于中國企業(yè)是否成立。張杰等2009利用1999~2003年的制造業(yè)企業(yè)數(shù)據(jù)發(fā)現(xiàn),出口有利于企業(yè)提高tfp,即存在出口的學(xué)習(xí)效應(yīng)。而李春頂2010利用中國1998~2007年的樣本發(fā)現(xiàn),出口企業(yè)的平均tfp或勞動生產(chǎn)率低于內(nèi)銷企業(yè),他認(rèn)為這是生產(chǎn)率悖論。此外,趙偉等2011發(fā)現(xiàn)勞動生產(chǎn)率與出口選擇負(fù)相關(guān),但tfp有時與出口選擇正相關(guān)。這似乎表明,利用該數(shù)據(jù)庫的文獻(xiàn)研究還沒有明確地支持企業(yè)異質(zhì)性假說,但lu2010對此提供了一個理論解釋。還有一些學(xué)者利用工業(yè)企業(yè)數(shù)據(jù)庫做了相關(guān)的研究。例如,余淼杰2010發(fā)現(xiàn),貿(mào)易自由化降低關(guān)稅會提高出口企業(yè)的tfp;包群等2011發(fā)現(xiàn),制造業(yè)企業(yè)出口后對其員工收入的改善并不明顯;楊汝岱和鄭辛迎2011發(fā)現(xiàn)行業(yè)的垂直專業(yè)化程度對企業(yè)員工工資有差異化影響。
三外商直接投資中國加入wto已經(jīng)超過10年了,外商直接投資fdi究竟在中國的經(jīng)濟(jì)發(fā)展中扮演了什么樣的角色?亓朋等2008利用1998~2001年的制造業(yè)企業(yè)數(shù)據(jù),考察了外資企業(yè)對內(nèi)資企業(yè)tfp的溢出效應(yīng),發(fā)現(xiàn)在行業(yè)內(nèi)溢出效應(yīng)不顯著,行業(yè)間和地區(qū)間均存在正的溢出效應(yīng)。羅雨澤等2008使用2000和2002年的制造業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)外商投資企業(yè)對本行業(yè)和本地區(qū)的內(nèi)資企業(yè)有顯著的正溢出效應(yīng)。有趣的是,路江期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱聶輝華和賈瑞雪2011比較了幾種計算tfp方法的優(yōu)劣。
涌2008利用1998~2005年的制造業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)外資企業(yè)對內(nèi)資企業(yè)的溢出效應(yīng)隨地理距離而遞減,在本市內(nèi)溢出效應(yīng)為正,在全國范圍內(nèi)為負(fù),并且對國有企業(yè)為負(fù),對民營企業(yè)為正。du等2012發(fā)現(xiàn),外資企業(yè)對內(nèi)資企業(yè)的溢出效應(yīng)主要通過前向或后向產(chǎn)業(yè)關(guān)聯(lián)實現(xiàn),橫向產(chǎn)業(yè)關(guān)聯(lián)沒有產(chǎn)生顯著的溢出效應(yīng);而且,來自港澳臺的外資企業(yè)和來自外國的外資企業(yè)對內(nèi)資企業(yè)的影響也不相同。xu和sheng2012也得到了類似的發(fā)現(xiàn)。sheng等2011還發(fā)現(xiàn),fdi通過后向產(chǎn)業(yè)關(guān)聯(lián)提高了內(nèi)資企業(yè)的出口價值,通過同行業(yè)的示范效應(yīng)提高了內(nèi)資企業(yè)的出口傾向。chen等2011發(fā)現(xiàn),外資企業(yè)具有明顯的工資溢價,并且對內(nèi)資企業(yè)的工資有抑制作用,從而加劇了企業(yè)之間的工資不平等現(xiàn)象。
四研發(fā)技術(shù)創(chuàng)新是企業(yè)生產(chǎn)率的重要源泉之一,因此企業(yè)的研究開發(fā)r&d行為也備受關(guān)注。關(guān)于r&d的文獻(xiàn)主要分為兩類:第一類是研究r&d或者企業(yè)創(chuàng)新的決定因素,主要是檢驗熊彼特假說;第二類是研究企業(yè)的r&d對績效的影響。聶輝華等2008利用2001~2005年的制造業(yè)企業(yè)數(shù)據(jù),分析后發(fā)現(xiàn)企業(yè)的研發(fā)密度度量創(chuàng)新與規(guī)模、市場競爭之間均呈倒u型關(guān)系,而且盡管國有企業(yè)的研發(fā)密度比民營企業(yè)更高,但是研發(fā)效率更低。hu等2009發(fā)現(xiàn)fdi和企業(yè)改制對于促進(jìn)企業(yè)研發(fā)密度有正面作用。陳林和朱衛(wèi)2011使用2005~2006年的工業(yè)企業(yè)數(shù)據(jù),根據(jù)國有經(jīng)濟(jì)比重區(qū)分行政進(jìn)入壁壘高的行業(yè)和行政進(jìn)入壁壘低的行業(yè),發(fā)現(xiàn)在前一類行業(yè)中創(chuàng)新與市場結(jié)構(gòu)之間呈倒u型關(guān)系,熊彼特假說成立;但是在后一類行業(yè)中結(jié)論相反。chesbrough和liang2007以制造業(yè)中的半導(dǎo)體行業(yè)為例,發(fā)現(xiàn)市場導(dǎo)向會影響企業(yè)r&d的投資回報,即全球市場導(dǎo)向的企業(yè)比國內(nèi)市場導(dǎo)向的企業(yè)能夠獲得更高的r&d回報。戴覓和余淼杰2012發(fā)現(xiàn),出口前的r&d投資能夠促進(jìn)企業(yè)在出口后生產(chǎn)率的提高。
五民營化中國國有企業(yè)改革的主要成效之一,就是大量的國有企業(yè)進(jìn)行了轉(zhuǎn)制,即從百分之百的國有企業(yè)變成了國有控股企業(yè)或者民營企業(yè)。這一點明顯地反映在國有工業(yè)企業(yè)的實收資本成分變化上。tong2009利用1998~2003年的工業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)市場競爭的加劇、fdi集中度的上升以及預(yù)算約束的硬化是國企民營化的主要動因,而且績效相對好的國企更有可能民營化。bai等2009研究了國企民營化的影響,發(fā)現(xiàn)民營化增加了銷售額和勞動生產(chǎn)率,而這主要是通過減少管理費用來實現(xiàn)的。
dougherty等2007發(fā)現(xiàn),民營化通過提高企業(yè)的贏利能力和生產(chǎn)的地區(qū)專業(yè)化水平期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題提高了企業(yè)的生產(chǎn)率。lu等2010發(fā)現(xiàn),集體企業(yè)的私有化導(dǎo)致了銷售成本的上升,但是也降低了管理費用。
六公司金融中國工業(yè)企業(yè)數(shù)據(jù)庫包含了豐富的財務(wù)指標(biāo),因此很多學(xué)者也用它來研究企業(yè)的投資、融資和避稅行為。cai和liu2009提出了一個有趣的問題:競爭是否會加劇公司規(guī)避所得稅?他們識別避稅程度的方式是,比較企業(yè)報告的利潤和根據(jù)會計規(guī)則計算的利潤之間的差額。使用2000~2005年的工業(yè)企業(yè)數(shù)據(jù),他們發(fā)現(xiàn)競爭會加劇企業(yè)的避稅行為。cull等2009認(rèn)為,中國的銀行貸款loan和商業(yè)信用trade credit之間存在一種替代關(guān)系,業(yè)績差的國有企業(yè)會通過商業(yè)信用將銀行貸款再配置給企業(yè)客戶,而業(yè)績好的民營企業(yè)比業(yè)績差的民營企業(yè)更有可能擴(kuò)展商業(yè)信用。余明桂和潘紅波2010利用2004~2007年的工業(yè)企業(yè)數(shù)據(jù)發(fā)現(xiàn),企業(yè)特別是私有企業(yè)會將授予客戶的商業(yè)信用作為產(chǎn)品市場競爭的手段,這驗證了商業(yè)信用的競爭假說。guari glia等2011發(fā)現(xiàn),民營企業(yè)的內(nèi)部融資現(xiàn)金流/總資產(chǎn)是企業(yè)增長的重要約束條件,而國有企業(yè)則不受此類約束。
七產(chǎn)業(yè)集聚利用企業(yè)層面的數(shù)據(jù),我們可以得到行業(yè)或地區(qū)層面的加總數(shù)據(jù),可以反映中國工業(yè)的產(chǎn)業(yè)集聚現(xiàn)象。使用1998~2005年的制造業(yè)企業(yè)數(shù)據(jù),lu和tao2009考察了中國制造業(yè)集聚用eg指數(shù)衡量的決定因素,發(fā)現(xiàn)地方保護(hù)主義國有企業(yè)的雇傭比例是阻礙產(chǎn)業(yè)地區(qū)集聚的主要因素。另外一些學(xué)者考察了產(chǎn)業(yè)集聚對企業(yè)的影響。li等2011發(fā)現(xiàn)產(chǎn)業(yè)集聚對企業(yè)規(guī)模有顯著的正面影響。lin等2011發(fā)現(xiàn),產(chǎn)業(yè)集聚和企業(yè)生產(chǎn)率之間存在一種倒u型關(guān)系。yang和he2011發(fā)現(xiàn)貿(mào)易通過信息和分工影響到出口企業(yè)的地理集聚。
八宏觀政策的微觀影響利用工業(yè)企業(yè)數(shù)據(jù)庫,學(xué)者們還可以研究宏觀政策對企業(yè)微觀行為和績效的影響,并且以經(jīng)驗研究的方式為宏觀政策分析提供微觀基礎(chǔ)。聶輝華等2009利用面板雙重差分did模型,發(fā)現(xiàn)2004年實行的增值稅轉(zhuǎn)型政策顯著地促進(jìn)了企業(yè)的固定資產(chǎn)投資和勞動生產(chǎn)率,但是也減少了企業(yè)的雇傭人數(shù)。袁淵和左翔2011用did方法研究了2003~2005年浙江省擴(kuò)權(quán)強(qiáng)縣政策對企業(yè)增長的影響,發(fā)現(xiàn)這一政策確實提高了縣域企業(yè)的銷售額增長率和資產(chǎn)增長率。彭方平和連玉君2010利用2000~2007年的工業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)短期內(nèi)提高利息的宏觀政策會導(dǎo)致企業(yè)的生產(chǎn)成本提高,從而導(dǎo)致通貨膨脹,即貨幣成本。song等2011推斷,金融歧視政策導(dǎo)致期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱高效率企業(yè)的儲蓄率上升和快速的增長,并進(jìn)而導(dǎo)致巨額的外匯儲備和貿(mào)易順差,然后用1998~2007年的工業(yè)企業(yè)數(shù)據(jù)對此進(jìn)行了驗證。
九其他與工業(yè)企業(yè)數(shù)據(jù)庫有關(guān)的其他經(jīng)驗研究主要聚焦于就業(yè)問題。方明月等2010利用1999~2005年的工業(yè)企業(yè)數(shù)據(jù),采取系統(tǒng)廣義矩估計gmm方法比較了不同所有制企業(yè)的產(chǎn)出的微觀就業(yè)彈性,發(fā)現(xiàn)國有企業(yè)的就業(yè)彈性低于民營企業(yè)的就業(yè)彈性。張光南等2010利用1998~2006年工業(yè)企業(yè)數(shù)據(jù)加總得到各省的基礎(chǔ)設(shè)施、產(chǎn)出和就業(yè)數(shù)據(jù),計算了基礎(chǔ)設(shè)施對產(chǎn)出和就業(yè)的彈性。dong和xu2009討論中國公共部門和私人部門之間的勞動力流動對中國經(jīng)濟(jì)增長的貢獻(xiàn)。
四數(shù)據(jù)庫潛在問題中國工業(yè)企業(yè)數(shù)據(jù)庫為微觀計量經(jīng)濟(jì)學(xué)研究貢獻(xiàn)了不可或缺的素材,但是這個數(shù)據(jù)庫并非完美無缺,而是問題重重。作為使用者,我們發(fā)現(xiàn)了工業(yè)企業(yè)數(shù)據(jù)庫存在樣本錯配、指標(biāo)缺失、指標(biāo)異常、樣本選擇和測度誤差等諸多問題。如果忽視這些問題,經(jīng)驗研究的結(jié)果可能不穩(wěn)健,甚至可能是錯誤的?,F(xiàn)有文獻(xiàn)部分地發(fā)現(xiàn)了這些問題,并且提供了部分解決方法。下面,我們在現(xiàn)有文獻(xiàn)的基礎(chǔ)上,結(jié)合我們的使用經(jīng)驗,將工業(yè)企業(yè)數(shù)據(jù)庫的潛在問題進(jìn)行歸納,并且盡可能地提供解決問題的方法建議。
一樣本匹配問題對于一個多年企業(yè)數(shù)據(jù)來說,整理數(shù)據(jù)的第一步就是構(gòu)建一個以企業(yè)id和年份為兩維的面板數(shù)據(jù)。這通常不是一個問題,但是對于中國工業(yè)企業(yè)數(shù)據(jù)庫卻是一個非常棘手的問題。因為在該數(shù)據(jù)庫中,難以找到一個識別每個樣本企業(yè)的唯一特征來進(jìn)行編碼。通常的做法是,根據(jù)企業(yè)代碼、企業(yè)名稱、法人代表姓名、地址、郵編、電話、行業(yè)代碼、主要產(chǎn)品名稱、開業(yè)時間等基本信息來識別不同的樣本點是否來自同一家企業(yè)。但是因為這些基本信息在申報時沒有統(tǒng)一格式,在缺乏有效的智能模糊匹配手段的情況下,精確匹配的可操作性不強(qiáng)。其中,企業(yè)代碼和企業(yè)名稱的準(zhǔn)確性相對較高,可以作為我們進(jìn)行匹配所依據(jù)的主要信息,比如brandt等2012就是先根據(jù)相同的企業(yè)代碼識別同一家企業(yè),然后再根據(jù)相同的企業(yè)名稱進(jìn)行識別,最后再參考其他基本信息。這種序貫識別法假定企業(yè)代碼的準(zhǔn)確性最高,企業(yè)名稱準(zhǔn)確性其次。也就是說共享同一企業(yè)代碼的樣本點必然被識別為同一企業(yè),但同一企業(yè)的各樣本點可能擁有不同的企業(yè)代碼。在本數(shù)據(jù)庫中,不但存在同一企業(yè)更改企業(yè)代碼的情況例如在期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題發(fā)生改制或重組之后,更重要的是,還存在不同的企業(yè)共享企業(yè)代碼的情況也許是統(tǒng)計失誤。企業(yè)名稱這一變量也存在類似問題。很多企業(yè)在改制、重組或者擴(kuò)張時更改了企業(yè)名稱。例如,中國有不少企業(yè)先是名為xx廠,然后改名為xx有限責(zé)任公司,接著又稱為xx股份有限公司。有時企業(yè)名稱中的地理位置也略有差異,例如從xx市機(jī)電廠變成xx機(jī)電廠。如果按照企業(yè)名稱進(jìn)行精確匹配會錯誤地識別出過多的企業(yè)。
我們建議的做法是:將企業(yè)按企業(yè)代碼和企業(yè)名稱分別進(jìn)行兩次分組,然后考察同一名稱組下的企業(yè)是否分屬不同的代碼組。若是,則將這些不同代碼組內(nèi)的所有企業(yè)都?xì)w為一組對每一名稱組都依此進(jìn)行操作,不斷重新歸組,可以稱之為交叉匹配;若新組內(nèi)沒有年份重復(fù)的觀測值,則將這一組樣本點識別為同一家企業(yè);若新組內(nèi)存在年份重復(fù)的觀測值,則進(jìn)入下一步人工識別。在人工識別階段可能存在多種情況,需要根據(jù)數(shù)據(jù)特征和基本信息進(jìn)行綜合判斷。例如,同一組內(nèi)的樣本點可能屬于同一家企業(yè),只是其中某些年份有兩個觀測值,這兩個觀測值只需要保留一個,另一個完全重復(fù)或關(guān)鍵變量均缺失。同一組內(nèi)的樣本點也可能屬于不同企業(yè),但其中可能存在企業(yè)代碼登記錯誤的情況,此時需要參照企業(yè)名稱、法人代表姓名、地址、行業(yè)代碼、銷售額或注冊資本等關(guān)鍵變量的數(shù)量級等信息進(jìn)行分類,確定哪些樣本屬于同一家企業(yè)。我們發(fā)現(xiàn),使用交叉匹配方法后,大約有10的觀測值大約20萬個屬于名稱相同但法人代碼不同或者相反的情況。顯然,如果忽視匹配問題會嚴(yán)重地影響樣本的真實性和準(zhǔn)確性。
除了企業(yè)匹配存在一些障礙,產(chǎn)業(yè)匹配也有一些問題。使用者必須注意到,2002年前后統(tǒng)計局使用了兩種產(chǎn)業(yè)分類標(biāo)準(zhǔn):2002年及其之前的年份為gb/t 4754-1994,2002年之后為gb/t 4754-2002.兩種行業(yè)分類標(biāo)準(zhǔn)在兩位數(shù)行業(yè)上沒有差異,在三位數(shù)行業(yè)上有一些差異,在四位數(shù)行業(yè)上有較大差異。楊汝岱和鄭辛迎2011與楊汝岱和熊瑞祥2011將1994gb四位數(shù)行業(yè)分類對應(yīng)到2002gb三位數(shù)行業(yè)分類,這是一種可供參考的做法。
二指標(biāo)缺失問題工業(yè)企業(yè)數(shù)據(jù)庫每年的統(tǒng)計對象和口徑都有所不同,導(dǎo)致一些重要指標(biāo)在若干年份缺失。首先,有些工業(yè)企業(yè)數(shù)據(jù)庫直接將2004年的經(jīng)濟(jì)普查數(shù)據(jù)與其他年份混編在一起,而沒有和其他年份進(jìn)行匹配。這導(dǎo)致2004年的數(shù)據(jù)缺少工業(yè)總產(chǎn)值、工業(yè)增期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱最近,很多研究將工業(yè)企業(yè)數(shù)據(jù)庫和海關(guān)數(shù)據(jù)庫結(jié)合起來。對于此類研究的某些主題,還需要將國民經(jīng)濟(jì)行業(yè)分類與海關(guān)hs產(chǎn)品分類對應(yīng)起來,具體分析可以參考楊汝岱2008.
加值、出口交貨值和研究開發(fā)費等重要指標(biāo)。與此同時,和2004年相比,其他年份又缺少關(guān)于工會、男女職工的學(xué)歷和技術(shù)職稱等指標(biāo)。因此,使用者在分析數(shù)據(jù)之前,應(yīng)該先查看2004年數(shù)據(jù)和其他年份數(shù)據(jù)之間的指標(biāo)差異。
其次,2003年前后的指標(biāo)也有一些不同。例如,2001年之前的數(shù)據(jù)不包括研發(fā)費用。有些數(shù)據(jù)庫中1999~2003年的工業(yè)企業(yè)數(shù)據(jù)沒有工業(yè)增加值,也沒有應(yīng)收賬款,但是有應(yīng)收賬款凈額。根據(jù)會計準(zhǔn)則,應(yīng)收賬款凈額=應(yīng)收賬款總額-壞賬準(zhǔn)備期末余額,因此兩者不能簡單地比較。在缺失工業(yè)增加值的年份,使用者可以根據(jù)會計準(zhǔn)則估算工業(yè)增加值:工業(yè)增加值=工業(yè)總產(chǎn)值-工業(yè)中間投入增值稅。在沒有工業(yè)總產(chǎn)值的年份例如2004年,估算公式為:工業(yè)增加值=產(chǎn)品銷售額-期初存貨期末存貨-工業(yè)中間投入增值稅。劉小玄和李雙杰2008就采取了這種估算方法。
我們用第一個公式估算了2005~2007年的工業(yè)增加值,發(fā)現(xiàn)平均而言估算值略小于報告值。當(dāng)使用者用工業(yè)增加值來計算生產(chǎn)率時,應(yīng)注意到這種差別。
報告的和估算的工業(yè)增加值比較千元報告值計算值觀測值個數(shù)說明:報告值和估算值皆為均值,且計算時未剔除異常觀測值。
需要特別指出的是,盡管工業(yè)企業(yè)數(shù)據(jù)庫提供了企業(yè)的出口交貨值,但據(jù)此只能判斷企業(yè)是否出口,而無法區(qū)分出口類型是加工貿(mào)易還是一般貿(mào)易。對于勞動密集型的加工貿(mào)易企業(yè)而言,其勞動生產(chǎn)率和全要素生產(chǎn)率很可能低于一般貿(mào)易的出口企業(yè)。另外,加工貿(mào)易是發(fā)展中國家的特殊現(xiàn)象。如果不區(qū)分兩類出口企業(yè),簡單地將全部出口企業(yè)的效率與內(nèi)銷企業(yè)的效率相比,那么得到出口企業(yè)的平均效率低于內(nèi)銷企業(yè)也就不足為奇了。
事實上,dai等2011將工業(yè)企業(yè)數(shù)據(jù)與海關(guān)數(shù)據(jù)匹配,在剔除了加工貿(mào)易企業(yè)之后,發(fā)現(xiàn)生產(chǎn)率悖論并不存在。
三指標(biāo)異常問題盡管工業(yè)企業(yè)數(shù)據(jù)庫包含了130多個指標(biāo),但是有相當(dāng)多的指標(biāo)存在異常值。異常值的存在使得很多觀測值無效,因此在進(jìn)行計量回歸前必須予以剔除。我們注意期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題在這個意義上,我們認(rèn)為工業(yè)企業(yè)數(shù)據(jù)庫本身可能不適于檢驗國際貿(mào)易的企業(yè)異質(zhì)性假說。
一些學(xué)者對工業(yè)企業(yè)數(shù)據(jù)庫和海關(guān)數(shù)據(jù)庫進(jìn)行了匹配,但由于原始數(shù)據(jù)結(jié)構(gòu)和方法各異,匹配效果差別甚大。yu2011根據(jù)郵編和電話等信息匹配了海關(guān)庫30的出口企業(yè),而tang2011匹配了工業(yè)庫70的出口企業(yè)。yang和he2011以企業(yè)名稱、郵編、電話等信息為基礎(chǔ),采用關(guān)鍵詞數(shù)據(jù)庫搜尋匹配方法,匹配了海關(guān)庫60的出口份額。
到,cai和liu2009使用了比較全面的剔除方式,因此被較多的研究者所借鑒。第一步,他們剔除了關(guān)鍵指標(biāo)例如,總資產(chǎn)、職工人數(shù)、工業(yè)總產(chǎn)值、固定資產(chǎn)凈值和銷售額缺失的觀測值;第二步,他們剔除了不滿足規(guī)模以上標(biāo)準(zhǔn)的觀測值,即固定資產(chǎn)凈值低于1000萬元,或者銷售額低于1000萬元,或者職工人數(shù)少于30人的觀測值;第三步,他們剔除了一些明顯不符合會計原則的觀測值,包括總資產(chǎn)小于流動資產(chǎn),總資產(chǎn)小于固定資產(chǎn)凈值,或者累計折舊小于當(dāng)期折舊的觀測值;第四步,他們剔除了關(guān)鍵指標(biāo)的極端值前后各0.5.
以1999~2007年為例,我們分析了指標(biāo)異常問題。首先,在總共2048 833個觀測值中,我們剔除了銷售額、職工人數(shù)、總資產(chǎn)或固定資產(chǎn)凈值缺失的觀測值5900多個,約占全部觀測值的0.3.其次,我們根據(jù)謝千里等2008的做法,剔除了職工人數(shù)少于8人的觀測值28 000多個這些企業(yè)缺乏可靠的會計系統(tǒng),約占總數(shù)的1.
再次,我們剔除了總資產(chǎn)小于流動資產(chǎn),總資產(chǎn)小于固定資產(chǎn)凈值,或者累計折舊小于當(dāng)期折舊的觀測值200多個。最后,我們剔除了銷售額低于500萬元的觀測值176 500多個,約占總數(shù)的9.經(jīng)過上述四個步驟,我們總共剔除了大約20萬個觀測值,約占總數(shù)的10.盡管進(jìn)行了上述剔除,但是我們?nèi)匀话l(fā)現(xiàn)有不少觀測值屬于異常值。例如,如果按照bai等2009的標(biāo)準(zhǔn),利潤率低于0.1或者高于99的觀測值均為異常值,那么這部分異常值還有大約43萬個,約占總數(shù)的23.或者我們使用一種比較寬松的標(biāo)準(zhǔn),會發(fā)現(xiàn)實收資本小于或等于0的異常觀測值有11 000多個,約占總數(shù)的6.因此,即便做了上述剔除,使用者仍然需要剔除計量方程的關(guān)鍵變量或參數(shù)所對應(yīng)的異常值。我們將未做任何剔除的主要指標(biāo)的異常情況總結(jié)為表3.
主要指標(biāo)的異常情況剔除標(biāo)準(zhǔn)異常值個數(shù)觀測值總數(shù)異常值比例銷售額、職工人數(shù)、總資產(chǎn)或固定資產(chǎn)凈值缺失職工人數(shù)少于8總資產(chǎn)小于流動資產(chǎn),總資產(chǎn)小于固定資產(chǎn)凈值,或者累計折舊小于當(dāng)期折舊銷售額低于500萬元利潤率低于0.1或者高于99實收資本小于或等于0期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱他們使用的規(guī)模以上的標(biāo)準(zhǔn)不同于官方標(biāo)準(zhǔn)銷售額在500萬元以上。
四測度誤差問題國家統(tǒng)計局在收集工業(yè)企業(yè)數(shù)據(jù)時,不是一次性交給企業(yè)一份報表,而是讓企業(yè)通過年報和定期上報的方式將數(shù)據(jù)報告給統(tǒng)計局,然后統(tǒng)計局再進(jìn)行匯總。事實上,企業(yè)上報系統(tǒng)至少包括四套表格:綜合年報表、綜合定報表、基層年報表和基層定報表。這意味著,由于統(tǒng)計時間或者統(tǒng)計口徑不同,即使對同一個指標(biāo),企業(yè)在不同時間上報的數(shù)值也可能不一樣。另外,很多規(guī)模不大的企業(yè)仍然缺乏可靠的會計系統(tǒng),或者為了避稅而瞞報,甚至錯報有關(guān)指標(biāo),這些都會導(dǎo)致測度誤差問題。
以研發(fā)費為例。在2001~2007年不含普查年份2004年,在總共140多萬個觀測值中,研發(fā)費顯示為0的觀測值有120多萬個,占總數(shù)的89.研發(fā)費報告為0的有3種情況:1企業(yè)沒有研發(fā)支出,因此研發(fā)費確實為0;2企業(yè)不清楚,任意地報告0;3企業(yè)沒填寫此項,統(tǒng)計人員直接賦值0.如果是第1、2種情況,那么這更可能發(fā)生在中小企業(yè)身上。于是,我們剔除了銷售額低于3億元的中小企業(yè),又剔除了出口企業(yè),發(fā)現(xiàn)在剩下的28 000多個觀測值中,研發(fā)費顯示為0的仍然有20 000多個,比例超過70.這里提醒研究者注意兩點:第一,如果絕大多數(shù)中小企業(yè)沒有研發(fā)費,并且這是真實的情況,那么在分析企業(yè)研發(fā)支出或創(chuàng)新的決定因素時,最好使用tobit截斷模型例如聶輝華等,2008,因為這比最小二乘法ols回歸更可能得到一致估計;第二,如果我們無法區(qū)分第2、3種情況,那么研發(fā)費這一指標(biāo)的準(zhǔn)確性和真實性就值得懷疑,此時用工業(yè)企業(yè)數(shù)據(jù)庫來分析研發(fā)的決定因素或者研發(fā)績效可能是不恰當(dāng)?shù)摹?br>存在明顯測度誤差的其他指標(biāo)主要是利潤和增加值。由于企業(yè)報告的利潤和增加值與企業(yè)的稅負(fù)正相關(guān),因此企業(yè)在監(jiān)管不力的前提下可能會低報或誤報這兩個指標(biāo)。事實上,cai和liu2009根據(jù)會計準(zhǔn)則估算了企業(yè)的利潤=工業(yè)總產(chǎn)值-中間投入-財務(wù)費用-工資-當(dāng)期折舊-增值稅,然后發(fā)現(xiàn)在2000~2005年間,估算利潤率均值為0.1431,而企業(yè)報告的利潤率均值為0.0515,后者比前者少了2 /3以上。
此外,根據(jù)我們前面對2005~2007年間工業(yè)增加值的估算,可以發(fā)現(xiàn)估算的工業(yè)增加值要略小于報告的工業(yè)增加值。
另一個不屬于經(jīng)典測度誤差但是與此有關(guān)的問題是虛假指標(biāo)問題。在1999~2007年間,根據(jù)注冊類型,有大約1 /5的觀測值大約40萬個屬于外資企業(yè)包括港澳臺商投資企業(yè)和外商投資企業(yè)。這一比例之高超乎我們的直覺,因為眾所周知的事實是,外資企業(yè)可以享受各種稅收優(yōu)惠。進(jìn)一步分析發(fā)現(xiàn),這些樣本企業(yè)雖然登記為外資企業(yè),但是在其實收資本份額中,有6的港澳臺資本或外商資本金額為0,其期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題中有一半左右的登記注冊號明確標(biāo)明了外資身份例如注明企合津總字第xx號。這有兩種可能,一是這些企業(yè)以前是外資企業(yè),但是變更了實收資本之后沒有及時變更登記注冊類型;二是這些企業(yè)錯誤地填報了注冊類型。剩下的94的外資企業(yè),我們無法確認(rèn)其真實身份,也難以排除其中的假外企。
五樣本選擇問題在樣本選擇方面,工業(yè)企業(yè)數(shù)據(jù)庫的一個突出問題是,包括了全部的國有工業(yè)企業(yè),但是只包括了規(guī)模以上的非國有工業(yè)企業(yè)。因此,當(dāng)使用者要對比國有企業(yè)和非國有企業(yè)的行為及績效時,最好將規(guī)模以下的國有企業(yè)樣本剔除。而當(dāng)使用者在研究產(chǎn)業(yè)集聚問題時,可能會低估非國有企業(yè)的集聚程度lu和tao,2009.但規(guī)模以上的樣本并非都是隨機(jī)的。在1999~2007年間的總共200多萬個觀測值中,只有大約8的企業(yè)每年都存在,有大約22的企業(yè)在最后三年都存在。一個企業(yè)某年不在樣本中,可能是因為當(dāng)年銷售額小于500萬元,也可能是因為破產(chǎn)、重組或者更改名稱等原因,還有可能是被漏報。在這種情況下,我們難以嚴(yán)格地界定企業(yè)的進(jìn)入和退出,因此研究者在用這個數(shù)據(jù)庫分析企業(yè)動態(tài)學(xué)時必須力爭解決或減緩這個問題。
另外,該數(shù)據(jù)庫中包含了企業(yè)所在地的詳細(xì)信息,使用者可以識別出企業(yè)是否處于經(jīng)濟(jì)特區(qū)或經(jīng)濟(jì)開發(fā)區(qū)。因為經(jīng)濟(jì)特區(qū)或經(jīng)濟(jì)開發(fā)區(qū)的企業(yè)具有自身的特點,這種區(qū)分有助于減少企業(yè)在比較生產(chǎn)率、產(chǎn)業(yè)集聚、利潤率以及融資成本等方面的樣本選擇問題。還有一個比較棘手的問題是,統(tǒng)計局對企業(yè)的統(tǒng)計口徑是法人企業(yè),而不是企業(yè)集團(tuán)或工廠。因此,有很多屬于同一個企業(yè)集團(tuán)的企業(yè)會被認(rèn)定為不同的企業(yè),而多個工廠的差別則會被掩蓋在企業(yè)內(nèi)部。
六變量定義問題分析中國的企業(yè)不可能忽略企業(yè)的所有制問題。我們注意到,現(xiàn)有文獻(xiàn)在識別企業(yè)的所有制時通常采取兩種方式:注冊類型或?qū)嵤召Y本。這兩種識別企業(yè)所有制的方法其實是有差別的。前者表示企業(yè)在工商局登記注冊時的類型,后者能夠表示企業(yè)當(dāng)時的真實控股類型。我們不妨將注冊類型為國有、國有聯(lián)營、國有與集體聯(lián)營、國有獨資公司這幾類企業(yè)定義為i類國有企業(yè),同時根據(jù)實收資本將國有資本比例超過50的企業(yè)定義為ii類國有企業(yè)。在1999~2007年工業(yè)企業(yè)數(shù)據(jù)庫中,在剔除了實收資本為異常值的觀測值之后,i類國企有245 376個觀測值,ii類國企有252 629個觀測值,后者比前者多3左右,兩者重合的觀測值大約占i類國企的84,這意味著至少有15的國有企業(yè)雖然注冊類型是國有企業(yè),但是已經(jīng)不是真正的國有業(yè)企了。由于控股比例更能及時地反映企業(yè)的所有制類型,因此我們建議使用者最好期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱使用實收資本比例來定義企業(yè)所有制。
外資企業(yè)的識別也存在類似的問題。根據(jù)中國的法律,外資企業(yè)的投資比例原則上不低于25.盡管有大約1 /5的觀測值的注冊類型顯示為外資企業(yè),但是其中有10觀測值的港澳臺商投資或外商投資比例低于25.一些研究者以外商的實收資本比例是否超過25作為識別外資企業(yè)的方法路江涌,2008.
除了所有制類型,一個難以準(zhǔn)確定義的變量就是資本。理論上,資本是固定資產(chǎn)存貨和投資流量的加總。多數(shù)文獻(xiàn)的做法是,將資本定義為固定資產(chǎn)原價或者固定資產(chǎn)凈值,然后采取永續(xù)盤存法來計算投資i it-1,其中i表示投資,k率的選取通常是5、10或15.此外,還應(yīng)該采取不同的價格指數(shù)對產(chǎn)值、資本、投資和中間投入等變量進(jìn)行平減。我們必須提醒使用者的是,不同的資本定義方法、折舊率以及價格平減指數(shù)會得到不同的結(jié)果。brandt等2012提供了比較詳細(xì)的說明和操作程序。
陳林、朱衛(wèi)2011:《創(chuàng)新、市場結(jié)構(gòu)與行政進(jìn)入壁壘―――基于中國工業(yè)企業(yè)數(shù)據(jù)的熊彼特假說實證檢驗》,戴覓、余淼杰2012:《企業(yè)出口前研發(fā)投入、出口及生產(chǎn)率進(jìn)步》,北京大學(xué)工作論文。
李春頂2010:《中國出口企業(yè)是否存在生產(chǎn)率悖論:基于中國制造業(yè)企業(yè)數(shù)據(jù)的檢驗》,《世界經(jīng)濟(jì)》第7期。
劉小玄、李雙杰2008:《制造業(yè)企業(yè)相對效率的度量和比較及其外生決定因素2000―2004》,《經(jīng)濟(jì)學(xué)羅雨澤、朱善利、陳玉宇、羅來軍2008:《外商直接投資的空間外溢效應(yīng):對中國區(qū)域企業(yè)生產(chǎn)率影響的經(jīng)聶輝華、譚松濤、王宇鋒2008:《創(chuàng)新、企業(yè)規(guī)模和市場競爭―――基于中國企業(yè)層面面板數(shù)據(jù)的證據(jù)》,《世聶輝華、方明月、李濤2009:《增值稅轉(zhuǎn)型對企業(yè)行為和績效的影響―――以東北地區(qū)為例》,《管理世界》第期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題每個企業(yè)報告了總的實收資本以及國有、集體、法人、私人、港澳臺和外商等6種成分的實收資本數(shù)額,因此企業(yè)的其他所有制類型也可以通過實收資本比例來識別。
亓朋、許和連、艾洪山2008:《外商直接投資企業(yè)對內(nèi)資企業(yè)的溢出效應(yīng):對中國制造業(yè)企業(yè)的實證研究》,楊汝岱、熊瑞祥2011:《干中學(xué)與中國工業(yè)企業(yè)出口生產(chǎn)率》,湘潭大學(xué)工作論文。
楊汝岱、鄭辛迎2011:《垂直專業(yè)化對員工工資的差異化影響》,湘潭大學(xué)工作論文。
張光南、李小瑛、陳廣漢2010:《中國基礎(chǔ)設(shè)施的就業(yè)、產(chǎn)出和投資效應(yīng)―――基于1998-2006年省際工業(yè)企張杰、李勇、劉志彪2009:《出口促進(jìn)中國企業(yè)生產(chǎn)率提高嗎?―――來自中國本土制造業(yè)企業(yè)的經(jīng)驗證據(jù):趙偉、趙金亮、韓媛媛2011:《異質(zhì)性、沉沒成本與中國企業(yè)出口決定:來自中國微觀企業(yè)的經(jīng)驗證據(jù)》,《世期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱截稿:2012年3月責(zé)任編輯:王徽期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題
但是該數(shù)據(jù)庫存在樣本匹配混亂、變量大小異常、測度誤差明顯和變量定義模糊等嚴(yán)重問題,忽視這些問題可能會導(dǎo)致研究結(jié)論錯誤。本文介紹了該數(shù)據(jù)庫的基本情況和使用現(xiàn)狀,指出了該數(shù)據(jù)庫存在的缺陷,并根據(jù)現(xiàn)有研究提出了改進(jìn)建議。
一引言數(shù)據(jù)是經(jīng)驗研究的細(xì)胞,因此數(shù)據(jù)質(zhì)量的好壞直接決定了經(jīng)驗研究的活力。最近十多年來,國際經(jīng)濟(jì)學(xué)界越來越重視使用微觀面板數(shù)據(jù)longitudinal micro-level da ta的研究。相對于宏觀數(shù)據(jù)或行業(yè)數(shù)據(jù),微觀的企業(yè)數(shù)據(jù)或個體數(shù)據(jù)的優(yōu)勢是非常明顯的:第一,微觀面板數(shù)據(jù)包含了更多信息,例如企業(yè)的所有制、規(guī)模和出口等狀態(tài),這些信息對于企業(yè)行為的研究必不可少;第二,微觀面板數(shù)據(jù)同時包含了時間維度和個體維度,有助于解決計量經(jīng)濟(jì)學(xué)中的個體異質(zhì)性問題,更容易保證估計的一致性;第期第年濟(jì)經(jīng)界世聶輝華:中國人民大學(xué)經(jīng)濟(jì)學(xué)院中國人民大學(xué)企業(yè)與組織研究中心100872 263.net;江艇:中國人民大學(xué)經(jīng)濟(jì)學(xué)院中國人民大學(xué)企業(yè)與組織研究中心電子信箱:econjiang gmail.com;楊汝岱:湘潭大學(xué)消費研究院電子信箱:rudaiyang gmail.com.
作者感謝何帆對本文提出的建議,感謝屠順杰提供的助研工作,同時感謝兩位匿名審稿人指出的有益建議。
本文的研究得到姚洋主持的國家社科基金重大項目我國中長期經(jīng)濟(jì)增長與結(jié)構(gòu)變動趨勢研究09&zd020以及聶輝華、楊汝岱分別主持的教育部新世紀(jì)優(yōu)秀人才項目的資助,特此感謝。當(dāng)然文責(zé)自負(fù)。
三,微觀面板數(shù)據(jù)增加了觀測值個數(shù),使估計更有效率。對于產(chǎn)業(yè)組織理論、企業(yè)理論、公司金融、國際貿(mào)易、收入分配和勞動供給等研究領(lǐng)域來說,經(jīng)驗研究的數(shù)據(jù)主要就是微觀數(shù)據(jù)。
伴隨微觀計量經(jīng)濟(jì)學(xué)的引入和國內(nèi)外微觀數(shù)據(jù)庫的開放,中國經(jīng)濟(jì)學(xué)者越來越重視微觀數(shù)據(jù)的開發(fā)和使用,產(chǎn)生了很多基于微觀數(shù)據(jù)的研究成果。一些中國數(shù)據(jù)庫甚至被全世界各國學(xué)者使用,這一方面表明中國問題越來越受到國際經(jīng)濟(jì)學(xué)界的重視,另一方面也表明中國數(shù)據(jù)的質(zhì)量得到了越來越多的認(rèn)可。特別是相當(dāng)多的國內(nèi)外學(xué)他們的研刊上。作為一個由中國國家統(tǒng)計局收集的數(shù)據(jù)庫,它的優(yōu)點是樣本大、指標(biāo)多、時間長。但是,它畢竟不是一個由學(xué)術(shù)機(jī)構(gòu)發(fā)布的數(shù)據(jù)庫,因此在很多方面還不太符合學(xué)術(shù)研究的嚴(yán)格要求,其缺陷包括樣本匹配混亂、指標(biāo)存在缺失、指標(biāo)大小異常、測度誤差明顯和變量定義模糊等問題。如果研究者沒有察覺到這些數(shù)據(jù)存在的缺陷,并且沒有采取有效的方法緩解或消除這些缺陷,那么就會對經(jīng)驗研究的結(jié)果產(chǎn)生負(fù)面影響,甚至?xí)贸鲥e誤的結(jié)論。而錯誤的結(jié)論對于理論和經(jīng)驗研究來說,不僅浪費了學(xué)者們時間和精力,還可能產(chǎn)生誤導(dǎo)作用。鑒于此,我們認(rèn)為有必要詳細(xì)、嚴(yán)謹(jǐn)?shù)赜懻撝袊I(yè)企業(yè)數(shù)據(jù)庫的基本情況、使用現(xiàn)狀,指出其存在的問題,并盡可能提供解決問題的建議。我們希望,本文的分析不僅有助于潛在使用者了解該數(shù)據(jù)庫的研究現(xiàn)狀和未來方向,還能有助于他們更準(zhǔn)確地使用該數(shù)據(jù)庫,從而推進(jìn)相關(guān)領(lǐng)域的研究發(fā)展。當(dāng)然,作為該數(shù)據(jù)庫的使用者之一,我們并不能保證我們?nèi)娴厥煜ち嗽摂?shù)據(jù)庫,并且我們對問題的分析不可避免地包含了一定的研究傾向。
二數(shù)據(jù)庫基本信息我們首先簡單地描述該數(shù)據(jù)庫的基本情況。中國工業(yè)企業(yè)數(shù)據(jù)庫由國家統(tǒng)計局建立,它的數(shù)據(jù)主要來自于樣本企業(yè)提交給當(dāng)?shù)亟y(tǒng)計局的季報和年報匯總。該數(shù)據(jù)庫的全稱為全部國有及規(guī)模以上非國有工業(yè)企業(yè)數(shù)據(jù)庫,其樣本范圍為全部國有工業(yè)企業(yè)以及規(guī)模以上非國有工業(yè)企業(yè),其統(tǒng)計單位為企業(yè)法人。這里的工業(yè)統(tǒng)計期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱口徑包括國民經(jīng)濟(jì)行業(yè)分類中的采掘業(yè)、制造業(yè)以及電力、燃?xì)饧八纳a(chǎn)和供應(yīng)業(yè)三個門類,主要是制造業(yè)占90以上。這里的規(guī)模以上要求企業(yè)每年的主營業(yè)務(wù)收入即銷售額在500萬元及以上,2011年該標(biāo)準(zhǔn)改為2000萬元及以上?;谏鲜鼋y(tǒng)計口徑的數(shù)據(jù)庫自1998年開始采集,多數(shù)學(xué)者使用的工業(yè)企業(yè)數(shù)據(jù)庫涉及的年份在1999~2007年之間。由于該數(shù)據(jù)庫的主要成分為制造業(yè)企業(yè),在統(tǒng)計口徑上與其他國家的產(chǎn)業(yè)分類比較一致,而且一些變量例如資本、研發(fā)投入和出口交貨值更容易度量,因此使用者通常析出該數(shù)據(jù)庫中的制造業(yè)企業(yè)。制造業(yè)的統(tǒng)計口徑包括從農(nóng)副食品加工業(yè)、食品制造業(yè)到工藝品及其他制造業(yè)、廢棄資源和廢舊材料回收加工業(yè)等30個大類二位數(shù)行業(yè),對應(yīng)于國民經(jīng)濟(jì)行業(yè)分類與代碼gb/ t4754-2002中的代碼13~43不含38.為了保持企業(yè)樣本的完整性,同時與現(xiàn)有研究具有可比性,我們以1999~2007年全部國有及規(guī)模以上非國有工業(yè)企業(yè)作為我們分析該數(shù)據(jù)庫的主要樣本。
1999~2007年中國工業(yè)企業(yè)數(shù)據(jù)庫包括了200多萬個觀測值,每年的樣本企業(yè)數(shù)量從1999年的大約16萬家逐年遞增到2007年的大約33萬家。
在9年樣本期內(nèi),包括上市公司,總共有大約55萬家企業(yè)出現(xiàn)。顯然,這是一個巨大的非平衡面板數(shù)據(jù)。由于企業(yè)關(guān)閉、改制、重組等各種原因,只有46 000萬多家企業(yè)約占樣本企業(yè)總數(shù)的8連續(xù)出現(xiàn)在整個樣本期內(nèi)。該數(shù)據(jù)庫樣本占據(jù)了中國工業(yè)企業(yè)的絕大部分比例。根據(jù)具有可比性的2004年第一次全國經(jīng)濟(jì)普查年報,當(dāng)年工業(yè)企業(yè)銷售額為 442.81億元。而中國工業(yè)企業(yè)數(shù)據(jù)庫當(dāng)年全部樣本企業(yè)的銷售額為195 600億元,約占全國的89.5.
目前,除了經(jīng)濟(jì)普查數(shù)據(jù)庫之外,中國工業(yè)企業(yè)數(shù)據(jù)庫是可獲得的最大的企業(yè)級數(shù)據(jù)庫。表1描述了1999~2007年企業(yè)總數(shù)和國有、集體、民營、外資企業(yè)含港、澳、臺企業(yè)的份額變化??梢钥闯觯瑖泻图w企業(yè)的比例在顯著減少,從1999年的2 /3下降到2007年的不足1 /10,而民營企業(yè)的比例從不足20迅速增加到超過70.該表從一個側(cè)面反映了中國市場經(jīng)濟(jì)結(jié)構(gòu)的劇烈變動。
事實上,工業(yè)企業(yè)數(shù)據(jù)庫是最全面的企業(yè)數(shù)據(jù)庫。該數(shù)據(jù)庫包括企業(yè)的兩類信息:一類是企業(yè)的基本情況,另一類是企業(yè)的財務(wù)數(shù)據(jù)。企業(yè)的基本情況包括:法人代碼、企業(yè)名稱、法人代表、聯(lián)系電話、郵政編碼、具體地址、所屬行業(yè)、注冊類型所有制、隸屬關(guān)系、開業(yè)年份和職工人數(shù)等指標(biāo)。企業(yè)的財務(wù)數(shù)據(jù)則包括:流動資產(chǎn)、應(yīng)期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題學(xué)者們使用的該數(shù)據(jù)庫可能有幾個不同的來源,但是內(nèi)容相差很小。
經(jīng)濟(jì)普查的工業(yè)企業(yè)銷售額來自國家統(tǒng)計局網(wǎng)站《第一次全國經(jīng)濟(jì)普查主要數(shù)據(jù)公報第二號》,工業(yè)企業(yè)數(shù)據(jù)庫中的工業(yè)企業(yè)銷售額來自作者計算。
收賬款、長期投資、固定資產(chǎn)、累計折舊、無形資產(chǎn)、流動負(fù)債、長期負(fù)債、實收資本、主營業(yè)務(wù)收入、主營業(yè)務(wù)成本、營業(yè)費用、管理費用、財務(wù)費用、營業(yè)利潤、利稅總額、廣告費、研究開發(fā)費、工資總額、福利費總額、增值稅、工業(yè)中間投入、工業(yè)總產(chǎn)值和出口交貨值等指標(biāo)。全部指標(biāo)大約為130個。特別的,2004年為第一次全國經(jīng)濟(jì)普查年,因此在數(shù)據(jù)庫中當(dāng)年的企業(yè)指標(biāo)還包括了不同學(xué)歷研究生、本科、大專、中專、高中、初中及以下、不同職稱技術(shù)職稱和技師等的男職工和女職工的相應(yīng)數(shù)量。此外,還包括了企業(yè)是否加入工會以及加入工會的人數(shù)等其他年份所沒有的信息。
中國工業(yè)企業(yè)的類型、數(shù)目和比例年份國有集體民營外資總數(shù)數(shù)據(jù)來源:作者根據(jù)數(shù)據(jù)庫計算得出。
毋庸置疑,工業(yè)企業(yè)數(shù)據(jù)庫的優(yōu)勢非常明顯。第一,它的樣本量非常大,涵蓋了全國所有的國有工業(yè)企業(yè)和規(guī)模以上的非國有工業(yè)企業(yè)。9年的觀測值總數(shù)超過200萬個。2006年之后,每年的樣本企業(yè)數(shù)目超過30萬個。除了普查數(shù)據(jù)庫,還沒有哪個企業(yè)數(shù)據(jù)庫在樣本量上能與之匹敵。從統(tǒng)計學(xué)或計量經(jīng)濟(jì)學(xué)的角度講,大樣本的優(yōu)勢在于降低估計的近似偏誤,提高估計的效率。第二,它的指標(biāo)非常多,包括了企業(yè)的基本情況和企業(yè)的財務(wù)數(shù)據(jù),比較全面地反映了企業(yè)的市場進(jìn)入、投資、借貸、廣告、研發(fā)、出口等行為和企業(yè)的短期與長期經(jīng)營績效,并且企業(yè)加總數(shù)據(jù)反映出企業(yè)所處行業(yè)或地區(qū)的市場結(jié)構(gòu)。從產(chǎn)業(yè)組織理論的角度講,一旦可以獲得市場結(jié)構(gòu)、企業(yè)行為和績效的數(shù)據(jù),學(xué)者們幾乎就可以進(jìn)行任意主題的研究。公司金融、企業(yè)理論、國際貿(mào)易和產(chǎn)業(yè)集聚等相關(guān)領(lǐng)域的研究者們也可以對該數(shù)據(jù)庫各取所需,包括進(jìn)行跨專業(yè)研究。如果將該數(shù)據(jù)庫和其他數(shù)據(jù)庫合并,那么學(xué)者們將會發(fā)現(xiàn)更加豐富的研究視角。
指標(biāo)越多,在構(gòu)建計量方程時解釋變量和控制變量就越多,這樣可以減少遺漏變量問期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱題。第三,它的時間序列比較長。工業(yè)企業(yè)數(shù)據(jù)庫最早的建立年份是1998年,目前已經(jīng)更新到了2008年,前后跨期11年。這使得研究者采用動態(tài)面板方法具有可行性,從而有助于反映歷史因素的作用,以及從動態(tài)的角度研究企業(yè)和產(chǎn)業(yè)的演化過程。
相對而言,目前流行的其他幾個企業(yè)數(shù)據(jù)庫,例如萬得金融數(shù)據(jù)庫、色諾芬經(jīng)濟(jì)金融數(shù)據(jù)庫、國泰安上市公司數(shù)據(jù)庫,樣本企業(yè)都是上市公司,它們的指標(biāo)更全面、準(zhǔn)確,提供指標(biāo)的頻率也更高。比如,這些上市公司數(shù)據(jù)庫通常包括了主要股東持股情況、董事會成員和高管的個人特征以及職位變動,從而可以研究公司治理結(jié)構(gòu)。另外,上市公司數(shù)據(jù)庫不僅包含工業(yè)類上市公司,還包含了金融類和服務(wù)類上市公司,這也是工業(yè)企業(yè)數(shù)據(jù)庫所缺乏的。此外,一些特定的調(diào)查項目也催生了企業(yè)數(shù)據(jù)庫。例如,2006年世界銀行和國家統(tǒng)計局對中國12個省的1200多家企業(yè)進(jìn)行了調(diào)查,內(nèi)容涉及企業(yè)社會責(zé)任、內(nèi)部管理、質(zhì)量管理、勞動管理、環(huán)境管理、市場競爭以及技術(shù)改造等方面。從1991~2006年,中央統(tǒng)戰(zhàn)部和全國工商聯(lián)陸續(xù)對全國民營企業(yè)的經(jīng)營情況進(jìn)行了抽樣調(diào)查,內(nèi)容涉及企業(yè)基本情況、管理體制、企業(yè)家背景以及勞資關(guān)系等方面。
三數(shù)據(jù)庫使用現(xiàn)狀由于工業(yè)企業(yè)數(shù)據(jù)庫的獨特優(yōu)勢,近幾年來每年都有大量的海內(nèi)外經(jīng)濟(jì)學(xué)者使用該數(shù)據(jù)庫撰寫和發(fā)表論文,主題涵蓋產(chǎn)業(yè)組織理論、企業(yè)理論、公司金融、轉(zhuǎn)型經(jīng)濟(jì)學(xué)、國際貿(mào)易、勞動經(jīng)濟(jì)學(xué)和區(qū)域經(jīng)濟(jì)學(xué)等學(xué)科。下面,我們簡要介紹工業(yè)企業(yè)數(shù)據(jù)庫在上述經(jīng)濟(jì)學(xué)分支中的使用現(xiàn)狀。一方面,我們希望這有助于感興趣的研究人員了解人們在不同領(lǐng)域已經(jīng)用該數(shù)據(jù)庫做了什么,還可以做什么;另一方面,我們希望這有助于感興趣的讀者了解現(xiàn)有研究者是如何做這些研究的。當(dāng)然,囿于篇幅和精力,我們不可能囊括所有使用該數(shù)據(jù)庫的文獻(xiàn),而是將目光聚焦于國內(nèi)外的主要學(xué)術(shù)期刊或者流傳較廣的英文文章。
一生產(chǎn)率在所有使用該數(shù)據(jù)庫的相關(guān)研究文獻(xiàn)中,企業(yè)生產(chǎn)率是最受關(guān)注的主題之一。因為生產(chǎn)率是最重要的效率度量,正如克魯格曼krugman,1997所言:生產(chǎn)率不是一切,但是長期來看生產(chǎn)率近似于一切。而且,對于計算企業(yè)生產(chǎn)率而言,工業(yè)企業(yè)數(shù)據(jù)庫提供了加總數(shù)據(jù)所沒有的獨特優(yōu)勢。利用工業(yè)企業(yè)數(shù)據(jù)庫中提供的銷售額或經(jīng)期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題關(guān)于其他的企業(yè)數(shù)據(jù)庫,感興趣的讀者可以訪問香港中文大學(xué)中國研究服務(wù)中心的網(wǎng)站。
濟(jì)增加值表示y、固定資產(chǎn)表示k和職工人數(shù)表示l,采取相應(yīng)的價格指數(shù)進(jìn)行平減,可以計算出每個企業(yè)的勞動生產(chǎn)率和全要素生產(chǎn)率total factors productivity,簡稱tfp.鑒于勞動生產(chǎn)率不能反映資本的效率,因此多數(shù)文獻(xiàn)以tfp作為生產(chǎn)率的度量。又因為制造業(yè)口徑與國際產(chǎn)業(yè)分類更具可比性,所以現(xiàn)有文獻(xiàn)在計算tfp時幾乎都以制造業(yè)企業(yè)為樣本。一些學(xué)者采取了傳統(tǒng)的索洛殘差法solow residual計算tfp,例如謝千里等2008與hsieh和klenow2009;一些學(xué)者采取了主流的op方法olley和pakes,1996,例如張杰等2009、余淼杰2010、聶輝華和賈瑞雪2011、楊汝岱和熊瑞祥2011以及brandt等2012;一些學(xué)者采取了lp方法levinsohn和petrin,2003,例如周黎安等2007;一些學(xué)者采取了隨機(jī)邊界方法sfa,例如劉小玄和李雙杰2008.
二國際貿(mào)易與生產(chǎn)率研究密切相關(guān)的是國際貿(mào)易,更具體地說是考察企業(yè)出口與生產(chǎn)率的關(guān)系。根據(jù)著名的企業(yè)異質(zhì)性假說melitz,2003,生產(chǎn)率高的企業(yè)會傾向于選擇出口,即生產(chǎn)率和出口正相關(guān)。利用工業(yè)企業(yè)數(shù)據(jù)庫,一些學(xué)者檢驗了這一假說對于中國企業(yè)是否成立。張杰等2009利用1999~2003年的制造業(yè)企業(yè)數(shù)據(jù)發(fā)現(xiàn),出口有利于企業(yè)提高tfp,即存在出口的學(xué)習(xí)效應(yīng)。而李春頂2010利用中國1998~2007年的樣本發(fā)現(xiàn),出口企業(yè)的平均tfp或勞動生產(chǎn)率低于內(nèi)銷企業(yè),他認(rèn)為這是生產(chǎn)率悖論。此外,趙偉等2011發(fā)現(xiàn)勞動生產(chǎn)率與出口選擇負(fù)相關(guān),但tfp有時與出口選擇正相關(guān)。這似乎表明,利用該數(shù)據(jù)庫的文獻(xiàn)研究還沒有明確地支持企業(yè)異質(zhì)性假說,但lu2010對此提供了一個理論解釋。還有一些學(xué)者利用工業(yè)企業(yè)數(shù)據(jù)庫做了相關(guān)的研究。例如,余淼杰2010發(fā)現(xiàn),貿(mào)易自由化降低關(guān)稅會提高出口企業(yè)的tfp;包群等2011發(fā)現(xiàn),制造業(yè)企業(yè)出口后對其員工收入的改善并不明顯;楊汝岱和鄭辛迎2011發(fā)現(xiàn)行業(yè)的垂直專業(yè)化程度對企業(yè)員工工資有差異化影響。
三外商直接投資中國加入wto已經(jīng)超過10年了,外商直接投資fdi究竟在中國的經(jīng)濟(jì)發(fā)展中扮演了什么樣的角色?亓朋等2008利用1998~2001年的制造業(yè)企業(yè)數(shù)據(jù),考察了外資企業(yè)對內(nèi)資企業(yè)tfp的溢出效應(yīng),發(fā)現(xiàn)在行業(yè)內(nèi)溢出效應(yīng)不顯著,行業(yè)間和地區(qū)間均存在正的溢出效應(yīng)。羅雨澤等2008使用2000和2002年的制造業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)外商投資企業(yè)對本行業(yè)和本地區(qū)的內(nèi)資企業(yè)有顯著的正溢出效應(yīng)。有趣的是,路江期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱聶輝華和賈瑞雪2011比較了幾種計算tfp方法的優(yōu)劣。
涌2008利用1998~2005年的制造業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)外資企業(yè)對內(nèi)資企業(yè)的溢出效應(yīng)隨地理距離而遞減,在本市內(nèi)溢出效應(yīng)為正,在全國范圍內(nèi)為負(fù),并且對國有企業(yè)為負(fù),對民營企業(yè)為正。du等2012發(fā)現(xiàn),外資企業(yè)對內(nèi)資企業(yè)的溢出效應(yīng)主要通過前向或后向產(chǎn)業(yè)關(guān)聯(lián)實現(xiàn),橫向產(chǎn)業(yè)關(guān)聯(lián)沒有產(chǎn)生顯著的溢出效應(yīng);而且,來自港澳臺的外資企業(yè)和來自外國的外資企業(yè)對內(nèi)資企業(yè)的影響也不相同。xu和sheng2012也得到了類似的發(fā)現(xiàn)。sheng等2011還發(fā)現(xiàn),fdi通過后向產(chǎn)業(yè)關(guān)聯(lián)提高了內(nèi)資企業(yè)的出口價值,通過同行業(yè)的示范效應(yīng)提高了內(nèi)資企業(yè)的出口傾向。chen等2011發(fā)現(xiàn),外資企業(yè)具有明顯的工資溢價,并且對內(nèi)資企業(yè)的工資有抑制作用,從而加劇了企業(yè)之間的工資不平等現(xiàn)象。
四研發(fā)技術(shù)創(chuàng)新是企業(yè)生產(chǎn)率的重要源泉之一,因此企業(yè)的研究開發(fā)r&d行為也備受關(guān)注。關(guān)于r&d的文獻(xiàn)主要分為兩類:第一類是研究r&d或者企業(yè)創(chuàng)新的決定因素,主要是檢驗熊彼特假說;第二類是研究企業(yè)的r&d對績效的影響。聶輝華等2008利用2001~2005年的制造業(yè)企業(yè)數(shù)據(jù),分析后發(fā)現(xiàn)企業(yè)的研發(fā)密度度量創(chuàng)新與規(guī)模、市場競爭之間均呈倒u型關(guān)系,而且盡管國有企業(yè)的研發(fā)密度比民營企業(yè)更高,但是研發(fā)效率更低。hu等2009發(fā)現(xiàn)fdi和企業(yè)改制對于促進(jìn)企業(yè)研發(fā)密度有正面作用。陳林和朱衛(wèi)2011使用2005~2006年的工業(yè)企業(yè)數(shù)據(jù),根據(jù)國有經(jīng)濟(jì)比重區(qū)分行政進(jìn)入壁壘高的行業(yè)和行政進(jìn)入壁壘低的行業(yè),發(fā)現(xiàn)在前一類行業(yè)中創(chuàng)新與市場結(jié)構(gòu)之間呈倒u型關(guān)系,熊彼特假說成立;但是在后一類行業(yè)中結(jié)論相反。chesbrough和liang2007以制造業(yè)中的半導(dǎo)體行業(yè)為例,發(fā)現(xiàn)市場導(dǎo)向會影響企業(yè)r&d的投資回報,即全球市場導(dǎo)向的企業(yè)比國內(nèi)市場導(dǎo)向的企業(yè)能夠獲得更高的r&d回報。戴覓和余淼杰2012發(fā)現(xiàn),出口前的r&d投資能夠促進(jìn)企業(yè)在出口后生產(chǎn)率的提高。
五民營化中國國有企業(yè)改革的主要成效之一,就是大量的國有企業(yè)進(jìn)行了轉(zhuǎn)制,即從百分之百的國有企業(yè)變成了國有控股企業(yè)或者民營企業(yè)。這一點明顯地反映在國有工業(yè)企業(yè)的實收資本成分變化上。tong2009利用1998~2003年的工業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)市場競爭的加劇、fdi集中度的上升以及預(yù)算約束的硬化是國企民營化的主要動因,而且績效相對好的國企更有可能民營化。bai等2009研究了國企民營化的影響,發(fā)現(xiàn)民營化增加了銷售額和勞動生產(chǎn)率,而這主要是通過減少管理費用來實現(xiàn)的。
dougherty等2007發(fā)現(xiàn),民營化通過提高企業(yè)的贏利能力和生產(chǎn)的地區(qū)專業(yè)化水平期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題提高了企業(yè)的生產(chǎn)率。lu等2010發(fā)現(xiàn),集體企業(yè)的私有化導(dǎo)致了銷售成本的上升,但是也降低了管理費用。
六公司金融中國工業(yè)企業(yè)數(shù)據(jù)庫包含了豐富的財務(wù)指標(biāo),因此很多學(xué)者也用它來研究企業(yè)的投資、融資和避稅行為。cai和liu2009提出了一個有趣的問題:競爭是否會加劇公司規(guī)避所得稅?他們識別避稅程度的方式是,比較企業(yè)報告的利潤和根據(jù)會計規(guī)則計算的利潤之間的差額。使用2000~2005年的工業(yè)企業(yè)數(shù)據(jù),他們發(fā)現(xiàn)競爭會加劇企業(yè)的避稅行為。cull等2009認(rèn)為,中國的銀行貸款loan和商業(yè)信用trade credit之間存在一種替代關(guān)系,業(yè)績差的國有企業(yè)會通過商業(yè)信用將銀行貸款再配置給企業(yè)客戶,而業(yè)績好的民營企業(yè)比業(yè)績差的民營企業(yè)更有可能擴(kuò)展商業(yè)信用。余明桂和潘紅波2010利用2004~2007年的工業(yè)企業(yè)數(shù)據(jù)發(fā)現(xiàn),企業(yè)特別是私有企業(yè)會將授予客戶的商業(yè)信用作為產(chǎn)品市場競爭的手段,這驗證了商業(yè)信用的競爭假說。guari glia等2011發(fā)現(xiàn),民營企業(yè)的內(nèi)部融資現(xiàn)金流/總資產(chǎn)是企業(yè)增長的重要約束條件,而國有企業(yè)則不受此類約束。
七產(chǎn)業(yè)集聚利用企業(yè)層面的數(shù)據(jù),我們可以得到行業(yè)或地區(qū)層面的加總數(shù)據(jù),可以反映中國工業(yè)的產(chǎn)業(yè)集聚現(xiàn)象。使用1998~2005年的制造業(yè)企業(yè)數(shù)據(jù),lu和tao2009考察了中國制造業(yè)集聚用eg指數(shù)衡量的決定因素,發(fā)現(xiàn)地方保護(hù)主義國有企業(yè)的雇傭比例是阻礙產(chǎn)業(yè)地區(qū)集聚的主要因素。另外一些學(xué)者考察了產(chǎn)業(yè)集聚對企業(yè)的影響。li等2011發(fā)現(xiàn)產(chǎn)業(yè)集聚對企業(yè)規(guī)模有顯著的正面影響。lin等2011發(fā)現(xiàn),產(chǎn)業(yè)集聚和企業(yè)生產(chǎn)率之間存在一種倒u型關(guān)系。yang和he2011發(fā)現(xiàn)貿(mào)易通過信息和分工影響到出口企業(yè)的地理集聚。
八宏觀政策的微觀影響利用工業(yè)企業(yè)數(shù)據(jù)庫,學(xué)者們還可以研究宏觀政策對企業(yè)微觀行為和績效的影響,并且以經(jīng)驗研究的方式為宏觀政策分析提供微觀基礎(chǔ)。聶輝華等2009利用面板雙重差分did模型,發(fā)現(xiàn)2004年實行的增值稅轉(zhuǎn)型政策顯著地促進(jìn)了企業(yè)的固定資產(chǎn)投資和勞動生產(chǎn)率,但是也減少了企業(yè)的雇傭人數(shù)。袁淵和左翔2011用did方法研究了2003~2005年浙江省擴(kuò)權(quán)強(qiáng)縣政策對企業(yè)增長的影響,發(fā)現(xiàn)這一政策確實提高了縣域企業(yè)的銷售額增長率和資產(chǎn)增長率。彭方平和連玉君2010利用2000~2007年的工業(yè)企業(yè)數(shù)據(jù),發(fā)現(xiàn)短期內(nèi)提高利息的宏觀政策會導(dǎo)致企業(yè)的生產(chǎn)成本提高,從而導(dǎo)致通貨膨脹,即貨幣成本。song等2011推斷,金融歧視政策導(dǎo)致期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱高效率企業(yè)的儲蓄率上升和快速的增長,并進(jìn)而導(dǎo)致巨額的外匯儲備和貿(mào)易順差,然后用1998~2007年的工業(yè)企業(yè)數(shù)據(jù)對此進(jìn)行了驗證。
九其他與工業(yè)企業(yè)數(shù)據(jù)庫有關(guān)的其他經(jīng)驗研究主要聚焦于就業(yè)問題。方明月等2010利用1999~2005年的工業(yè)企業(yè)數(shù)據(jù),采取系統(tǒng)廣義矩估計gmm方法比較了不同所有制企業(yè)的產(chǎn)出的微觀就業(yè)彈性,發(fā)現(xiàn)國有企業(yè)的就業(yè)彈性低于民營企業(yè)的就業(yè)彈性。張光南等2010利用1998~2006年工業(yè)企業(yè)數(shù)據(jù)加總得到各省的基礎(chǔ)設(shè)施、產(chǎn)出和就業(yè)數(shù)據(jù),計算了基礎(chǔ)設(shè)施對產(chǎn)出和就業(yè)的彈性。dong和xu2009討論中國公共部門和私人部門之間的勞動力流動對中國經(jīng)濟(jì)增長的貢獻(xiàn)。
四數(shù)據(jù)庫潛在問題中國工業(yè)企業(yè)數(shù)據(jù)庫為微觀計量經(jīng)濟(jì)學(xué)研究貢獻(xiàn)了不可或缺的素材,但是這個數(shù)據(jù)庫并非完美無缺,而是問題重重。作為使用者,我們發(fā)現(xiàn)了工業(yè)企業(yè)數(shù)據(jù)庫存在樣本錯配、指標(biāo)缺失、指標(biāo)異常、樣本選擇和測度誤差等諸多問題。如果忽視這些問題,經(jīng)驗研究的結(jié)果可能不穩(wěn)健,甚至可能是錯誤的?,F(xiàn)有文獻(xiàn)部分地發(fā)現(xiàn)了這些問題,并且提供了部分解決方法。下面,我們在現(xiàn)有文獻(xiàn)的基礎(chǔ)上,結(jié)合我們的使用經(jīng)驗,將工業(yè)企業(yè)數(shù)據(jù)庫的潛在問題進(jìn)行歸納,并且盡可能地提供解決問題的方法建議。
一樣本匹配問題對于一個多年企業(yè)數(shù)據(jù)來說,整理數(shù)據(jù)的第一步就是構(gòu)建一個以企業(yè)id和年份為兩維的面板數(shù)據(jù)。這通常不是一個問題,但是對于中國工業(yè)企業(yè)數(shù)據(jù)庫卻是一個非常棘手的問題。因為在該數(shù)據(jù)庫中,難以找到一個識別每個樣本企業(yè)的唯一特征來進(jìn)行編碼。通常的做法是,根據(jù)企業(yè)代碼、企業(yè)名稱、法人代表姓名、地址、郵編、電話、行業(yè)代碼、主要產(chǎn)品名稱、開業(yè)時間等基本信息來識別不同的樣本點是否來自同一家企業(yè)。但是因為這些基本信息在申報時沒有統(tǒng)一格式,在缺乏有效的智能模糊匹配手段的情況下,精確匹配的可操作性不強(qiáng)。其中,企業(yè)代碼和企業(yè)名稱的準(zhǔn)確性相對較高,可以作為我們進(jìn)行匹配所依據(jù)的主要信息,比如brandt等2012就是先根據(jù)相同的企業(yè)代碼識別同一家企業(yè),然后再根據(jù)相同的企業(yè)名稱進(jìn)行識別,最后再參考其他基本信息。這種序貫識別法假定企業(yè)代碼的準(zhǔn)確性最高,企業(yè)名稱準(zhǔn)確性其次。也就是說共享同一企業(yè)代碼的樣本點必然被識別為同一企業(yè),但同一企業(yè)的各樣本點可能擁有不同的企業(yè)代碼。在本數(shù)據(jù)庫中,不但存在同一企業(yè)更改企業(yè)代碼的情況例如在期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題發(fā)生改制或重組之后,更重要的是,還存在不同的企業(yè)共享企業(yè)代碼的情況也許是統(tǒng)計失誤。企業(yè)名稱這一變量也存在類似問題。很多企業(yè)在改制、重組或者擴(kuò)張時更改了企業(yè)名稱。例如,中國有不少企業(yè)先是名為xx廠,然后改名為xx有限責(zé)任公司,接著又稱為xx股份有限公司。有時企業(yè)名稱中的地理位置也略有差異,例如從xx市機(jī)電廠變成xx機(jī)電廠。如果按照企業(yè)名稱進(jìn)行精確匹配會錯誤地識別出過多的企業(yè)。
我們建議的做法是:將企業(yè)按企業(yè)代碼和企業(yè)名稱分別進(jìn)行兩次分組,然后考察同一名稱組下的企業(yè)是否分屬不同的代碼組。若是,則將這些不同代碼組內(nèi)的所有企業(yè)都?xì)w為一組對每一名稱組都依此進(jìn)行操作,不斷重新歸組,可以稱之為交叉匹配;若新組內(nèi)沒有年份重復(fù)的觀測值,則將這一組樣本點識別為同一家企業(yè);若新組內(nèi)存在年份重復(fù)的觀測值,則進(jìn)入下一步人工識別。在人工識別階段可能存在多種情況,需要根據(jù)數(shù)據(jù)特征和基本信息進(jìn)行綜合判斷。例如,同一組內(nèi)的樣本點可能屬于同一家企業(yè),只是其中某些年份有兩個觀測值,這兩個觀測值只需要保留一個,另一個完全重復(fù)或關(guān)鍵變量均缺失。同一組內(nèi)的樣本點也可能屬于不同企業(yè),但其中可能存在企業(yè)代碼登記錯誤的情況,此時需要參照企業(yè)名稱、法人代表姓名、地址、行業(yè)代碼、銷售額或注冊資本等關(guān)鍵變量的數(shù)量級等信息進(jìn)行分類,確定哪些樣本屬于同一家企業(yè)。我們發(fā)現(xiàn),使用交叉匹配方法后,大約有10的觀測值大約20萬個屬于名稱相同但法人代碼不同或者相反的情況。顯然,如果忽視匹配問題會嚴(yán)重地影響樣本的真實性和準(zhǔn)確性。
除了企業(yè)匹配存在一些障礙,產(chǎn)業(yè)匹配也有一些問題。使用者必須注意到,2002年前后統(tǒng)計局使用了兩種產(chǎn)業(yè)分類標(biāo)準(zhǔn):2002年及其之前的年份為gb/t 4754-1994,2002年之后為gb/t 4754-2002.兩種行業(yè)分類標(biāo)準(zhǔn)在兩位數(shù)行業(yè)上沒有差異,在三位數(shù)行業(yè)上有一些差異,在四位數(shù)行業(yè)上有較大差異。楊汝岱和鄭辛迎2011與楊汝岱和熊瑞祥2011將1994gb四位數(shù)行業(yè)分類對應(yīng)到2002gb三位數(shù)行業(yè)分類,這是一種可供參考的做法。
二指標(biāo)缺失問題工業(yè)企業(yè)數(shù)據(jù)庫每年的統(tǒng)計對象和口徑都有所不同,導(dǎo)致一些重要指標(biāo)在若干年份缺失。首先,有些工業(yè)企業(yè)數(shù)據(jù)庫直接將2004年的經(jīng)濟(jì)普查數(shù)據(jù)與其他年份混編在一起,而沒有和其他年份進(jìn)行匹配。這導(dǎo)致2004年的數(shù)據(jù)缺少工業(yè)總產(chǎn)值、工業(yè)增期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱最近,很多研究將工業(yè)企業(yè)數(shù)據(jù)庫和海關(guān)數(shù)據(jù)庫結(jié)合起來。對于此類研究的某些主題,還需要將國民經(jīng)濟(jì)行業(yè)分類與海關(guān)hs產(chǎn)品分類對應(yīng)起來,具體分析可以參考楊汝岱2008.
加值、出口交貨值和研究開發(fā)費等重要指標(biāo)。與此同時,和2004年相比,其他年份又缺少關(guān)于工會、男女職工的學(xué)歷和技術(shù)職稱等指標(biāo)。因此,使用者在分析數(shù)據(jù)之前,應(yīng)該先查看2004年數(shù)據(jù)和其他年份數(shù)據(jù)之間的指標(biāo)差異。
其次,2003年前后的指標(biāo)也有一些不同。例如,2001年之前的數(shù)據(jù)不包括研發(fā)費用。有些數(shù)據(jù)庫中1999~2003年的工業(yè)企業(yè)數(shù)據(jù)沒有工業(yè)增加值,也沒有應(yīng)收賬款,但是有應(yīng)收賬款凈額。根據(jù)會計準(zhǔn)則,應(yīng)收賬款凈額=應(yīng)收賬款總額-壞賬準(zhǔn)備期末余額,因此兩者不能簡單地比較。在缺失工業(yè)增加值的年份,使用者可以根據(jù)會計準(zhǔn)則估算工業(yè)增加值:工業(yè)增加值=工業(yè)總產(chǎn)值-工業(yè)中間投入增值稅。在沒有工業(yè)總產(chǎn)值的年份例如2004年,估算公式為:工業(yè)增加值=產(chǎn)品銷售額-期初存貨期末存貨-工業(yè)中間投入增值稅。劉小玄和李雙杰2008就采取了這種估算方法。
我們用第一個公式估算了2005~2007年的工業(yè)增加值,發(fā)現(xiàn)平均而言估算值略小于報告值。當(dāng)使用者用工業(yè)增加值來計算生產(chǎn)率時,應(yīng)注意到這種差別。
報告的和估算的工業(yè)增加值比較千元報告值計算值觀測值個數(shù)說明:報告值和估算值皆為均值,且計算時未剔除異常觀測值。
需要特別指出的是,盡管工業(yè)企業(yè)數(shù)據(jù)庫提供了企業(yè)的出口交貨值,但據(jù)此只能判斷企業(yè)是否出口,而無法區(qū)分出口類型是加工貿(mào)易還是一般貿(mào)易。對于勞動密集型的加工貿(mào)易企業(yè)而言,其勞動生產(chǎn)率和全要素生產(chǎn)率很可能低于一般貿(mào)易的出口企業(yè)。另外,加工貿(mào)易是發(fā)展中國家的特殊現(xiàn)象。如果不區(qū)分兩類出口企業(yè),簡單地將全部出口企業(yè)的效率與內(nèi)銷企業(yè)的效率相比,那么得到出口企業(yè)的平均效率低于內(nèi)銷企業(yè)也就不足為奇了。
事實上,dai等2011將工業(yè)企業(yè)數(shù)據(jù)與海關(guān)數(shù)據(jù)匹配,在剔除了加工貿(mào)易企業(yè)之后,發(fā)現(xiàn)生產(chǎn)率悖論并不存在。
三指標(biāo)異常問題盡管工業(yè)企業(yè)數(shù)據(jù)庫包含了130多個指標(biāo),但是有相當(dāng)多的指標(biāo)存在異常值。異常值的存在使得很多觀測值無效,因此在進(jìn)行計量回歸前必須予以剔除。我們注意期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題在這個意義上,我們認(rèn)為工業(yè)企業(yè)數(shù)據(jù)庫本身可能不適于檢驗國際貿(mào)易的企業(yè)異質(zhì)性假說。
一些學(xué)者對工業(yè)企業(yè)數(shù)據(jù)庫和海關(guān)數(shù)據(jù)庫進(jìn)行了匹配,但由于原始數(shù)據(jù)結(jié)構(gòu)和方法各異,匹配效果差別甚大。yu2011根據(jù)郵編和電話等信息匹配了海關(guān)庫30的出口企業(yè),而tang2011匹配了工業(yè)庫70的出口企業(yè)。yang和he2011以企業(yè)名稱、郵編、電話等信息為基礎(chǔ),采用關(guān)鍵詞數(shù)據(jù)庫搜尋匹配方法,匹配了海關(guān)庫60的出口份額。
到,cai和liu2009使用了比較全面的剔除方式,因此被較多的研究者所借鑒。第一步,他們剔除了關(guān)鍵指標(biāo)例如,總資產(chǎn)、職工人數(shù)、工業(yè)總產(chǎn)值、固定資產(chǎn)凈值和銷售額缺失的觀測值;第二步,他們剔除了不滿足規(guī)模以上標(biāo)準(zhǔn)的觀測值,即固定資產(chǎn)凈值低于1000萬元,或者銷售額低于1000萬元,或者職工人數(shù)少于30人的觀測值;第三步,他們剔除了一些明顯不符合會計原則的觀測值,包括總資產(chǎn)小于流動資產(chǎn),總資產(chǎn)小于固定資產(chǎn)凈值,或者累計折舊小于當(dāng)期折舊的觀測值;第四步,他們剔除了關(guān)鍵指標(biāo)的極端值前后各0.5.
以1999~2007年為例,我們分析了指標(biāo)異常問題。首先,在總共2048 833個觀測值中,我們剔除了銷售額、職工人數(shù)、總資產(chǎn)或固定資產(chǎn)凈值缺失的觀測值5900多個,約占全部觀測值的0.3.其次,我們根據(jù)謝千里等2008的做法,剔除了職工人數(shù)少于8人的觀測值28 000多個這些企業(yè)缺乏可靠的會計系統(tǒng),約占總數(shù)的1.
再次,我們剔除了總資產(chǎn)小于流動資產(chǎn),總資產(chǎn)小于固定資產(chǎn)凈值,或者累計折舊小于當(dāng)期折舊的觀測值200多個。最后,我們剔除了銷售額低于500萬元的觀測值176 500多個,約占總數(shù)的9.經(jīng)過上述四個步驟,我們總共剔除了大約20萬個觀測值,約占總數(shù)的10.盡管進(jìn)行了上述剔除,但是我們?nèi)匀话l(fā)現(xiàn)有不少觀測值屬于異常值。例如,如果按照bai等2009的標(biāo)準(zhǔn),利潤率低于0.1或者高于99的觀測值均為異常值,那么這部分異常值還有大約43萬個,約占總數(shù)的23.或者我們使用一種比較寬松的標(biāo)準(zhǔn),會發(fā)現(xiàn)實收資本小于或等于0的異常觀測值有11 000多個,約占總數(shù)的6.因此,即便做了上述剔除,使用者仍然需要剔除計量方程的關(guān)鍵變量或參數(shù)所對應(yīng)的異常值。我們將未做任何剔除的主要指標(biāo)的異常情況總結(jié)為表3.
主要指標(biāo)的異常情況剔除標(biāo)準(zhǔn)異常值個數(shù)觀測值總數(shù)異常值比例銷售額、職工人數(shù)、總資產(chǎn)或固定資產(chǎn)凈值缺失職工人數(shù)少于8總資產(chǎn)小于流動資產(chǎn),總資產(chǎn)小于固定資產(chǎn)凈值,或者累計折舊小于當(dāng)期折舊銷售額低于500萬元利潤率低于0.1或者高于99實收資本小于或等于0期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱他們使用的規(guī)模以上的標(biāo)準(zhǔn)不同于官方標(biāo)準(zhǔn)銷售額在500萬元以上。
四測度誤差問題國家統(tǒng)計局在收集工業(yè)企業(yè)數(shù)據(jù)時,不是一次性交給企業(yè)一份報表,而是讓企業(yè)通過年報和定期上報的方式將數(shù)據(jù)報告給統(tǒng)計局,然后統(tǒng)計局再進(jìn)行匯總。事實上,企業(yè)上報系統(tǒng)至少包括四套表格:綜合年報表、綜合定報表、基層年報表和基層定報表。這意味著,由于統(tǒng)計時間或者統(tǒng)計口徑不同,即使對同一個指標(biāo),企業(yè)在不同時間上報的數(shù)值也可能不一樣。另外,很多規(guī)模不大的企業(yè)仍然缺乏可靠的會計系統(tǒng),或者為了避稅而瞞報,甚至錯報有關(guān)指標(biāo),這些都會導(dǎo)致測度誤差問題。
以研發(fā)費為例。在2001~2007年不含普查年份2004年,在總共140多萬個觀測值中,研發(fā)費顯示為0的觀測值有120多萬個,占總數(shù)的89.研發(fā)費報告為0的有3種情況:1企業(yè)沒有研發(fā)支出,因此研發(fā)費確實為0;2企業(yè)不清楚,任意地報告0;3企業(yè)沒填寫此項,統(tǒng)計人員直接賦值0.如果是第1、2種情況,那么這更可能發(fā)生在中小企業(yè)身上。于是,我們剔除了銷售額低于3億元的中小企業(yè),又剔除了出口企業(yè),發(fā)現(xiàn)在剩下的28 000多個觀測值中,研發(fā)費顯示為0的仍然有20 000多個,比例超過70.這里提醒研究者注意兩點:第一,如果絕大多數(shù)中小企業(yè)沒有研發(fā)費,并且這是真實的情況,那么在分析企業(yè)研發(fā)支出或創(chuàng)新的決定因素時,最好使用tobit截斷模型例如聶輝華等,2008,因為這比最小二乘法ols回歸更可能得到一致估計;第二,如果我們無法區(qū)分第2、3種情況,那么研發(fā)費這一指標(biāo)的準(zhǔn)確性和真實性就值得懷疑,此時用工業(yè)企業(yè)數(shù)據(jù)庫來分析研發(fā)的決定因素或者研發(fā)績效可能是不恰當(dāng)?shù)摹?br>存在明顯測度誤差的其他指標(biāo)主要是利潤和增加值。由于企業(yè)報告的利潤和增加值與企業(yè)的稅負(fù)正相關(guān),因此企業(yè)在監(jiān)管不力的前提下可能會低報或誤報這兩個指標(biāo)。事實上,cai和liu2009根據(jù)會計準(zhǔn)則估算了企業(yè)的利潤=工業(yè)總產(chǎn)值-中間投入-財務(wù)費用-工資-當(dāng)期折舊-增值稅,然后發(fā)現(xiàn)在2000~2005年間,估算利潤率均值為0.1431,而企業(yè)報告的利潤率均值為0.0515,后者比前者少了2 /3以上。
此外,根據(jù)我們前面對2005~2007年間工業(yè)增加值的估算,可以發(fā)現(xiàn)估算的工業(yè)增加值要略小于報告的工業(yè)增加值。
另一個不屬于經(jīng)典測度誤差但是與此有關(guān)的問題是虛假指標(biāo)問題。在1999~2007年間,根據(jù)注冊類型,有大約1 /5的觀測值大約40萬個屬于外資企業(yè)包括港澳臺商投資企業(yè)和外商投資企業(yè)。這一比例之高超乎我們的直覺,因為眾所周知的事實是,外資企業(yè)可以享受各種稅收優(yōu)惠。進(jìn)一步分析發(fā)現(xiàn),這些樣本企業(yè)雖然登記為外資企業(yè),但是在其實收資本份額中,有6的港澳臺資本或外商資本金額為0,其期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題中有一半左右的登記注冊號明確標(biāo)明了外資身份例如注明企合津總字第xx號。這有兩種可能,一是這些企業(yè)以前是外資企業(yè),但是變更了實收資本之后沒有及時變更登記注冊類型;二是這些企業(yè)錯誤地填報了注冊類型。剩下的94的外資企業(yè),我們無法確認(rèn)其真實身份,也難以排除其中的假外企。
五樣本選擇問題在樣本選擇方面,工業(yè)企業(yè)數(shù)據(jù)庫的一個突出問題是,包括了全部的國有工業(yè)企業(yè),但是只包括了規(guī)模以上的非國有工業(yè)企業(yè)。因此,當(dāng)使用者要對比國有企業(yè)和非國有企業(yè)的行為及績效時,最好將規(guī)模以下的國有企業(yè)樣本剔除。而當(dāng)使用者在研究產(chǎn)業(yè)集聚問題時,可能會低估非國有企業(yè)的集聚程度lu和tao,2009.但規(guī)模以上的樣本并非都是隨機(jī)的。在1999~2007年間的總共200多萬個觀測值中,只有大約8的企業(yè)每年都存在,有大約22的企業(yè)在最后三年都存在。一個企業(yè)某年不在樣本中,可能是因為當(dāng)年銷售額小于500萬元,也可能是因為破產(chǎn)、重組或者更改名稱等原因,還有可能是被漏報。在這種情況下,我們難以嚴(yán)格地界定企業(yè)的進(jìn)入和退出,因此研究者在用這個數(shù)據(jù)庫分析企業(yè)動態(tài)學(xué)時必須力爭解決或減緩這個問題。
另外,該數(shù)據(jù)庫中包含了企業(yè)所在地的詳細(xì)信息,使用者可以識別出企業(yè)是否處于經(jīng)濟(jì)特區(qū)或經(jīng)濟(jì)開發(fā)區(qū)。因為經(jīng)濟(jì)特區(qū)或經(jīng)濟(jì)開發(fā)區(qū)的企業(yè)具有自身的特點,這種區(qū)分有助于減少企業(yè)在比較生產(chǎn)率、產(chǎn)業(yè)集聚、利潤率以及融資成本等方面的樣本選擇問題。還有一個比較棘手的問題是,統(tǒng)計局對企業(yè)的統(tǒng)計口徑是法人企業(yè),而不是企業(yè)集團(tuán)或工廠。因此,有很多屬于同一個企業(yè)集團(tuán)的企業(yè)會被認(rèn)定為不同的企業(yè),而多個工廠的差別則會被掩蓋在企業(yè)內(nèi)部。
六變量定義問題分析中國的企業(yè)不可能忽略企業(yè)的所有制問題。我們注意到,現(xiàn)有文獻(xiàn)在識別企業(yè)的所有制時通常采取兩種方式:注冊類型或?qū)嵤召Y本。這兩種識別企業(yè)所有制的方法其實是有差別的。前者表示企業(yè)在工商局登記注冊時的類型,后者能夠表示企業(yè)當(dāng)時的真實控股類型。我們不妨將注冊類型為國有、國有聯(lián)營、國有與集體聯(lián)營、國有獨資公司這幾類企業(yè)定義為i類國有企業(yè),同時根據(jù)實收資本將國有資本比例超過50的企業(yè)定義為ii類國有企業(yè)。在1999~2007年工業(yè)企業(yè)數(shù)據(jù)庫中,在剔除了實收資本為異常值的觀測值之后,i類國企有245 376個觀測值,ii類國企有252 629個觀測值,后者比前者多3左右,兩者重合的觀測值大約占i類國企的84,這意味著至少有15的國有企業(yè)雖然注冊類型是國有企業(yè),但是已經(jīng)不是真正的國有業(yè)企了。由于控股比例更能及時地反映企業(yè)的所有制類型,因此我們建議使用者最好期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱使用實收資本比例來定義企業(yè)所有制。
外資企業(yè)的識別也存在類似的問題。根據(jù)中國的法律,外資企業(yè)的投資比例原則上不低于25.盡管有大約1 /5的觀測值的注冊類型顯示為外資企業(yè),但是其中有10觀測值的港澳臺商投資或外商投資比例低于25.一些研究者以外商的實收資本比例是否超過25作為識別外資企業(yè)的方法路江涌,2008.
除了所有制類型,一個難以準(zhǔn)確定義的變量就是資本。理論上,資本是固定資產(chǎn)存貨和投資流量的加總。多數(shù)文獻(xiàn)的做法是,將資本定義為固定資產(chǎn)原價或者固定資產(chǎn)凈值,然后采取永續(xù)盤存法來計算投資i it-1,其中i表示投資,k率的選取通常是5、10或15.此外,還應(yīng)該采取不同的價格指數(shù)對產(chǎn)值、資本、投資和中間投入等變量進(jìn)行平減。我們必須提醒使用者的是,不同的資本定義方法、折舊率以及價格平減指數(shù)會得到不同的結(jié)果。brandt等2012提供了比較詳細(xì)的說明和操作程序。
陳林、朱衛(wèi)2011:《創(chuàng)新、市場結(jié)構(gòu)與行政進(jìn)入壁壘―――基于中國工業(yè)企業(yè)數(shù)據(jù)的熊彼特假說實證檢驗》,戴覓、余淼杰2012:《企業(yè)出口前研發(fā)投入、出口及生產(chǎn)率進(jìn)步》,北京大學(xué)工作論文。
李春頂2010:《中國出口企業(yè)是否存在生產(chǎn)率悖論:基于中國制造業(yè)企業(yè)數(shù)據(jù)的檢驗》,《世界經(jīng)濟(jì)》第7期。
劉小玄、李雙杰2008:《制造業(yè)企業(yè)相對效率的度量和比較及其外生決定因素2000―2004》,《經(jīng)濟(jì)學(xué)羅雨澤、朱善利、陳玉宇、羅來軍2008:《外商直接投資的空間外溢效應(yīng):對中國區(qū)域企業(yè)生產(chǎn)率影響的經(jīng)聶輝華、譚松濤、王宇鋒2008:《創(chuàng)新、企業(yè)規(guī)模和市場競爭―――基于中國企業(yè)層面面板數(shù)據(jù)的證據(jù)》,《世聶輝華、方明月、李濤2009:《增值稅轉(zhuǎn)型對企業(yè)行為和績效的影響―――以東北地區(qū)為例》,《管理世界》第期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題每個企業(yè)報告了總的實收資本以及國有、集體、法人、私人、港澳臺和外商等6種成分的實收資本數(shù)額,因此企業(yè)的其他所有制類型也可以通過實收資本比例來識別。
亓朋、許和連、艾洪山2008:《外商直接投資企業(yè)對內(nèi)資企業(yè)的溢出效應(yīng):對中國制造業(yè)企業(yè)的實證研究》,楊汝岱、熊瑞祥2011:《干中學(xué)與中國工業(yè)企業(yè)出口生產(chǎn)率》,湘潭大學(xué)工作論文。
楊汝岱、鄭辛迎2011:《垂直專業(yè)化對員工工資的差異化影響》,湘潭大學(xué)工作論文。
張光南、李小瑛、陳廣漢2010:《中國基礎(chǔ)設(shè)施的就業(yè)、產(chǎn)出和投資效應(yīng)―――基于1998-2006年省際工業(yè)企張杰、李勇、劉志彪2009:《出口促進(jìn)中國企業(yè)生產(chǎn)率提高嗎?―――來自中國本土制造業(yè)企業(yè)的經(jīng)驗證據(jù):趙偉、趙金亮、韓媛媛2011:《異質(zhì)性、沉沒成本與中國企業(yè)出口決定:來自中國微觀企業(yè)的經(jīng)驗證據(jù)》,《世期第年濟(jì)經(jīng)界世聶輝華江艇楊汝岱截稿:2012年3月責(zé)任編輯:王徽期第年濟(jì)經(jīng)界世中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題
本文標(biāo)簽:中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題
* 由于無法獲得聯(lián)系方式等原因,本網(wǎng)使用的文字及圖片的作品報酬未能及時支付,在此深表歉意,請《中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題》相關(guān)權(quán)利人與機(jī)電之家網(wǎng)取得聯(lián)系。
關(guān)于“中國工業(yè)企業(yè)數(shù)據(jù)庫的使用現(xiàn)狀和潛在問題”的更多資訊