가계동향조사의 문제와 보정 (한국경제포럼 제15권 제1호, 2022)

Nak-Nyeon Kim


Nak-Nyeon Kim (김낙년)



가계동향조사의 문제와 보정  





가계동향조사는 매달 표본의 일부가 교체되는 연동표본으로 설계되어 있기 때문에각 표본이 1년 중에 조사되는 월수는 1-12달(2020년 이후는 1-6달)에 걸쳐 있게 된다. 통계청은 분기 또는 연간 통계를 구할 때 월간 자료에서 해당 월의 조사결과를단순 평균하는 방식으로 산출하고 있다. 매달 지출이 반복되는 품목이라면 이 방식에 문제가 없지만 그렇지 않은 품목에서는 왜곡이 발생한다. 조사월수와 품목의 구입 빈도에 따라 연간 통계는 실제보다 12배(분기 통계는 3배)까지 과대해지는 편향이 생기는 한편, 조사 월에 구입되지 않은 품목은 조사에서 아예 누락되어 버린다. 전체 평균을 구할 때에는 이러한 과대평가와 누락에 의한 과소평가가 서로 상쇄되는 것으로 나왔다. 그렇지만 가구당 평균은 그렇지 않아 가구 간 소비 격차가 실제조사된 결과보다 더 벌어진 것으로 나오며, 그러한 왜곡이 최근에 더욱 커졌다. 본고는 2015-16, 2019-20년의 연간 자료에 포함된 각 가구의 품목별 소비의 과대 또는 과소 편향을 합리적 방법으로 보정하였고, 그 결과를 기존의 마이크로 데이터와비교하여 어디에서 얼마나 왜곡이 나타나는지를 보였다.

Since the Household Income and Expenditure Survey is designed as rotation sampling in which a certain percentage of the sample is replaced every month, the number of months each sample is surveyed in a year spans 1-12 months (1-6 months after 2020). Statistics Korea calculates quarterly or annual statistics by simply averaging the survey results for the month from monthly data. This is fine for items with similar recurring monthly expenditures, but distortion occurs for items that do not. Depending on the number of months surveyed and the frequency of purchase of items, the annual statistics tend to be exaggerated by up to 12 times (three times in the case of quarterly statistics) than the actual ones, while items not purchased in the survey month are completely omitted from the survey. When calculating the overall average, it was found that such overestimation and underestimation due to omission offset each other. However, the average per household is not, so the consumption gap between households is wider than it really is, and the distortion has grown bigger in recent years. In this paper, the bias of items consumed by each household included in the annual data for 2015-16 and 2019-20 was corrected in a reasonable way, and the results were compared with the existing micro data.



가계동향조사, 연동표본, 소비분포

Household Income and Expenditure Survey, rotation sampling, consumption distribution