国土交通省による基幹統計「建設工事受注動態統計」の不正。本省職員らがデータを無断で書き換えて二重計上したことで、統計はどれだけ過大になっていたのか。朝日新聞が2020年度分に絞って過大額を試算したところ、約4兆円に上っていた疑いがあることがわかった。試算は公表済みのデータを基に専門家らの助言を得ながら慎重に進めた。単純な引き算だが…… 過大になっている不正な統計から、正しい統計を引けば、差額がわかる。その差額が「過大額」だ。単純な引き算ができればいい。 不正な統計をAと表記して考えていく。公表済みだが、書き換えにより過大になっているものだ。 正しい統計をBと表記して考える。これは公表されていないものだ。 AとBを使って式に表すと簡単に見える。 A-B=過大額 この計算をすることが目標となる。20年度の統計は2パターンあった 20年度の1年間だけに絞って考えることにした。 20年度は、国交省の本省職員が書き換え行為を行っていた時期だ。具体的には、本来、合算すべきでない受注実績を、計2カ月分、合算して集計していた。 まず調べたのは、そもそも何が公表されているのか、だ。 Aは公表されている。Bは非公表。そのほかに、Aとは別のパターンの20年度の統計が公表されていた。これをCを表記して考えることにした。 Cとは何か。具体的には、21年度から新たに導入された計算ルールをさかのぼって20年度の統計に適用したものだ。書き換え前の正しいデータを基につくられているから、二重計上による上ぶれは原則として生じていない。 AとCの違いを整理するとこうなる。 A 旧計算ルール(~20年度)で計算した20年度の統計。不正な書き換えによる過去分データの合算あり。 C 新計算ルール(21年度~)をさかのぼって使い計算した20年度の統計。不正な書き換えによる過去分データの合算なし。前提が違う 計算ルールが新旧で異なるため、AとCを単純に比べることはできない。Aは過去分のデータが不正に合算された過大な統計で、Cは過去分の合算がなく過大になっていない統計だが、単純に「A-C」という計算をしても「過大額」を知ることはできないわけだ。 そこで、前提条件をそろえる方法を探ることにした。 まず欠かせないの、新旧の計算ルールの違いを理解することだ。国土交通省はホームページにその説明文を掲載していた。 新計算ルールでは、旧計算ルールに新たに「係数」(母集団の欠測値を埋めて補正するためのもの)をかける、という概要だ。単純にイメージを記すと次のようになる。 旧計算ルールの統計×係数=新計算ルールの統計 記号で書くとこうだ。 B×係数=C この式を次のように書き換える。 B=C÷係数 係数さえわかればBもわかることになる。Bがわかれば答えもわかる。少し光が見えた気がしたが、その先が険しかった。迷路に迷い込んだ 公表されているAには、書き換えられたデータが使われている。同じく公表されているCには、書き換えられたデータが原則として使われていない。書き換えありと、書き換えなし。違いのあるデータを、同じ式の中に入れて考えることはできない。 取材チームは迷路に迷い込んでしまった。ゴールにつながる道がどこかにないか。手分けをして探るかのように、複数の専門家の助言を得ながら検討を続けた。カギは「4月」だった 浮かんできたキーワードは「4月」だった。 今回の統計不正で問題になっ…Source : 社会 - 朝日新聞デジタル
2 ans Il y a