燃料サンプル不正操作の統計的裏付け
エフオンは監査役会と外部弁護士による調査委員会の調査結果で、内部告発者が指摘したような燃料サンプルによる不正はなかったと結論づけました。しかしこの調査委員会による調査は以下の点において出来レースだったと、私たちは指摘します。
① ヒアリング調査時の社員の安全が担保されていない
指示を受けて不正をしていた社員が自らやっていました、と認めるには中立な第三者委員会による身分の保証がない限りあり得ません。地方の発電所の限られた人間関係や、再就職するにせよそのような発言をした人間の評判は同業種に転職する際に伝わってしまうことを恐れます。そのようなリスクを負いながら、真実を発言するには、よほど強い人間か、身の安全を保障された状況を用意するか、そのどちらかが必要です。事実、社員同士の間で不正の事実を語っていた社員も、調査では不正の事実を認めるには至っていません。また、ヒアリング時に情報の秘匿を約束しながら、ヒアリング対象者の発言内容が島﨑社長及び取締役に漏洩している点も散見されています、2020年7月16日の所長会議の内容がよく物語っていますが、エフオングループは、島﨑社長の強い管理下の元、取締役及び幹部社員はYESマンで固められており、社員の身の安全は全く図られていない状況です。内部通報制度が全く形骸化していることがその事実をよく表してます。
② ヒアリング調査が行われるべき対象社員に行われていない
ヒアリングの必要性を言われていたにもかかわらず、調査委員会はバイオマス比率の取りまとめを行っている部署の社員に対するヒアリングを行っていませんでした。この点は、意図的に行われなかった疑いがあります。
③ 統計的知識を持ったメンバーがいない
監査役会のメンバー及び外部弁護士の中に、統計的知識を持ち合わせてる人間はいません。それどころか、当初バイオマス比率の仕組みすら理解していなかった状況だと理解しています。事実、内部告発者へのヒアリング時には、バイオマス比率サンプル用水分率データや発電所受け入れ時生トン水分率データについての質問は何もありませんでした。それらのデータを本当に確認し、統計的検定を行っていたかといえば、調査委員会のメンバーにそのような能力を持った者はいなかったと推測します。なぜならば、統計的解析を行っていれば、不正がないとは言えない結果が得られているからです。
ここでは、③の燃料サンプル偽装についての統計的裏付けについて、有意差検定の結果を示したいと思います。以下、統計的知識があることを前提としているため、基本的な統計知識の説明を省略している点、ご容赦ください。調査を行うには、どのようなことを行う必要があるのか、統計的には不正を支持する結果が出ていることをここでは示したいと思います。
(統計解析の対象)
A群:受入れ時トラック全量サンプルの月平均含水率
B群:外部検査機関に提出した燃料サンプルの月平均含水率
(統計解析データの採取期間)
白河発電所A群B群データ採取期間:2016/7〜2020/6
日田発電所A群B群データ採取期間:2019/6〜2020/5
(疑義概要)
A群は納入トラックごとにサンプルを採取しており含水率を操作するのは運用上困難である。一方、B群は代表的な納入元(前月の納入量順に上位3社まで)のサンプルを等量ずつ混合し、1つのサンプルとする。(サンプルは納入トラックから採取している。)燃料材の由来区分(未利用材区分、一般木質バイオマス区分、リサイクル木材区分の3区分)ごとに1検体150gを採取し、調査機関に提出することとなる。
今回、このB群の「未利用材区分」、「リサイクル木材区分」のサンプルについて、提出前に含水率を操作したのではないかという疑義が発生した。
(統計解析結果概要)
2群の「未利用材区分」、「リサイクル木材区分」について有意差検定を実施したところ、有意差が確認された。また、相対頻度分布を確認したところ、B群はA群と比べ、未利用材区分の含水率が顕著に低く、リサイクル木材廃棄物区分については含水率が顕著に高いことが確認された。
(結果の考察)
A群とB群はサンプルの抽出数、抽出方法に差はあるものの、操作をしない限りは含水率に大きな差が生じることは想定しにくく、本来、有意差は生じないものと想定される。しかし、今回、有意差が確認されたことは含水率が操作されたという疑義を支持する結果となった。
前述のとおり、A群とB群のサンプルの抽出数には差がある。疑義に対する反論として、このサンプルの抽出数によるものが想定される。
前述のとおり、A群のサンプル抽出数は全ての納入トラックから採取されたものの平均値であり、B群のサンプル抽出数は月に1度、各区分のサンプルを採取したものである。想定される反論として、両群の差はサンプル抽出数の差から生じる値の誤差によるものであるといったものが挙げられる。
この反論について妥当性を検討したい。抽出数の差による反論であるが、有意差検定はサンプル数や平均値、分散などの統計量を考慮した上で、偶然的に両者の差が発生する確率を確認し、判定するものである。今回、実施した全ての検定により有意差が確認された以上、サンプル数の差による反論は妥当性に欠けると考えられる。
(結論)
どのような内部調査をエフオンが行ったかは公表されておらず、また、その根拠や具体的な反論も示されていない。しかし、今回、データに基づいた統計的解析では、不正の事実がなかったと主張することは困難であること示す結果となった。
疑義が生じている以上、不正がなかったと主張するのであれば、可能な範囲で内部調査を明らかにするとともに、明確な根拠や具体的な反論を示すことが必要だろう。
【参考】
有意差とは、A群とB群の間に違いがないと仮定したとき(帰無仮説)に、その仮説が成り立つ確率はどれくらいか(p値)を示し、A群、B群の数値が同じ母集団から抽出されたものではないということを意味する統計学上の概念である。
解析に用いたデータは次のとおりである。2016/7〜2020/6白河発電所のA群、B群の含水率データと2019/6〜2020/5日田発電所のA群、B群の含水率データ。解析の手法としてはまず、F検定を行い等分散性がないことを確認。検定の手法は①Welchのt検定 ②対応のあるt検定 ③ウィルコクソンの符号順位検定 ④ウィルコクソンの順位和検定の4種類である。①と②はパラメトリック検定であり、③と④ノンパラメトリック検定となる。
以上の4種すべての検定で、いずれもp値が0.05を大きく下回る結果となった。
検定ごとのp値は次のとおりである。
1‐1 白河発電所未利用材チップ
①P-value=2.909e-11(2.909×10の-11乗)
②P-value=5.473e-12(5.473×10の-12乗)
③P-value=1.198e-10(1.198×10の-10乗)
④P-value=7.269e-12(7.269×10の-12乗)
1‐2 白河発電所リサイクル材チップ
①P-value=8.013e-10(8.013×10の-10乗)
②P-value=6.206e-10(6.206×10の-10乗)
③P-value=6.889e-11(6.889×10の-11乗)
④P-value=7.487e-11(7.487×10の-11乗)
2‐1 日田発電所未利用材チップ
①P-value=2.619e-05(2.619×10の-5乗)
②P-value=0.000132
③P-value=0.0004883
④P-value=2.219e-05(2.219×10の-5乗)
2‐2 日田発電所リサイクル材チップ
①P-value=0.0001715
②P-value=0.0001705
③P-value=0.0004883
④P-value=4.955e-05(4.955×10の-5乗)
この統計的解析結果をわかりやすく例えて言うならば、A群とB群のサンプルが同じチップの母集団から抽出されている確率は、毎回年末ジャンボ宝くじが当たるくらい低いといえる。よってA群は不正操作が行われていないサンプルを元にしており、B群が不正操作を行っていたサンプルを元にしていることを踏まえると、不正な含水率操作を行っていたことを裏付ける統計的解析結果といえる。
また、白河発電所と日田発電所の相対頻度分布は以下のとおりである。
(リンク先資料1頁から5頁のヒストグラム参照)