| 日 | 月 | 火 | 水 | 木 | 金 | 土 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
< ニューヨーク市民と海軍 | メイン | 現状認識の恐怖? >
前回の問題を繰り返します。
「19世紀の終わりにアメリカとスペインの間に戦争がありました。当時、アメリカ海軍の死亡率は『1000人当たり9人』でしたが、同じ時期のニューヨーク市民の死亡率は『1000人当たり16人』でした。海軍の募集係は「海軍に入隊したほうが安全」と宣伝しましたが、そうでしょうか?」
(安斎育郎著: だます心 だまされる心 岩波新書 より引用。)
答えはもちろん、そうではありません。
「数字だけ見ると『海軍のほうが安全』だと思い込みがちだが、ニューヨーク市民には高齢者も病人も含まれる。くらべるなら、海軍の兵士と同じ年齢層、健康状態のニューヨーク市民の統計とくらべなければならない。」
答えも同上より引用。
そうなんです。これは、論文を書くときの大切なポイントなのです。
「選択バイアス」といいます。
つまり、ある仮説にとって都合のよい集団を持ってきて比較すると、極めて恣意的な結果が得られます。
選択バイアスがあれば、あとでいくらすばらしい統計処理をしたとしても無意味です。統計上は有意差がでているので、うっかりだまされてしまいます。
詐欺師がよく使う手です。
だから、論文で、対象の記載は厳密になされなければなりません。つまり、論文では、対象のinclusion criteriaとexclusion criteriaをしっかり記載することが最重要事項なのです。
せっかくよいアイデアで論文を書いても、ここのところがいい加減だと、査読者の印象は最悪です。初心者の陥りやすい落とし穴です。
実は、このエントリーは、久しぶりの、「英語抄録・口頭発表・論文作成虎の巻」解説シリーズ第62回でした(笑)。
<PR>
見かけの数字や有意差にだまされてはなりません。
固定リンク | コメント (3) | トラックバック (0)
コメント
コメント一覧
今回の答えは1000人ずつに兵隊さんと市民を所属部隊や住所にわけて死亡者数をとったけれども 標本の分散が正規分布からかけ離れてはいたが、mean valueだけは海軍の方が低かったという答えかと思っていました。
前線に行かずに後方にいたら 老人も病人も兵隊さんにはいないでしょうし、病人が除隊されたから死亡率は殆んどゼロかもしれません。もちろん戦争中でも作為的に部隊を選んだら死亡者ゼロの連隊もあるでしょう。
つまり兵が次々とやられてしまって戦力が低下して、とりあえず人材を確保しないと、物理的にもうどうしようもない。
まず、海軍の死亡率の『1000分の9人』という数字も、ニューヨーク市民の『1000分の16人』という数字も、厳しい事情を悟られないようにするために、人為的に操作した数字である可能性は充分に考えられます。
もしも、それが事実であると仮定した場合、戦争に勝つにはかなり厳しい・・・と想定はできると思います。ただ、実際はそうであっても、市民の士気を維持するために、そういうことを悟られたら、もうお終いですからね。
コメントありがとうございます。
せっかく良いストーリーなのに、対象の記載が不十分な投稿をよく見かけます。データの信頼性が根本から崩れてしまいます。
azuki様
おいでいただきありがとうございます。
「数字が一人歩き」ということがあります。
数字だと、いかにも客観的な印象を与えますが、
何事も、元のデータがどこからどのようにして出てきたのかを検証する必要があります。
コメントを書く