グラフの重要性って過小評価されてない?正しいグラフが作られるか否かが、生死を分ける時もある!

1.データのビジュアル化 – グラフの発明(17世紀)

 これはハーバード大学ビジネススクールで行われているケーススタディです。実例を基にしたものではなく仮想例で、ジャック・ブリテン教授とシム・シトキン教授が考案したものです。30年以上にわたって世界中の学生に紹介されてきました。このケーススタディを受講した者の多くが、点が散在するグラフを見て、外温度とエンジントラブルの関係は決定的なものではないと判断します。ほとんど全員がレースに出ることを決断します。ほぼ全員がそのグラフだけを見て決断します。決断する前に、見せられたグラフには載っていない17回(エンジンブローが起こらなかったレース)のデータやグラフを見せて欲しい要求する者はほとんどいません。しかし、その17回のデータも見れるようになると、低い外気温下ではエンジンブローが発生するリスクが非常に高いことが明白に分かります。エンジンブローが発生しなかったレースは、全て外気温が華氏65度(摂氏18度)以上で行われていました。また、その外気温以下で行われたレースでは、全レースでエンジンブローを起こしていました。明日のレースに出場したら間違いなく悲惨な結果に終わるでしょう。

 このケーススタディに関しては、もうひとひねりあって、実は、上のグラフは実際に起こった事象のデータを基に作成したものでしたが、それはレースとは全く関係の無いものでした。上のグラフは、1986年にスペースシャトルのチャレンジャーが打ち上げられる前夜までに収集されていたデータを基に作ったグラフです。かつて、ダイアン・ボーンがチャレンジャーの悲惨な事故についての記事で書いていたのですが、そのグラフはNASAの臨時で開かれた電話会議で取り上げられたものでした。そのグラフはラフに手書きしたもので、取り急ぎケネディ宇宙センターにファックスで送信されたものでした。一部のエンジニアは、このグラフを使用して、以前に低気温下でスペースシャトルのOリングが弾性を失い燃料漏れを起こしたことがあり、再びそうなる可能性があると勧告しました。しかし、その勧告はほとんどの技術者から無視されました。そのグラフは、ある程度の低温になると不具合が発生することを暗示するものでしたが、他のもっと高い温度帯のデータを求める者は誰もいませんでしたので、それが見られることはありませんでした。それで、低温であるかにもかかわらず、幹部たちが打上をするという悲劇的な決断をしてしまったのです。打ち上げ後、まもなく、固形ロケットブースターの内部のジョイント部分に使用されるゴム製のOリングが凍結して気密性が低下して燃料が漏れ出し、スペースシャトルは粉々となって乗員7名全員が死亡しました。事故から10年後、データのビジュアル化の大家で情報デザインの巨匠でもあるエドワード・タフテは、適切で十分なデータがあったにもかかわらず誤った方法で図表化された典型的な例として、チャレンジャーの電話会議で使われたグラフを挙げていました。彼が指摘していたのですが、正しいグラフというのは、一目見て真実が正しく伝わらなくてはなりません。

 「A History of Data Visualization and Graphic Communication(データのビジュアル化とグラフィックコミュニケーションの歴史)」(ハーバード出版、本邦未発売)という著書において、心理学者のマイケル・フレンドリーと統計学者のハワード・ワイナーは、見えないものをビジュアル化して視覚を通して理解しようとすることは、問題を深く理解しようとする際には非常に有効であると主張しました。その本の序章には、歴史上初の統計的なグラフであると思われるものが描かれていました。それは、1620年代にオランダの地図製作者であったミヒャエル・フローレント・ファン・ラングレンによって作成されたものでした。当時は大航海時代の真っ只中で、ヨーロッパでは時間、距離、位置を正確に測定する技術に関心が集まっていました。そのような技術は、航海時には特に重要でした。当時、正確な位置を認識して正しい方角に航行するということはとても難しいことだったのです。その時代の航海は、誤りの多い海図と正確でない羅針盤に頼っていました。時には、揺れる甲板の上で天体を観測しながら航海しました。いずれの方法でも船の位置を特定することが出来ない場合は、その地点の海底の深さをしらべるために、ロープを船外に投げました。南北の位置を認識することも容易なことではありませんでしたし、地球の自転の影響で、東西の方向を正確に認識することもほぼ不可能でした。

 1628年、ファン・ラングレンはスペイン王室に手紙を書きました。彼は、経度を計算する方法を改善することの重要性を説き、資金援助を求めました。自分の主張を裏付けるために、彼は簡単な一次元のグラフを描きました。彼は、そのグラフの左方にスペインの古代都市トレドを示す点を描きました。その点を始点として、彼は1本の水平なラインを引き、その線の終点はローマを示していました。ラインの長さがトレドローマ間の経度の差を示していたのですが、歴史上さまざまな者によって計測が行われ、経度の差については12種類の推測が為されていたので、それら全てを示すべくライン上に12個の点が記されました。12種類の推測はかなり幅の広いもので、ライン上に点が散在していました。経度の差は20度程とする推測が多く、偉大な天文学者ティコ・ブラーエや革新的な地図製作者ゲラルドゥス・メルカトルの推測も20度ほどでした。また、有名な数学者プトレマイオスの推測は約30度でした。12種類の推測は全て過大でした。正確な経度の差は、16.5度であることが後に判明しています。そのグラフが示そうとしていたことは、推測がいかに幅広いかということでした。12種類の内のどの推測を信じるかによって結果は違うのですが、トレドからローマを目指した旅行者は、運が良ければローマから100キロほどの所に辿り着きますが、最も正確でない推測に従った場合にはローマから1,000キロ離れたブルガリア東部の平原に辿り着くことになります。

 ファン・ラングレンは、それらの値をグラフでは無く、表で表すことも出来たでしょう。当時はそれが典型的なやり方でした。しかし、フレンドリーとワイナーが著書で主張しているのは、グラフにすることが重要で、視覚に訴えかけるので理解しやすいということでした。数字がビジュアル化されると、表とは別次元で分かり易くなるのです。その差は非常に大きいのです。ファン・ラングレンは、言っていました、「陛下、トレドとローマの間の経度の差が正確に分からないと言っても、それは大した問題ではありません。インドと西インド諸島の間の距離と比べたら微々たるものです。」と。

 ファン・ラングレンがグラフを描いたことは、非常に画期的なことでした。彼は熟練の地図製作者でしたので、紙の上で距離を表現することには精通していたのでしょう。しかし、タフテが1997年に書いた著書「Visual Explanations(ビジュアルな説明:本邦未発売)」で述べているように、地図は実際の世界を絵画的に表現して小型化したものです。ラングレンのグラフで新機軸だったのは、経度の差の推測が線上に長さとして表現されたことです。それによって経度の差の推測のバラツキを視覚的に認識できるようなりました。

 ファン・ラングレンがグラフを作ったのは独創的なことで、グラフというものがそれより以前に作られたことはありませんでした。歴史を遡ると、グラフが作られていれば問題が容易に解決したかもしれないと思われる事例がたくさんありました。フレンドリーとワイナーが著書で指摘しているのは、エジプトのナイル川の事例でした。1960年代にアスワンダムが建設される前のナイル川は毎年堤防が決壊して洪水が発生していましたが、エジプト人は繁栄は毎年の洪水によってもたらされていることを認識していましたので、3千年以上の期間に渡ってナイル川の最高水位を記録し続けていました。その記録によって、農民は直近の洪水の状況を分析し、いつどこで作物を栽培するかを決定していました。しかし、1950年代にウィリアム・ポッパーが1,300年分のナイル川の洪水位をグラフ化するまで、数千年もの間、誰もデータの蓄積が重要であることは認識していませんでした。フレンドリーとワイナーが指摘していますが、長年の洪水位のグラフを作成したり、直近10年間の平均水位の傾向から次の10年間を予測するというようなことは、誰も考えたことは無かったのです。ポッパーがグラフ化したことで初めてわかったのは、期間によって沈泥の量に非常にバラツキがあるということでした。沈泥は作物のための肥沃な土壌を作ります。豊作になることも、飢饉になることもありましたが、それは単なる偶然ではなく、沈泥の多寡によって決まっていました。