ちょっと味気ないかもしれませんが、「グラフで見る賢治の詩作」のつづきのようなお話です。
賢治のおもな口語詩集が、『春と修羅』、「春と修羅 第二集」、「春と修羅 第三集」と3つある中で、私は何となく、『第二集』に属する作品が、平均的には最も長い(字数が多い)のではないかと、思っていました。
これを実際に調べてみるとなると、当サイトの「宮澤賢治全詩一覧」には、各作品の「字数」も掲載していますので、そのデータをもとに各詩集の作品の字数の平均値(算術平均)を出してみると、下の表のようになります。
詩集
|
『第一集』
|
「第二集」
|
「第三集」
|
---|---|---|---|
一作品平均字数
|
572.9
|
341.3
|
233.8
|
つまり、字数の算術平均をとると、『第一集』の作品が、ダントツでいちばん長いように見えるんですね。
しかし、これは統計学的には、「算術平均」というものの持つ問題点というか限界を、わかりやすく示してくれている例と言えるでしょう。平均値をとろうとする集団の中に、飛び抜けて離れた値が存在するような場合には、算術平均はその値の影響を受けてしまって、集団全体を代表する値としては、適切な目安ではなくなってしまうことがあるのです。
具体的には、『春と修羅』には、「小岩井農場」(8082字)のように極端に長い作品が含まれているので、他には短めの作品も多いのに、平均値としてはかなり大きくなってしまうのです。
そこで一般的には、このような集団の場合に代表値としてよく用いられるのは、「中間値(median)」という統計的指標です。
各集の作品の字数の中間値は、下の表のようになります。
詩集
|
『第一集』
|
「第二集」
|
「第三集」
|
---|---|---|---|
一作品字数中間値
|
249.0
|
291.5
|
208.0
|
これでみると、「第二集」の作品がいちばん長くて、次が『第一集』、そしていちばん短いのが「第三集」ということになります。こちらの方が、多くの読者の方の直観的な印象には、より近いのではないでしょうか。
ところで『第一集』には、8000字を超える「小岩井農場」や、3000字台の「青森挽歌」や「真空溶媒」がある一方で、たった二行だけの「報告」や「イーハトーブの氷霧」もあります。
各作品の長さの「バラツキ」が最も大きいのは、『第一集』だろうと予想されますが、数値的にもこれはまさにその通りでした。
集団の代表値として「中間値」を採用した場合には、分布の広がりを表す数値としては、「四分位数範囲(IQR)」というものが一般に用いられますが(「算術平均」に対する「標準偏差」に相当します)、「第二集」、「第三集」の IQR がそれぞれ 288.25、174 だったのに対して、『第一集』のそれは、503 とほぼ倍の値になっています。
詩心の赴くままに、小さな作品を書いたり、おそろしく長い作品を書いたり、『第一集』の頃の若々しい賢治の奔放さを示しているような数字です。
これをグラフにしてみると、下記のようになります。
コメント