『春と修羅』第一集~第三集の各作品の長さ

 ちょっと味気ないかもしれませんが、「グラフで見る賢治の詩作」のつづきのようなお話です。

 賢治のおもな口語詩集が、『春と修羅』、「春と修羅 第二集」、「春と修羅 第三集」と3つある中で、私は何となく、『第二集』に属する作品が、平均的には最も長い(字数が多い)のではないかと、思っていました。
 これを実際に調べてみるとなると、当サイトの「宮澤賢治全詩一覧」には、各作品の「字数」も掲載していますので、そのデータをもとに各詩集の作品の字数の平均値(算術平均)を出してみると、下の表のようになります。

詩集
『第一集』
「第二集」
「第三集」
一作品平均字数
572.9
341.3
233.8

 つまり、字数の算術平均をとると、『第一集』の作品が、ダントツでいちばん長いように見えるんですね。
 しかし、これは統計学的には、「算術平均」というものの持つ問題点というか限界を、わかりやすく示してくれている例と言えるでしょう。平均値をとろうとする集団の中に、飛び抜けて離れた値が存在するような場合には、算術平均はその値の影響を受けてしまって、集団全体を代表する値としては、適切な目安ではなくなってしまうことがあるのです。
 具体的には、『春と修羅』には、「小岩井農場」(8082字)のように極端に長い作品が含まれているので、他には短めの作品も多いのに、平均値としてはかなり大きくなってしまうのです。

 そこで一般的には、このような集団の場合に代表値としてよく用いられるのは、「中間値(median)」という統計的指標です。
 各集の作品の字数の中間値は、下の表のようになります。

詩集
『第一集』
「第二集」
「第三集」
一作品字数中間値
249.0
291.5
208.0

 これでみると、「第二集」の作品がいちばん長くて、次が『第一集』、そしていちばん短いのが「第三集」ということになります。こちらの方が、多くの読者の方の直観的な印象には、より近いのではないでしょうか。


 ところで『第一集』には、8000字を超える「小岩井農場」や、3000字台の「青森挽歌」や「真空溶媒」がある一方で、たった二行だけの「報告」や「イーハトーブの氷霧」もあります。
 各作品の長さの「バラツキ」が最も大きいのは、『第一集』だろうと予想されますが、数値的にもこれはまさにその通りでした。
 集団の代表値として「中間値」を採用した場合には、分布の広がりを表す数値としては、「四分位数範囲(IQR)」というものが一般に用いられますが(「算術平均」に対する「標準偏差」に相当します)、「第二集」、「第三集」の IQR がそれぞれ 288.25、174 だったのに対して、『第一集』のそれは、503 とほぼ倍の値になっています。
 詩心の赴くままに、小さな作品を書いたり、おそろしく長い作品を書いたり、『第一集』の頃の若々しい賢治の奔放さを示しているような数字です。

 これをグラフにしてみると、下記のようになります。

グラフ:『春と修羅』第一集~第三集の一作品あたり字数(中間値)とばらつき