前回、代表値からデータの分布について考えたが、観測値が異なるデータでも代表値が同じになってしまう場合があった。これは、代表値が分布の位置を示す指標であるからである。そのため、分布の形を表わすには別の指標が必要である。分布の形を表わす指標として、分散や標準偏差のような散らばりを表わす指標が多く用いられる。
散らばりを表わす指標としては、標準偏差がよく用いられる。しかし、標準偏差は、分布の位置が異なるデータの散らばりを比較する際には適していない。平均値の影響を受けた指標であるからだ。そのため、データ間での散らばりの大小を比較する際には、標準偏差を平均値で割ったものが用いられる。これは、変動係数と呼ばれるものである。
変動係数を用いて、三味線の曲の難易度を測ってみようと思う。私の地元浜松ではゴールデンウィークの3日間、浜松まつりが実施される。浜松まつりの見所の1つが艶やかな演奏をしながら市内を引き回される御殿屋台であり、私は三味線担当として今年から自分の町の御殿屋台に乗っている。このまつりでは3曲を弾くため、この3曲について運指の変動係数を求め、難易度の評価をする。
三味線の楽譜では、ピアノのような音符やギターのようなコードではなく、弦を押さえる位置が数字で表わされている。
↑画像1:三味線の竿
↑画像2:楽譜(一部)
画像1にあるように、三味線には押さえる位置が数字で定められている。小さい数字を押さえるほど低い音が、大きい数字を押さえるほど高い音が出るようになっている。画像2にあるような楽譜から押さえる位置とはじく弦を読み取ることで、曲を弾くことができる。楽譜にある数字に従い手を動かしながら演奏するが、曲に出てくる数字の幅が広いほど大きく手を移動させる必要があるため、難易度が高くなるといえる。そのため、浜松まつりで弾く「小鍛治」、「宮神楽」、「四丁目」の3曲について、楽譜で出てくる数字の変動係数を求めることで難易度を測る。
Excelを用いて計算を行った。まずは、楽譜に出てくる数字を順番に1列に並べた。ここで、0は運指の意味としては弦を押さえずにそのまま弾くことを表わしており、手の移動がないため除外した。
このデータとExcel関数を利用して、標準偏差、平均、変動係数を求めた。その結果は以下のようになった。
実際に3曲を弾いている私自身の体感としては、四丁目が曲として最も長く指使いも難しく、曲として短く指の移動も少ないように感じている宮神楽が簡単なイメージがある。データから求めた標準偏差、変動係数から難易度を考えると、私の体感とは別の結果となった。
標準偏差について見ると、小鍛治で最も大きくなっているが宮神楽と四丁目には大きな差がないことが分かる。体感では明確な差を感じるため、標準偏差から見る難易度の差は不適切であるように思われる。これは、平均値が異なることから起きていると考えられる。そのため、標準偏差を平均値で割った変動係数から難易度を考察する。
大きさの順番は標準偏差と変動係数で同じになったが、大きさの比は標準偏差よりも大きくなった。そのため、散らばりの程度が比較できるようになった。変動係数によると、散らばりの大きい順に小鍛治、四丁目、宮神楽の順であることが分かる。散らばりが大きいほど指の移動が多いと言えるため、この順番に難しいことになる。私自身の体感である四丁目の方が宮神楽より難しいという点においては当てはまっているが、四丁目が最も難しいという点においては変動係数による結果に当てはまっていない。これは、曲のテンポによるものであると考えられる。リズムが単調な曲ほど、テンポが速くなりやすい。小鍛治と比べて四丁目は小太鼓などの鳴り物のリズムが単調であるため、テンポが速くなりやすく、それについていくのが大変であるために小鍛治よりも難しいと感じるのであると考えた。
以上のようにして、指の移動という面から曲の難易度を測ることができた。しかし、体感とは異なる結果もあり、曲の難易度を1つの指標から測るのは難しいことがよく分かった。
参考文献
・松原望, 統計学入門, 東京大学出版会, 1991