統計解析ソフト R による『オネーギン』色彩分析の検定

| | コメント(3)

このお休みに,『オネーギン』の色彩分析について,以前から懸案であった統計的検定をやってみた。

昨年二月に書いた論文「『エヴゲーニイ・オネーギン』のパラレリズムの一考察」では,色彩語(色彩をイメージする単語)を抽出し,その分析を通して作品構造の特色を検討した。しかし色彩語の出現度数について統計的に有意かどうかの検定を行っておらず,例えば「赤が黒の要素よりも偶然ではなく多い」ということを客観的に示すには至らなかった。そのため論文の主張の根拠となるべき色彩語の出現度数の差異が有意なものかを統計的に検定しておく必要を感じていたのである。

作品における色彩語の抽出は,昨年十月にプログラムを書いて済ませていた。その後,どのような検定を行うべきかずっと悩んでいたのである。二パターンの検定を行えばよさそうとの結論に至った。ひとつは一元配置分散分析であり,章毎の色彩語出現分布の差が偶然の産物かどうかの検証。もうひとつはホルムの補正による多重比較であり,これは赤,白などの要素の相互の差異が有意かどうかの検証である。今回は統計解析ソフトウェア R を用いて計算してみた。

R の実行結果を以下に示す。結果として,「差がない」という帰無仮説は 1% 有意水準で棄却され,色彩語の出現度数の差異は明らかに等価でないこと,赤と白が主要な作品色彩要素であることが明確になった。もちろん,この結果は論文にも反映するつもりでいる。

R : Copyright 2006, The R Foundation for Statistical 
Computing
Version 2.3.1 (2006-06-01)
ISBN 3-900051-07-0
...
> # clrdt オブジェクトに各章ごとの色彩要素と出現度数のテーブルデータを格納。
> clrdt <- read.table("~/src/onegin_ronbun/R/color.txt", 
header=T)
> # clrdt 格納データの内容を表示する。
> clrdt
   COLOR DATA
1     赤    9
2     赤   12
3     赤   25
4     赤   11
5     赤   20
6     赤   14
7     赤   12
8     赤   13
9     赤    5
10    白    5
11    白    7
12    白   17
13    白   14
14    白   36
15    白    8
16    白   23
17    白   13
18    白    3
19    青    2
20    青    0
21    青    0
22    青    0
23    青    0
24    青    0
25    青    3
26    青    1
27    青    5
28    黒    0
29    黒    2
30    黒    2
31    黒    1
32    黒    5
33    黒    2
34    黒    5
35    黒    1
36    黒    0
37    緑    2
38    緑    0
39    緑    1
40    緑    1
41    緑    1
42    緑    0
43    緑    3
44    緑    0
45    緑    2
46    金    2
47    金    3
48    金    0
49    金    1
50    金    1
51    金    1
52    金    2
53    金    0
54    金    2
55    他    2
56    他    2
57    他    2
58    他    3
59    他    1
60    他    2
61    他    2
62    他    2
63    他    5
> attach(clrdt)
> COLOR <- factor(COLOR)
> # 一元配置分散分析を行う。
> fm <- aov(DATA ~ COLOR)
> summary(fm)
            Df  Sum Sq Mean Sq F value    Pr(>F)    
COLOR        6 1901.08  316.85  14.536 6.434e-10 ***
Residuals   56 1220.67   21.80                      
---
Signif. codes:  0 ‘***’ 0.001 `**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 
‘ ’ 1 
> # F値: 14.536; グループ内変動: 21.80; グループ間変動: 316.85;
> # 群自由度: 6(7群-1); 残差自由度: 56(7群*(9章-1))
> # 検定結果は6.434e-10となり1%有意水準で有意。
>
> # 多重比較(ホルムの補正によるt検定)
> pairwise.t.test(DATA, COLOR, p.adj="holm")
 
	Pairwise comparisons using t tests with pooled SD
data:  DATA and COLOR 
 
   他      白      緑      赤      金  青
白 2.8e-05 -       -       -       -   - 
緑 1       5.5e-06 -       -       -   - 
赤 6.0e-05 1       1.2e-05 -       -   - 
金 1       7.2e-06 1       1.5e-05 -   - 
青 1       6.3e-06 1       1.4e-05 1   - 
黒 1       1.7e-05 1       3.8e-05 1   1 
 
P value adjustment method: holm 
> # 白,赤とそれら以外の組み合わせで有意確率が1%を下回り有意。
>

コメント(3)

色彩語の抽出はどのように行ったのでしょうか?
現在,卒業論文として「ブーニンの作品における色彩語の特徴」を調べているので,
参考にさせて頂きたいです。

emi 様。私の書いた論文をメールで送りますね。

isao様,遅くなりましたが,メールにて御返事させて頂きました。
御都合の良い時に御高覧下さい。

Moon Calendar

Profile

ISAO YASUDA。システムエンジニア。神奈川県在住。昭和 30 年代を懐かしむオヤジ。ロシアに興味があります。
[more], [About our site]

Notice

この文書はフィクションであり,実在する個人,団体等とは一切関係ありません。

R-18 指定サイトです。そのうち「18 歳以上ですか」の認証を入れる予定です。

文書の記述内容は無保証です。不適切な表現があればコメントにてご指摘ください。

コメント,トラックバックは,現在,運用を停止しています。ご意見等ありましたら isao@yasuda.homeip.net 宛電子メールにてお願いします。

Links

About this entry

Written by isao at 2007年2月19日 02:32.

Previous: OpenOffice-2.0, Calc2LaTeX

Next: 『オネーギン』論文統計解析見直し

Recent Entries in Main Index.
All Entries in Archive Index.

February 2012

Sun Mon Tue Wed Thu Fri Sat
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29      
Powered by Movable Type 4.1 blog counter