統計解析ソフト R による『オネーギン』色彩分析の検定

| | コメント(0) | トラックバック(0)

このお休みに、『オネーギン』の色彩分析について、以前から懸案であった統計的検定をやってみた。

昨年二月に書いた論文「『エヴゲーニイ・オネーギン』のパラレリズムの一考察」では、色彩語(色彩をイメージする単語)を抽出し、その分析を通して作品構造の特色を検討した。しかし色彩語の出現度数について統計的に有意かどうかの検定を行っておらず、例えば「赤が黒の要素よりも偶然ではなく多い」ということを客観的に示すには至らなかった。そのため論文の主張の根拠となるべき色彩語の出現度数の差異が有意なものかを統計的に検定しておく必要を感じていたのである。

作品における色彩語の抽出は、昨年十月にプログラムを書いて済ませていた。その後、どのような検定を行うべきかずっと悩んでいたのである。二パターンの検定を行えばよさそうとの結論に至った。ひとつは一元配置分散分析であり、章毎の色彩語出現分布の差が偶然の産物かどうかの検証。もうひとつはホルムの補正による多重比較であり、これは赤、白などの要素の相互の差異が有意かどうかの検証である。今回は統計解析ソフトウェア R を用いて計算してみた。

R の実行結果を以下に示す。結果として、「差がない」という帰無仮説は 1% 有意水準で棄却され、色彩語の出現度数の差異は明らかに等価でないこと、赤と白が主要な作品色彩要素であることが明確になった。もちろん、この結果は論文にも反映するつもりでいる。

R : Copyright 2006, The R Foundation for Statistical 
Computing
Version 2.3.1 (2006-06-01)
ISBN 3-900051-07-0
...
> # clrdt オブジェクトに各章ごとの色彩要素と出現度数のテーブルデータを格納。
> clrdt <- read.table("~/src/onegin_ronbun/R/color.txt", 
header=T)
> # clrdt 格納データの内容を表示する。
> clrdt
   COLOR DATA
1     赤    9
2     赤   12
3     赤   25
4     赤   11
5     赤   20
6     赤   14
7     赤   12
8     赤   13
9     赤    5
10    白    5
11    白    7
12    白   17
13    白   14
14    白   36
15    白    8
16    白   23
17    白   13
18    白    3
19    青    2
20    青    0
21    青    0
22    青    0
23    青    0
24    青    0
25    青    3
26    青    1
27    青    5
28    黒    0
29    黒    2
30    黒    2
31    黒    1
32    黒    5
33    黒    2
34    黒    5
35    黒    1
36    黒    0
37    緑    2
38    緑    0
39    緑    1
40    緑    1
41    緑    1
42    緑    0
43    緑    3
44    緑    0
45    緑    2
46    金    2
47    金    3
48    金    0
49    金    1
50    金    1
51    金    1
52    金    2
53    金    0
54    金    2
55    他    2
56    他    2
57    他    2
58    他    3
59    他    1
60    他    2
61    他    2
62    他    2
63    他    5
> attach(clrdt)
> COLOR <- factor(COLOR)
> # 一元配置分散分析を行う。
> fm <- aov(DATA ~ COLOR)
> summary(fm)
            Df  Sum Sq Mean Sq F value    Pr(>F)    
COLOR        6 1901.08  316.85  14.536 6.434e-10 ***
Residuals   56 1220.67   21.80                      
---
Signif. codes:  0 ‘***’ 0.001 `**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 
‘ ’ 1 
> # F値: 14.536; グループ内変動: 21.80; グループ間変動: 316.85;
> # 群自由度: 6(7群-1); 残差自由度: 56(7群*(9章-1))
> # 検定結果は6.434e-10となり1%有意水準で有意。
>
> # 多重比較(ホルムの補正によるt検定)
> pairwise.t.test(DATA, COLOR, p.adj="holm")
 
	Pairwise comparisons using t tests with pooled SD
data:  DATA and COLOR 
 
   他      白      緑      赤      金  青
白 2.8e-05 -       -       -       -   - 
緑 1       5.5e-06 -       -       -   - 
赤 6.0e-05 1       1.2e-05 -       -   - 
金 1       7.2e-06 1       1.5e-05 -   - 
青 1       6.3e-06 1       1.4e-05 1   - 
黒 1       1.7e-05 1       3.8e-05 1   1 
 
P value adjustment method: holm 
> # 白、赤とそれら以外の組み合わせで有意確率が1%を下回り有意。
>

トラックバック(0)

このブログ記事を参照しているブログ一覧: 統計解析ソフト R による『オネーギン』色彩分析の検定

このブログ記事に対するトラックバックURL: http://nox-insomniae.ddo.jp/cgi-bin/mt-tb.cgi/181

Comments


画像の中に見える文字を入力してください。

Profile

ISAO。システムエンジニア。昭和 30 年代を懐かしむオヤジ。ロシアに興味があります。
[more], [About our site]

Notice

この文書はフィクションであり,実在する個人,団体等とは一切関係ありません。

文書の記述内容は無保証です。不適切な表現があればコメントにてご指摘ください。

管理者が公序良俗に反すると判断したコメント,トラックバックは,断りなく削除される場合があります。

Links

About this entry

Written by isao at 2007年2月19日 02:32.

Previous: OpenOffice-2.0, Calc2LaTeX

Next: 『オネーギン』論文統計解析見直し

Recent Entries in Main Index.
All Entries in Archive Index.

Web Pages

Powered by Movable Type 4.1