『オネーギン』論文統計解析見直し

|

先週,『オネーギン』論文の統計的検定をやった。今日少し考えていたら誤りに気づいた。前回は色彩語の数値に有意差があることを分散分析検定で試みたわけだが,分散分析はそもそも母集団の存在と,分布の正規性がその前提にあることを抜かしていた。

文学作品の章毎のデータでは,テーマ論の影響を考えると,色彩語が正規分布すると仮定することは難しいし,単一作品における単語の出現頻度の調査が目指す母集団の概念も怪しいものとなる。

そこで,今回ノンパラメトリックな検定手法である Kruskal-Wallis の検定でやり直してみた。結論は分散分析と変わらず,数値の差は 1% 有意水準で有意となった。再度 R による実行結果を示しておく。

> clrdst <- read.table("color-dst.txt", 
header=T)
> attach(clrdst)
 
      The following object(s) are masked _by_ .GlobalEnv :
 
      COLOR 
 
> COLOR <- factor(COLOR)
> kruskal.test(DATA ~ COLOR)
 
      Kruskal-Wallis rank sum test
 
data:  DATA by COLOR 
Kruskal-Wallis chi-squared = 37.3134, df = 6, p-value =
1.530e-06
 
> pairwise.t.test(DATA, COLOR, p.adj="holm")
 
      Pairwise comparisons using t tests with pooled SD 
 
data:  DATA and COLOR 
 
   他      白      緑      赤      金      青     
白 0.00023 -       -       -       -       -      
緑 1.00000 2.7e-05 -       -       -       -      
赤 0.00031 1.00000 3.8e-05 -       -       -      
金 1.00000 3.9e-05 1.00000 5.3e-05 -       -      
青 1.00000 5.3e-05 1.00000 6.9e-05 1.00000 -      
黒 1.00000 5.3e-05 1.00000 6.9e-05 1.00000 1.00000
 
P value adjustment method: holm 
> 

Moon Calendar

Profile

ISAO YASUDA。システムエンジニア。神奈川県在住。昭和 30 年代を懐かしむオヤジ。ロシアに興味があります。
[more], [About our site]

Notice

この文書はフィクションであり,実在する個人,団体等とは一切関係ありません。

R-18 指定サイトです。そのうち「18 歳以上ですか」の認証を入れる予定です。

文書の記述内容は無保証です。不適切な表現があればコメントにてご指摘ください。

コメント,トラックバックは,現在,運用を停止しています。ご意見等ありましたら isao@yasuda.homeip.net 宛電子メールにてお願いします。

Links

About this entry

Written by isao at 2007年2月23日 01:46.

Previous: 統計解析ソフト R による『オネーギン』色彩分析の検定

Next: 『オネーギン』論文改訂

Recent Entries in Main Index.
All Entries in Archive Index.

February 2012

Sun Mon Tue Wed Thu Fri Sat
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29      
Powered by Movable Type 4.1 blog counter