2009年6月アーカイブ

Utf82TeX すみません

|

昨夜公開した Utf82TeX モジュール(utf82tex 本体プログラム)につまらないバグがあった。U+2000 から U+2FFF の JISX 0208 にない記号類が \UTFM0{xxxx} になってしまうというもの(正しくは \UTFM{xxxx})。

めったに使わない文字だと思いますが,早速ダウンロードしてくださった方には申しわけありません。もう一度アーカイブを落としていただくか,utf82tex モジュールをこれと差換えてください。

Utf82TeX 0906 Release

|

Utf82TeX 0906 をリリースした。Unicode CJK Unified Ideographs Extension B(CJK 統合漢字拡張 B)をサポートし,Unicode 漢字の \UTFx, \CIDx 命令変換を改善した。漢字についてはほぼ遺漏なく処理できるようになったはずである。本サイトのダウンロード頁から取得できる。ドキュメントも改訂した。

Windows Vista がリリースされてから入力文字の範囲が拡張され,CJK 統合漢字拡張 B の文字も IME から普通に入力できるようになった。例えば,吉野屋の吉(つちよし):牛丼の吉野家の「吉」=「つちよし」もこのエリアに定義されている。従来の Utf82TeX だとそのまま出力されてしまい,コンパイルでエラーとなっていた。Utf82TeX 0906 は「つちよし」(U+20BB7)を \CID{13706} に変換する。

齋藤さんの OTF パッケージを前提としている。CJK 統合漢字拡張 B 領域文字を OTF パッケージで出力するには,安定版(stable)ではだめで,開発版(devel)を導入する必要があることに注意いただきたい。

今回いちばん苦労したのが,変換テーブル。Unicode コードポイントとそれに対応する CID 番号の対である。TeX コミュニティの権威者・角藤先生の utf8toutf 変換ツールがこのテーブルを持っていることを知った。先生にメールを書いて,流用許諾をお願いした。先生は快く了承してくださった。

テーブル構築用のプログラムを何本も書いた。UCS コードとビット列との相互変換などのコードを書くうちに,UTF-8 や UTF-16BE の符号化方式についても勉強になった。

Unicode Home Page にある Unihan database: Unihan.txt をダウンロードし,UCS と Adobe_Japan1_6 コード(つまり CID 番号)の対を抽出し,プログラムで加工した。Adobe Reader に添付されている CMap(日本語用 UniJIS-UTF16-H,中国語簡体字用 UniGB-UTF16-H,中国語繁体字用 UniCNS-UTF16-H,韓国語用 UniKS-UTF16-H)と突き合わせして,UCS — CID JP, CID CS, CID CT, CID KR のレコードを生成した。これでできたテーブルを角藤先生のテーブルデータとマッチングして不足,不正をチェックした。最終的に 15,790 字のテーブルとなった。このうち CJK 統合漢字拡張 B 領域の変換可能文字は日本語,中国語合わせ(韓国語のハンチャはそもそもこの領域には定義されていない)1,939 文字となっている。

0906 の改修で少し Perl コードを整理した。strict でないし,余計な処理の残骸もこれまで野ざらしにしていたのだ。まだ misima にはこの変更を反映していない。もうしばらく時間がかかりそうである。

桜桃忌

|

昨日は太宰治の桜桃忌だった。6 月 19 日は,1948 年に心中した彼と愛人の遺体が発見された日であり,彼の誕生日でもある。今年は太宰治生誕百年を記念する年であり,例年にも増して桜桃忌,彼の文学遺産が話題になったようである。

太宰治という作家は,本が売れない現代においても,根強いファンを生み出し,愛読され続けている稀有の存在ではないだろうか。私も,高校時代,『津軽』にはじまって,『人間失格』,『斜陽』の長編,『晩年』,『ヴィヨンの妻』,『走れメロス』,『お伽草子』などの短篇を読んだものである。妻も彼の愛読者であり,青森県五所川原にある彼の生家・斜陽館がまだ旅館経営をしていたころに宿泊見学をしたほどである。

彼の作風・文体はかなりくせの強いものである。独特のなれなれしさがあり,弱さがあり,気取りがあり,優しさがあり,恐るべき文学的教養があり,近代人に相応しい毒がある。一読してすぐ彼の文章だとわかる個性をもっている。無頼の私生活,実人生と作品世界とを一致させるかのような半生ばかりが特筆されることもしばしばである。そのせいか,熱烈なファンとともに徹底的否定論者も多い。三島由紀夫が彼を嫌っていたのは有名な話。私は,その文体に鼻持ちならない要素を時おり感じながらも,太宰を日本文学史における第一級の作家であると認める。彼の実人生を抜きにして素直に作品を読めば,文体というものがいかに身振りをするものか,遠くへ逃げたり近づいて笑いかけたりするものか,驚いてしまう。虜になってしまうのである。

文学史的価値は別として,個人的には,中期から晩年にかけての短篇が好きである。『新ハムレット』,『女の決闘』,『古典風』,『乞食学生』,『トカトントン』,『グッド・バイ』など,古典・歴史に取材し優れた批評精神に裏付けられた知的作品,ペーソスと軽妙・洒脱・ユーモアとに満ちた人情ものが大好きである。『グッド・バイ』が未完に終わったのは,惜しい。昔の女ひとりひとりに別れを告げて彷徨するなんて,なんとファンタスティックなことか。太宰治は西鶴の正統なのである。

マニュアル人間

|

「マニュアル人間」という言葉がある。マニュアルがない,あるいはマニュアルに書かれていない場合,主体的に考え状況を察知した行動を,とることができないような人物について使われるようである。だいたいにおいて,否定的なニュアンスがある。

例えば,ハンバーガー 50 個を注文する客に対して,「店内でお召し上がりですか,それともお持ち帰りですか」と確認するファーストフードの店員。50 個も注文する客がひとり「店内でお召し上がり」になるとは常識では考えにくい。「接客マニュアル」に書かれてある手順に機械的に従っていることがあまりに露骨に出てしまい,常識的な客からすると「バカかこいつ」というように受け取られてしまうことになる。そんな店員をあざ嗤うブログを私は読んだことがある。

私は「マニュアル人間」をダメな人格だとは少しも思わない。むしろ,逆。マニュアルをひたすら学びその実現の精度を上げようと努力する人を尊敬する。少しくらい気が利かなくともよい。というのも,自分の主体的行動を尊ぶにせよ機転が利くにせよ,マニュアルあるいは先人の知恵を定着させたものを軽んじて,自分勝手なことをなす輩 — たとえそれがたまに天才的なできだったにせよ — よりも,実際の仕事においては,私の個人的経験からして何倍も有用だからである。「有用」とは計画・設計が可能という意味だ。プロの基本的特質である。

ブログ主に「バカ」にされた件のファーストフード店員だって,大半の客には全うなサービスだと評価されているのである。50 個も注文するほうが極めて稀な事象であって,例外ケースで,首を傾げさせるおかしな対応にケチをつけるほうがどうかしていると私なんかは思う。親子丼の金しか払わないくせに,フランス料理のフルコースでも頼んだ気分になっていないか。それこそ「バカ」としか思われないのだ。

企業の品質管理というものは製品のごくわずかに不良が混入していることを前提と看做す。その不良率を一定範囲内に収めることが生産技術の骨子である。ファーストフードの品質管理者からみれば,ひとり 50 個の注文はその不良発現の許容範囲にある僅少事象なのかも知れないのである(そもそも,常識は別として,50 個の注文でも「店内でお召し上がり」がありえないと誰が断言できるだろうか)。それが僅少でなく経営に影響を与えると判断されれば,店員ではなくマニュアルが問題視され,改訂されるはずである。そうして,経営資源の許す範囲でサービス品質が向上してゆく。このような仕事の背景を抜きにしてこの店員を「マニュアル人間」とバカにしているほうが,仕事の質を属人的な「機転」にフォーカスすることで人に依存した仕事のムラを許容することにつながり,じつは進歩を生まないのだ。

いまのこのご時世,気が利かない,仕事のできない若者ばかりで困る,と嘆くオジサンも多いのではないだろうか(件のブログ主と同様に)。それはその若者が「マニュアル人間」だからではない。逆に,その若者がマニュアルを読みもせず,多寡の知れた己の経験・才能に頼むか自分勝手な思い込みで仕事をしているだけだからである。だいたいそんな愚痴をこぼすこのオジサン自身,きちんと若者を指導しているか怪しいものである。「仕事の技は先輩から盗むものだ」なんてカッコつけているに決まっている(「技は秘められたもの」などと己を神秘的に見せたがる,考えの古い寿司屋は,機械握りのクルクル寿司チェーン店によって間違いなく絶滅させられるはめになる)。

仕事で必要なのは天才ではない。マニュアルに書かれたことを必要なときに運用して確実に遂行できる人間である。普通の技術者なら3日かかる仕事を超絶技巧で10分でやってしまうウン万人にひとりの天才よりも,文書で習得した知識をもとにその仕事には3日かかると見積りができ,仕事の計画・設計ができ,3日で確実に目標品質でそれを果たせる者が必要である。仕事で大事なのは,期待・スリリングよりも確実さだからである。個性でうまく事をなす者よりも,実務の具体的経験から準拠すべき文書の問題点を指摘・改善して組織に伝えることのできる者が必要である。この場合,そういう人間を育てることが出来るからである。それが「技術」というものである(世の中には「技術」を「超絶技巧」と勘違いしている者がいるから質が悪い)。「技術」は退屈極まりないものなのだ。

「なぜか機転の利く仕事のできる奴」よりも「書かれた通りに確実にやる奴」のほうが絶対にありがたい。たまに天才的なひらめきで凄い仕事を100に1回やってのける者より,一生懸命マニュアルを勉強しつつもなかなか身に付かないが,100に99回同じ成果をあげ,確実に成長するマニュアル人間のほうが,社会人らしくて私は大好きである。仕事は芸術ではないのだ。

『地獄少女』ロシア語吹替え版(といっても,日本語にかぶせてナレーターがロシア語で通訳するような形態なのだけど)をロシアのアニメサイトで観た。ロシア語タイトルは "Адская девочка" あるいは "Девочка из Ада" であった。今日は『地獄少女』のロシア語ネタ。

「恨み,聞き届けたり」という古風な台詞は,"Месть будет исполнена(復讐は果たされることになる)" と訳されていた。文法的に原語の完了形ではなく未来時制なのが面白い。要するに,日本語の意味する復讐の契約が成立したことではなく,確実に恨みが晴らされることに主眼がある翻訳になっていて,ロシア人の単刀直入な国民性がこういうところにも現われているのである。「先生」,「先輩」という呼びかけが日本語のままで使われていた。日本アニメ浸透の様子が窺われて興味深かった。日本語の「ケバい」を "вызывающе" と,きくりのようなおチビちゃんな女の子のことを "малявка" と言うようだ。

閻魔あい定番のあの地獄落としの台詞と,その吹替えでのロシア語テクストをあげておく。ロシア語訳も,弱強格韻律で書かれ,かつ тьмой -- тобой,смрада -- ада という具合に脚韻を踏んでおり,日本語の七五調文語を移植したらしく,詩的テクストになっている。こんなのを暗唱してロシア語に親しむというのは,縁起が悪いのでやめたほうがよい。罰が当たっても知りません。

闇に惑いし哀れな影よ      О жалкий дух, ты породнился с тьмой,
人を傷つけ貶めて  Жестоко жизнь других отравлена тобой
罪に溺れし業の魂  Душа твоя полна грехов и смрада...
一遍,死んでみる?  Падешь на веки ты в глубины ада!

ちなみに「人を呪わば穴二つ」は,"Мстишь — копаешь сразу две могилы..." (恨みはいちどに二つの墓を穿つ)と訳されていた。手元にある『ロシア語ことわざ集』では,この日本の諺は "Не рой яму другому, сам в нее попадаешь (упадешь)."(他人に対して穴を掘るなかれ,自らがそれに落ち込むことになる)というロシア語になっていた(『日英仏対照 ロシア語ことわざ集』吉岡正敞編著,駿河台出版社,1986 年,87 頁)。穴に自分が落ちるというよりも,"Адская девочка" の言のほうが怖い。

あなたの恨み,晴らします。Мы отомстим за вас.
 

2009 体育祭

|

今日,息子の学校の体育祭だった。これで高校最後の大会だということもあり,私はどうしても外せない会議を終わらせたあと,仕事を早退して途中から参観した。心配された雨も降らず,幸いだった。場所は大井町のスポーツの森陸上競技場。東京モノレール・大井競馬場前駅から徒歩数分であった。

羽田空港を飛び立つジェット機が競技場の向こうをひきもきらず旋回していた。海の臭いがした。たとえ人工的な東京のベイエリアでも,体育祭の喧噪と潮風は郷愁をそそるものである。体育委員長の役目を負った息子は,壇上から大声で全校生徒を指揮していた。やるじゃんか。私とはまるで違って,体育会系の気質にどっぷり浸っているのだ。

2009-taiikusai.jpg

日本アニメ好きのイスラエル人がネットで書いていたのを思い出した。曰く「俺の国では空からロケット弾が飛んで来るのに,日本では空からいろんな女の子が降って来る」。また別のイスラエル人の曰く「日本では,水と安全と moe が,タダ同然と聞いていたが本当らしいな。こっちでは考えられん」。ソドムとゴモラの街のように神の劫火によって世界が焼き尽くされるかも知れない,一抹の終末の予感。そんななかで,幸いにも,活発な少年・少女の gymnastics を,とりあえずはまだ眺めていられる。

虛空より美少女たちの降り來たり濕り濕れる賴もしき梅雨。

* * *

Mac OS X Safari 4.0 beta が評判になっているので,インストールしてみた。Safari はシンプルかつ洗練されたデザインと美しい描画で私の愛用のブラウザである。一方でつまらないバグの多い,困ったアプリでもある。4.0 では JavaScript を劇的に高速化したとの話である。確かに少し軽快になった感じがする。タブを開いたときに現われる Top Sites は履歴からスナップショットを一覧してくれて,私はおっと驚いた。

Utf82TeX 問題訂正

|

昨日,セダコヴァの著書の引用で教会スラヴ語を組版するのに Utf82TeX を使用したところ,バグを見つけた。

アーカイブそのものを修正すべきなんだろうけど,面倒なので本体訂正版だけ utf82tex-090613.zip としてサイトに置いた。ユーザの方は古い版をこれに差換えていただきたい。もちろん OldSlav 教会スラヴ語を使用しない場合はその必要はない。misima の TeX 変換の同様処理についても訂正済みである。

upLaTeX を使うようになったいま,たいていの欧文を UTF-8 で直接 TeX 原稿に記述できるので,Utf82TeX をほとんど使わない。教会スラヴ語,ギリシア語を用いるときくらいである(タイ語についても,upLaTeX ではまだ直接入力はダメで,Utf82TeX があると便利だと思う)。ほとんど存在意義を喪失しており,もうメンテナンスの必要性をまったく感じなくなってしまった。

鳩山邦夫総務相が「正しいことを貫く」だのなんだの宣わって辞任した。郵政のトップ人事における意見の相違を理由に,大臣の役職を蹴ってよいものなのだろうか。国政を舐めていやしないか。北朝鮮に対する強い国連制裁決議を導き出し,株価も一万円台を回復しようかという — 政策の効果が現われはじめた — いま,政策・政権の安定化を果たすべきときに,選挙を目前に控えて,このざまである。腹の煮えくり返った麻生総理の談話が印象的であった。選挙を睨んだ正義の演技者,この偽善者,裏切者をどうしてくれようか。私が権力者ならこの裏切者を徹底的に「X正」するだろう。麻生総理は「自民党総裁」,「内閣総理大臣」という地位がいかに恐るべきものであるのか,国政を軽んずるこの括弧付き英雄に思い知らせてやればよい。

* * *

今日,娘のピアノ練習に付き合った。先日その楽譜を買ってやった吉松隆の『プレイアデス舞曲集』から,「過去形のロマンス」を弾いてくれた。ピアノ教室でのいまの課題曲は,モーツァルトのピアノソナタ・ハ長調 K.545,バッハの前奏曲とフーガ・ロ短調 BWV 869 なんだそうである。後者はバッハ作品のなかで私のもっとも好きな曲であり,娘はそれで選んだらしい。どちらも,まだまだのでき。

オリガ・セダコヴァ Ольга Александровна Седакова の著した教会スラヴ語辞典を Ozon から入手した。原題は «Словарь трудных слов из богослужения. — церковнославяно-русские паронимы» М., 2008.(『正教会典礼文献の難語辞典 — 教会スラヴ・ロシア同語源語』)。本書は,現代ロシア語と同義のようにみえて意味の異なる教会スラヴ語単語の辞典である。日本語でも古語の「をかし」と現代語の「おかしい」とでは意味が違う。そういう異義語を解説した辞典と考えてもらえばよい。

セダコヴァはなにより詩人,西欧文学翻訳家として高名である。一方,モスクワ大学のスラヴ文献学研究科を終えた学者でもあり,このような教会スラヴ語関連の学術的著作もなしている。

本書では,教会スラヴ語に対応するギリシア語が併記されている。西欧語がラテン語から多くの語彙を相続しているとすれば,ロシア語にとってその関係にあるのはギリシア語だからである。キリル文字そのものがギリシア文字を範としているのだ。

黄土色のクロス・ハードカバー装丁は,私の好きなタイプの本。教会スラヴ語のクラシックなフォントが美しい。その引用を LaTeX(upLaTeX)で組版してみた。教会スラヴ語は SlavTeX フォント,ロシア語,ギリシア語はそれぞれ LH フォント,CB フォントのコンピュータ・モダン書体を使用した。LaTeX 原稿 sedakova_slovar_cite.tex組版結果 PDF sedakova_slovar_cite.pdf も置いておく。

sedakova_slovar54.jpg

sedakova_slovar.jpg

『地獄少女』

|

TSUTAYA のレンタル DVD で『地獄少女』を鑑賞。地獄少女プロジェクト原作,アニプレックス,スカパー・ウェルシンク制作によるミステリー・ホラー・アニメである。

深夜0時のみアクセス可能なインターネットサイト「地獄通信」に,恨みを晴らしたい対象の人物の名を書き込み,地獄少女から与えられた藁人形の糸を解くと,対象人物が直ちに地獄に送られる,という恨み晴らし物である。一話の主要登場人物(いじめなどで恨みを抱く者)は多く中学・高校生であり,インターネットという現代性と相まって,この時代の十代の若者の心の闇がテーマになっているといえる。

勧善懲悪に徹した「必殺シリーズ」とは趣が違っていて,この作品では依頼者も死して地獄を彷徨う,代償を伴った「人を呪わば穴ふたつ」のモチーフが,ストーリーにひねりを効かせている。この物語構造は,恨む者,恨まれる者の関係が一義的ではなく,闇雲に人を呪詛することの孕む当人の愚かさ,子供じみた性格を浮き彫りにする反転ストーリーをも導き出していて,面白い。

でも,それはそれとして。私には,主人公の地獄少女・閻魔あいの華麗な花柄の黒い着物や,禊とそれに続く着替え,真っ赤な瞳,彼岸花の群生(少年のころの,墓場に燃える曼珠沙華を思い出した),冥途の河渡りの精霊流しなどの伝奇的・幻想的絵が,私の酷愛する江戸川乱歩の頽廃趣味,大正ロマンに充ちていて,なんともいえないのである。ここには竹久夢二などの美人画の確かな伝統がある。オープニングに挿入された河鍋暁斎の地獄絵図が,和風ホラーのアナクロニスティックな古典的趣を作品の現代性に添えている。この際,黒衣の美少女と彼岸花という季節感と,物語との整合性の瑕疵など,私にはどうでもよい。そういう意味では,私にはエンディングテーマ『かりぬい』の絵だけで十分なのかも知れない。オープニングテーマの「いつか光にむかう 逆さまの蝶」なんて詞も詩的ではないか。ただし,一目連,骨女,輪入道といったサブキャラクターどものヤクザ風情(「お嬢」はねえだろ)が,どうしようもなく恐怖感の品を落としてしまっているんだけど。

恨み晴らします。通俗の極みである。でも,必殺シリーズともども,私はかかる型に嵌ったドラマが大好きなんである。ワンパターンであるからこそ堪らないのだ。
 

地獄少女 5 [DVD]
アニプレックス (2006-05-24)
 

付記:YouTube に『地獄少女』エンディングテーマである『かりぬい』がアップされていた。おお,これだけで充分。エンベッドしておきます。ブルーの彼岸花,菊,紅葉,蜘蛛の糸,黄泉の河,黒い小袖のヒロインなど,幻想的な日本美を堪能いただきたい。
 

misima.html

| | コメント(6)

misima 旧仮名遣い・旧字変換支援ソフトウェアをようやく復旧した。ドライブする HTML をちょっと古いバックアップから戻して,最新版に手直ししたつもりだけど,完全ではないかも知れない。プログラムそのものはまったく無傷だったので,デグレードはない。復旧ついでに,ウ音便変換バグ訂正,旧仮名遣い辞書訂正もした。

「このミス」2009 年度海外編第 1 位!ということと,ソ連の猟奇殺人を扱ったミステリーということで,読んだ。作者は弱冠 29 歳の新生という。読み応えのある作品だった。

密告と粛正に明け暮れた,スターリンの恐怖政治時代の,誰も信用できないソ連社会が舞台である。政府への批判めいた発言や権力者の気まぐれでいとも簡単に逮捕され,銃殺されてしまう一方で,残虐な殺人事件が「このよき社会に起こるはずがない」としてなおざりに扱われる皮肉。権力側・特権階級にいた主人公レオは,些細なミスと私怨により地方警察の巡査に左遷され,秘密警察に追いつめられながら,少年・少女の連続惨殺事件の真実を追う。

読みどころは秘密警察からのスリリングな逃避行,子供の胃を持ち去るという連続猟奇殺人の謎解き,ロシアの凍てつく雪原の寓話的恐怖といったエンターテーメントだけではない。この作品の感動は,ソ連の風俗に忠実に則りながら,個人と国家,個人と社会,社会と国家という問題論をミステリーに組込んだところにあると思う。主人公は,脱獄囚と知りつつその目的を理解した村人たちに匿われ助けられたり,仲間をレオに殺されながらも官憲に対して口を割ることを潔しとしない囚人ヤクザに救われたりする。この筋書きには,ロシア独特の仁義のリアリティがある。個人が国家に押しつぶされ個の人間的感情を喪失しそうになりながらも,もう一方で,国家とは一線を画す社会・共同体によって人間が生かされている,そういう姿をうまく描いている。

なぜ,そこまでして真犯人を探すのか? それを駆り立てるものこそが作品のテーマであり,その了解こそが大団円のカタルシスである。上・下2冊,一気に読ませるんである。

大事なことをもうひとつ。本書はロシアで発禁となったそうである。このことこそが,ここで描かれた世界のリアリティ,ロシア人にしか想像できない,記憶に生々しく残る悪夢の真実らしさを物語っている。勲章ものである。

チャイルド44 上巻 (新潮文庫)チャイルド44 下巻 (新潮文庫)
 
トム・ロブ・スミス著,田口俊樹訳
新潮社
トム・ロブ・スミス著,田口俊樹訳
新潮社

歌野晶午『死体を買う男』

|

作品のなかに作品があり,その間の虚実のゆれをミステリーに仕立てた佳品。萩原朔太郎がホームズ,江戸川乱歩がワトソンの役回りで登場するのがお茶目である。どうせなら,作中小説は乱歩調を徹底し,表記を旧字旧仮名遣いとし,大正的情調の細部で堪能させてほしかった。そういう点で,私は京極夏彦に軍配をあげる。

過度の凄惨,不潔,醜怪の果てに現われる諧謔というのか。面白い短編集である。全8編からなる。表題作は道路地図帖の独白という形で父子2代の犯罪を語る。地図帖を「ユニバーサル横メルカトル」という名前にする珍奇な発想。

私は『Ωの聖餐』がとくに面白かった。ひとの脳髄を食うことにより知識を蓄えるオメガ。身動きできないほど肥大化したため糞尿を垂れ流し,不潔な環境のために湧いた細菌により手足が腐り,チェーンソーで足を切り落とされるオメガ。彼の世話役で数学者の「俺」は,数学の難問「リーマン予想」を解いたという友人をオメガに食わせて,その証明を語らせ,フィールズ賞を手にしようとする。ところが,それは「リーマン予想」を前提とした「ゴールドバッハの予想」でしかなかった。死ぬ直前のオメガの独白は抒情的である。

今,私の前には眩しいばかりの陽光と幼い頃食べた母のマドレーヌの感触がある。いや,それは感触というようなおぼろげなものではない。皮膚が,脳裏が確信をもって私にそれを与えてくれている。不思議だ。養蜂家の記憶と必ずしもリンクするものではないはずなのに ...... 彼の記憶が触媒となって,私は幼い頃の家にいる。母と父の蜂蜜に汚れた衣服の香り,黄金に輝くサフランの畑が見える。
平山夢明『Ωの聖餐』—『独白するユニバーサル横メルカトル』所収 光文社文庫,2009年,81頁。

ここでは,カニバリズムも,糞尿も,壊死した右下腿も,チェーンソーによるぶった斬りも,プルーストも,『エウロペオ・アメリカーナ』も,ベートーヴェンも,グレゴリオ聖歌も,フェルマーの最終定理も,チンピラも,養蜂家も,皆,フラットな配置をされている。机上の知的営為というものの強烈な寓話である。
 

葛原妙子歌集

|

歌集などの編集を生業とする妻が,川野里子著『幻想の重量 葛原妙子の戦後短歌』(本阿弥書店,2009年)を会社から入手して来た。葛原妙子という昭和の個性的な女流歌人を軸に戦後短歌の潮流を素描した,なかなか気迫のある本である。私はそれを斜め読みし,葛原妙子の歌集を少し読みたくなった。国文社,現代歌人文庫から出ている,中井英夫撰による『葛原妙子歌集』を取り寄せた。

「幻視の女王」(塚本邦雄),「球体の幻視者」(中井英夫)といった葛原妙子評は,捨て去ってよいと私は思う。これはいまやなんの誉め言葉でもない。「呪われた詩人」だとか「ミュータント」だとか「幻視者」だとかの評言は,「知的な」文学者に対して着いて廻る,まあ,昔から流行の符牒でしかない。「異端の文学」こそ,通俗的な趣味の現われである。「幻視」,「幻想」なんてものは,想像力というどんな文学であれそれを文学となす原理的要素なのだから。

葛原には溟溟神韻たる黒衣のうたびとといった気品がある。いい歌だあ,と思ったものをいくつか引用しておく。戦争を潜り抜けて来た歌人は偉かった。

月蝕をみたりと思ふ みごもれる農婦つぶらなる葡萄を摘むに(24頁)
懷胎女葡萄を洗ふ半身の重きかも水中の如き暗きかも(56頁)
原不安と謂ふはなになる 赤色の葡萄液充つるタンクのたぐひか(25頁)
海の邊の明るき時計店に入りしより古りしカリエスの傷いたみいず(34頁)
點血を眼鏡の端に置きつつまどろむ外科醫ふいにめひらく(43頁)
ゲッセマネの蛾は重からん 美しき石材の家に羽搏きて(76頁)
マリヤの胸にくれなゐの乳頭を點じたるかなしみふかき繪を去りかねつ(105頁)
葛原妙子著,中井英夫撰『葛原妙子歌集』国文社,現代歌人文庫,1986 年。
 

kuzuhara-kashu.jpg

misima 関連復旧

|

先日壊してしまった Web 環境の復旧がほぼ完了した。misima 関連コンテンツも一部を除きファイルを再登録した。バックアップデータと最新バージョンの整合性を確認するのに手間取ってしまった。misima.html はまだですが,とりあえず misimaservlet/​misima.html もしくは misima SOAP Web-Service をお使いください。

BSD で動作するロシア語形態素解析ソフトウェアをかねてから探していた。二つの目的がある。ひとつは,プーシキンのコンコーダンス・プログラムの単語集計において,現行の出現形ではなく lemmatized な見出語でまとめること。いまひとつは,現時点の私の関心事であるロシア語旧正字法について,misima のような新・旧正字法変換のプログラムを書くこと。ロシア語旧正字法も語彙に依存する複雑な特性をもっており,そのためには misima 旧仮名遣い変換における「茶筌」と同じように,ロシア語形態素解析器が必要なのである。さらにその正字法変換ツールの用途としては,LaTeX T2D 旧正字法ロシア語用ハイフネーションパターンの作成を考えている。ここまで成せば,ロシア人にも果たせなかった LaTeX contribution となるはずだ。

FreeBSD russian ports にはそれらしいのが見当たらなかった。"Russian tagset and Russian statistical taggers" サイト(Serge Sharoff 氏による)によれば,インターネットリソースには TreeTagger, SVMTagger などのいわゆる tagger プログラムがいくつか公開されている。でも,残念ながら,私の愛用する FreeBSD,Mac OS X においてコマンドラインから使用できるツールがなかったのである。

ところが昨日,ロシアのサイトを探し回っていて lemmatizer(http://www.aot.ru/)を見つけた。ウクライナ・キエフ大学の Алексей Сокирко(アレクセイ・ソキルコ)によるプログラムである。このサイトでは,Graphematics 書記素解析ツール GraphmatThick,Syntax 統辞解析ツール TestSynan も公開されていて,私はしばらく勉強させてもらおうと思っているところである。lemmatizer は外部データを切り替えることで英語,ロシア語,ドイツ語の解析が可能な形態素解析ツールである。ライブラリとして使用することを主たる目的に書かれたものだが,TestLem という簡易試験ツールも添付している。ロシア語については,かの有名なザリズニャクの文法辞書の考え方に準拠している。Windows 及び Linux 用のアーカイブが用意されている。FreeBSD にもじつは textproc 分類で ports が存在することも判明。そこで早速 FreeBSD と Mac OS X Tiger にインストールしてみた。それぞれ,動作させるのにかなり苦労した。このソフトについて紹介・説明している日本語サイトは皆無のようである。通常の手順では組込みできないので,ここでインストール手順と使い方とを紹介する。

【FreeBSD インストール】

ports が用意されているが,通常の make install clean 発行だけではダメである(ports のバグなのか,説明が足りないのか)。スーパーユーザ権限で以下のオペレーションによってインストールする。これにより,ロシア語,英語,ドイツ語の形態素解析辞書も同時にインストールされる。

# cd /usr/ports/textproc/lemmatizer2
# make
# make install generatemorph installmorph
# cd /var/db/lemmatizer/Dicts/Morph
# chmod a+rx Eng Ger Rus

FreeBSD では lemmatizer の付属プログラムを使用するに先立って,環境変数 RML に辞書の組込みディレクトリ名をセットしておく。.tcshrc にも記述しておくとよい。

% setenv RML /var/db/lemmatizer

【Mac OS X インストール】

Mac OS X については lemmatizer 本体とロシア語辞書のみのインストール方法に留める。もちろん,英語,ドイツ語用の辞書も取り寄せて組込むことができる。詳細は Docs/Morph_UNIX.txt に記載されている。

  1. インストールするディレクトリ(ここでは $HOME/pkg/lemmatizer とする)を作成し,そこに http://www.aot.ru/download.php から lemmatizer.tar.gz と rus-src-morph.tar.gz をダウンロード格納する。
  2. lemmatizer は PCRE(Perl Compatible Regular Expressions)ライブラリを使用する。http://www.pcre.org/ からアーカイブをダウンロードし,これをインストールする。展開したディレクトリにおいて,./configure, make, make install とごく一般的な手順で組込むことができるが,UTF-8 でも使う可能性があるなら configure のオプションに "--enable-utf8 --enable-unicode-properties" を追加してビルドすることをお勧めする(FreeBSD ports は UTF-8 オプション付きで自動的に組込まれる)。
  3. % ./configure --enable-utf8 --enable-unicode-properties
    % make
    % sudo make install
    

  4. 環境変数をセットする。これはインストールのみならず,lemmatizer 利用の際にも必要である。
  5. % setenv RML /Users/isao/pkg/lemmatizer
    % setenv RML_PCRE_LIB /usr/local/lib
    % setenv RML_RCRE_INCLUDE /usr/local/include
    

  6. lemmatizer の C++ コンパイル,リンク用インストーラに定義されたオプションは,そのままでは Mac OS X Tiger ではエラーとなるので,次にこれに訂正を施す。Source/common/common_exe_mak ファイルを以下のように書き換える。
  7. 〔前〕:

    libs_argument := -Wl,--start-group $(pcre_libs) $(subst .$(lib_ext),,$(lib_pathes)) -Wl,--end-group
     
    ifeq ($(libmode), static)
        lib_mode_switch := -static
    endif
    

    〔後〕: -Wl,--start(end)-group, -static オプションを削除

    libs_argument :=  $(pcre_libs) $(subst .$(lib_ext),,$(lib_pathes))
     
    #ifeq ($(libmode), static)
    #    lib_mode_switch := -static
    #endif
    
  8. コンパイル,リンク,辞書生成をスクリプトによって実行する。
  9. % ./compile_morph.sh
    % ./generate_morph_bin.sh Russian
    

  10. $HOME/pkg/lemmatizer/Bin にパスを通しておく。

【使い方】

lemmatizer 付属の TestLem は,lemmatizer ライブラリを用いたテストプログラムである。これで手軽にロシア語テキストの形態素解析を行うことができる。ただし,解析対象ロシア語テキストファイルの作成に際しては,以下の2点に注意する。

  1. ロシア語は Windows cp1251 エンコードで記述する。iconv などのコード変換プログラムを用いて UTF-8 などから変換すればよい。Emacs なら以下のコードを .emacs に記述すれば,cp1251 キリルエンコーディングを直接扱うことができるようになる。
  2. (codepage-setup 1251)
    (define-coding-system-alias 'windows-1251 'cp1251)
    

  3. 1行1単語の形にしておく。このため,通常のテキストファイルを扱う場合は,適当な tokenizer ツールを用いて前処理する形態となるだろう。

試しに,次のようなテキストファイル r.txt を準備するとしよう。

Я
люблю
вас
,
Надя
!

これをコマンドラインにおいて TestLem プログラムで処理する。

% TestLem Russian r.txt
Loading..
read r.txt
process r.txt
Count of words = 6
Time = 0 seconds; 0 ticks
too few words to measure the speed
writing to r.lem

Russian という第一引数はロシア語形態素辞書を指示するものである。English,German とすれば,それぞれ英語,ドイツ語の形態素解析が可能である。ファイル名(r.txt)を省略すると標準入力からテキストを読む。処理結果は,この場合 r.lem というファイル名で生成される。その出力は次のようなものである。

Я -> Я ча#
ЛЮБЛЮ -> ЛЮБИТЬ кб#
ВАС -> ВЫ чучхчч#
, -> , яя#
НАДЯ -> НАДЯ до#
! -> ! яя#

出力結果例においては,ЛЮБЛЮЛЮБИТЬ という不定形をもつ動詞で,一人称・単数・現在形であるということが,"ЛЮБИТЬ кб#" という形式で示されている。"ВЫ чучхчч" は,ВАС という出現形が二人称複数代名詞 ВЫ の生格,対格もしくは前置格であることを示す。このように,文法解析結果は "->" の先に「見出語 xx..#」で示され,文法構造は "кб","чу","до" など二文字からなるニモニックの組合せで示される。語として複数解がある場合は "xx...#" が複数出力される。こうして,語の出現形の lemmatize された見出語と文法構造が得られるのである。コンコーダンスにおいて見出語で出現度数を分析する等の処理が可能となる。

ロシア語文法構造ニモニック,文法略号の意味は Dicts/Morph/rgramtab.tab 及び http://www.aot.ru/technology.html に解説がある。詳細はそちらを参照。

先日「OldFonts 古ロシア語フォント集成」について書いた。そのときは Adobe Minion と Palatino Linotype のインストールには触れなかった。今日はこの2フォントの追加インストールと,upLaTeX で組版し,dvipdfmx で日本語混在の PDF を作成する概略を示す。

【Minion, Palatino フォントの設定】

  1. OldFonts パッケージは Adobe Minion と Palatino Linotype のフォントを添付していない。これは権利問題のためである。OldFonts の INSTALL ドキュメントによれば,Adobe Minion Pro は Adobe Reader に添付されている OpenType フォント(MinionPro-Regular.otf など4書体),Palatino Linotype は Windows XP/Vista に添付されている TrueType フォント(pala.ttf など4書体)を想定している。システムにこれらフォントファイルが存在していれば,TeX システムから参照できるよう TDS フォントツリーに適切なシンボリックリンクを設定する。
  2. OldFonts パッケージで組んだ dvi 中の Minion, Palatino フォントを dvips で処理するための map 及び enc ファイルが Mariusz Wodzicki 教授によって提供されている(ドミートリエフ教授のサイトにある pala-enc.tar.gz)。しかしながら,dvipdfmx で使うためには,別途 map を準備する必要がある。また Wodzicki 教授の enc ファイルだと,dvipdfmx ではコンマやピリオドなどの記号が拾えず(原因不明),ロシア文字以外を既存の enc ファイルから移植してこれを訂正する必要があった。私が作成したこれらのファイル: oldfonts-dvipdfmx.map, t2a-pala-iy.enc, t2d-pala-iy.enc をこのリンクからダウンロードして,TeX ツリーに格納し,さらにマップファイル登録をして欲しい。oldfonts-dvipdfmx.map については,updmap-sys で登録するのではなく,dvipdfmx.cfg に "f oldfonts-dvipdfmx.map" という行を追加してもよい。
  3. % ls
    oldfonts-dvipdfmx.map    t2a-pala-iy.enc   t2d-pala-iy.enc
    % su -m
    # mkdir -p $TEXDIR/fonts/map/dvipdfmx/oldfonts/
    # mkdir -p $TEXDIR/fonts/enc/dvips/oldfonts/
    # cp oldfonts-dvipdfmx.map $TEXDIR/fonts/map/dvipdfmx/oldfonts/
    # cp t2a-pala-iy.enc $TEXDIR/fonts/enc/dvips/oldfonts/
    # cp t2d-pala-iy.enc $TEXDIR/fonts/enc/dvips/oldfonts/
    # mktexlsr
    # updmap-sys --enable Map=oldfonts-dvipdfmx.map 
    

【OldFonts 使い方】

ロシア語旧正字法テキストをタイプセットするには,TeX のフォントエンコーディングは T2D を使用しなければならない。t2denc.def がシステムに組込まれている必要がある。もしなければ,ドミートリエフ教授のサイト等から入手して,TeX ツリーに格納しておく。

upLaTeX を用いると,旧正字法ロシア語テキストをそのまま原稿に記述することができる。革命前の旧正書法の文字 ѣ (ять ヤッチ), ѵ (ижица イージツァ), ѳ (фита フィター), і (и с точкой イー・ス・トーチコイ) を直接タイプできるのである。ただし,そのためには Dominique Unruh 氏による unicode パッケージ(Unicode support for LaTeX)に含まれる utf8x.def ファイルが必要である。LaTeX 標準の utf8.def では T2D 古ロシア文字が処理できない。

upLaTeX でキリル文字を組版するときは,\kcatcode`б=15 をプリアンブルで指定しておく。これによりキリル文字テキストが欧文として扱われるようになる。

OldFonts の各ファミリーを使用するためのスタイル,[ファミリー名] は以下のとおり。

- Академическая (Academy Old): AcademyOld, [fao]
- Академическая Узкая (Academy Old Narrow): AcademyOldN, [fan]
- Елизаветинская (Elizavet): Elizavet, [fez]
- Елизаветинская Узкая (Elizavet Narrow): ElizavetN, [fen]
- Литературная (Latin): Latin, [flt]
- Литературная Узкая (Latin Narrow): LatinN, [fln]
- Обыкновенная новая (New Standard): NewStandard, [fns]
- Обыкновенная новая Узкая (New Standard Narrow): NewStandardN, [fnn]
- ПТ-Курьер (CourierRO): CourierRO, [tcr]
- Миньон (Minion Pro): Minion, [pmn]
- Палатино (Palatino Linotype): Palatino, [pmn]
- Древнерусский (Drevnerusskij): Drevnerus, [fdr]
- Пушкин (Pushkin): Pushkin, [tpk]
例えば Академическая フォントファミリー fao を使う場合は,AcademyOld.sty を読込んでおき,\usefont 命令でフォント切替えを行う。
\usepackage[T2D]{fontenc}%フォントエンコーディング
\usepackage[utf8x]{inputenc}% unicode utf8x を使用
\usepackage{AcademyOld}% Академическая (Academy Old)
\begin{document}
\fontencoding{T2D}\selectfont% T2D 切替え
...
\usefont{T2D}{fao}{m}{n}% ファミリー切替え
Пушкинъ ...

ただし,unicode utf8x.def を用いて直接旧正字法ロシア文字でテキストを作成し,T2D フォントエンコーディングでタイプセットするとき,注意事項がある。utf8x.def は古ロシア語文字 і(U+0456)を \cyrii 命令(T2A で定義されているウクライナ文字)に展開するが,T2D ではこの文字は \cyrii ではなく \cyrizhe で定義されているため,エラーとなってしまうのである。このため,T2D フォントエンコーディングが選択されている場合は,\cyrii\cyrizhe として処理するよう,以下のような互換命令をプリアンブルで定義しておく。

\makeatletter%
\def\@td{T2D}%
\let\CYRIItmp=\CYRII%
\let\cyriitmp=\cyrii%
\def\cyrii{\ifx\cf@encoding\@td\cyrizhe\else\cyriitmp\fi}% lower case
\def\CYRII{\ifx\cf@encoding\@td\CYRIZHE\else\CYRIItmp\fi}% upper case
\makeatother%

【タイプセット試験】

すべてのファミリーを使うタイプセット例を示す。ただし,ノーマル立体のみの例であって,斜体,スモールキャピタルなどの書体は例示していない。各自,適宜試していただきたい。比較の参考として Babel 標準の LH フォントによる出力例も付加してある(LH T2D Type1 フォントについては「LH キリル T2D/OT2 Type1 フォント集」を参照)。以下のような LaTeX 原稿 orj.tex を準備した。原稿は UTF-8 エンコーディングで記述しなければならない。

旧正字法で用いられる文字の入力をサポートする IME が必要である。私は Emacs 用のインプットメソッド Elisp をダウンロードサービスで公開している。「Emacs スラヴ語/古典ギリシア語汎用インプットメソッド」を参照。

% -*- coding: utf-8; -*-
%
%     OldFonts 試験
%     Примѣръ русской дореволюціонной орѳографіи
%     -- coded by isao yasuda, June 2, 2009.
%
\documentclass[b5paper,papersize,10pt,uplatex]{jsarticle}
\usepackage[T2D,T2A]{fontenc}
\usepackage[utf8x]{inputenc}% from the unicode package
\usepackage{AcademyOld, AcademyOldN}
\usepackage{NewStandard, NewStandardN}
\usepackage{Elizavet, ElizavetN}
\usepackage{Latin, LatinN}
\usepackage{CourierRO}
\usepackage{Palatino, Minion}
\usepackage{Drevnerus, Pushkin}
\pagestyle{empty}
\kcatcode`б=15% disable cjk for cyrillic by upLaTeX
\makeatletter%
% \cyrii 互換命令(T2D 選択時 \cyrizhe 機能)
% \CYRII\cyrii T2D compatible (they become \CYRIZHE\cyrizhe in T2D)
\def\@td{T2D}%
\let\CYRIItmp=\CYRII%
\let\cyriitmp=\cyrii%
\def\cyrii{\ifx\cf@encoding\@td\cyrizhe\else\cyriitmp\fi}%
\def\CYRII{\ifx\cf@encoding\@td\CYRIZHE\else\CYRIItmp\fi}%
% フォント切替え命令の定義 definitions for fonts switching
\def\aks{\usefont{\cf@encoding}{fao}{m}{n}}% Academy Old Standard
\def\akn{\usefont{\cf@encoding}{fan}{m}{n}}% Academy Old Narrow
\def\els{\usefont{\cf@encoding}{fez}{m}{n}}% Elizavet Standard
\def\eln{\usefont{\cf@encoding}{fen}{m}{n}}% Elizavet Narrow
\def\cre{\usefont{\cf@encoding}{tcr}{m}{n}}% CourierRO
\def\lts{\usefont{\cf@encoding}{flt}{m}{n}}% Latin Standard
\def\ltn{\usefont{\cf@encoding}{fln}{m}{n}}% Latin Narrow
\def\ons{\usefont{\cf@encoding}{fns}{m}{n}}% New Standard
\def\onn{\usefont{\cf@encoding}{fnn}{m}{n}}% New Standard Narrow
\def\drs{\usefont{\cf@encoding}{fdr}{m}{n}}% Archic Russain (map deffers)
\def\psk{\usefont{\cf@encoding}{tpk}{m}{n}}% Pushkin (some glyphs lacking)
\def\plt{\usefont{\cf@encoding}{lpl}{m}{n}}% Palatino (from Windows XP ttf)
\def\mno{\usefont{\cf@encoding}{pmn}{m}{n}}% Minion (from Adebe Reader otf)
\def\ldr{\usefont{\cf@encoding}{cmr}{m}{n}}% LH cmr (ldrm)
\makeatother%
\def\fnm#1{\makebox[22ex][l]{#1}}%
\begin{document}
% sample texts
\def\testtxt{Пушкинъ, свѣдѣніе, мѵро, Ѳедоръ Достоевскій}%
% sample texts for CourierRO
\def\testtxtc{Пушкинъ, свѣдѣнiе, мѵро, Ѳедоръ Достоевскiй}%
\noindent%
\large%
\textbf{{\aks OldFonts} ロシア語旧正字法試験}
 
\fontencoding{T2D}\selectfont%
\noindent%
\aks\textbf{Примѣръ русской дореволюціонной орѳографіи}
 
\vspace{1em}
\normalsize
\aks \fnm{Academy Old: }\aks\testtxt\par
\aks \fnm{Academy Old N: }\akn\testtxt\par
\aks \fnm{Elizavet: }\els\testtxt\par
\aks \fnm{ }(dvipdfmxでは{\aks і}のアキが不正。dvipsならOK)\par
\aks \fnm{Elizavet N: }\eln\testtxt\par
\aks \fnm{CourierRO: }\cre\testtxtc\par% і ない
\aks \fnm{ }({\aks і}ない,ラテン文字iで代用)\par
\aks \fnm{Latin: }\lts\testtxt\par
\aks \fnm{Latin N: }\ltn\testtxt\par
\aks \fnm{New Standard: }\ons\testtxt\par
\aks \fnm{New Standard N: }\onn\testtxt\par
\aks \fnm{Palatino: }\plt\testtxt\par
\aks \fnm{Minion: }\mno\testtxt\par
\aks \fnm{Drevnij: }\drs\testtxt\par
\aks \fnm{ }(フォントマップT2Dと異なる)\par 
\aks \fnm{Pushkin: }\psk\testtxt\par
\aks \fnm{ }({\aks і, ѵ, ѳ}ない)\par
\aks \fnm{LH cmr: }\ldr\testtxt\par
\end{document}

これを uplatex orj.tex で処理し,dvipdfmx -p b5 orj.dvi で PDF を生成する。その結果 PDF の画像を以下に示す。PDF も orj.pdf として掲載しておく。

ファミリーによっては旧正字法グリフの欠落がある。Elizavet では i のあとに不正なアキが入っている。原因は不明である。私の使用している dvipdfmx-20070409 が古いからかも知れない。xdvi, dvips, pdflatex では問題ない。

※ 2010.1.20 付記
最新の ptexlive-20091009 及び ptetex3-20090610 + uptex-0.28 に含まれる dvipdfmx では,ここで指摘した Elizavet の不正なアキは解消されていた。

oldfonts-test.jpg

Moon Calendar

Profile

ISAO YASUDA。システムエンジニア。神奈川県在住。昭和 30 年代を懐かしむオヤジ。ロシアに興味があります。
[more], [About our site]

Notice

この文書はフィクションであり,実在する個人,団体等とは一切関係ありません。

R-18 指定サイトです。そのうち「18 歳以上ですか」の認証を入れる予定です。

文書の記述内容は無保証です。不適切な表現があればコメントにてご指摘ください。

コメント,トラックバックは,現在,運用を停止しています。ご意見等ありましたら isao@yasuda.homeip.net 宛電子メールにてお願いします。

Links

About this archive

Entries at 2009年6月 in chronological order.

Previous: 2009年5月

Next: 2009年7月

Recent Entries in Main Index.
All Entries in Archive Index.

February 2012

Sun Mon Tue Wed Thu Fri Sat
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29      
Powered by Movable Type 4.1 blog counter