2007年3月アーカイブ

Mairus Wodzicki さんから,私が公開している LH T2D/OT2 Type1 フォント集に不足しているファミリーがあるとの指摘をいただいた.LH フォントパッケージに付属しているドキュメント t2d-fmap.tex を pdftex でタイプセットしてみるとたしかに ldci, ldoc, ldsc が PK フォントで組まれてしまい,不足が確認できた.

T2D のファミリーは T2A を参考にして拾い上げたのだが,T2D 独自のものがあったわけである.公開アーカイブを更新するとともに,Web 頁「LH キリル T2D/OT2 Type1 フォント集」も訂正した.

このところ本当に暖かくなって来た.今週,顧客先からの帰社途中,遊歩道に寄り道したりした.

桜や辛夷の花を写メで妻に送った.

kobusi_070328.jpg sakura_070329.jpg

Дмитрий Смирнов の勧めでロシアの文芸サイト Proza.ru に論文の要約を登録した.文章を公開すると,興味をもった読者が批評を付けてくれたりする.その文章を誰が読んでくれたかの履歴も参照できる.アップしたら,次の日にはもう Смирнов が激励のコメントを付けてくれて嬉しかった.興味のある方は Proza.ru の私の頁をご覧ください.

Озон より書籍二点が届く.ひとつは二巻本のチュッチェフの詩集.Ф. И. Тютчев, Лирика, М. "Наука", 1966. К. В. Пигарев 校訂になる文学遺産シリーズ版である.

もう一点は С. М. Львовский によるロシアの LaTeX 解説本.С. М. Львовский, Набор и верстка в системе LaTeX, 4-е изд., М.: МЦНМО, 2006. ロシアの LaTeX 事情を一部でも知りたくて注文した.第 4 版ということで,これはかなり定評ある書籍のようである.

当然,本書は LaTeX で組版されている.LaTeX 本としては珍しく,ハードカバー装丁である.非常に興味深いのは,本書の組版が 7 ビットキリルエンコーディング (KOI7) フォントである cmcyr を使用している点である.こういう情報自体が本書を買い求めた目的のひとつである.Львовский はどのようにして原稿を準備したのか知りたいものである.本書で紹介されているロシア語フォントの種類に目新しいものはなかったが,各フォントの特徴,来歴,権利問題についてきちんと書いてあり参考になった.

russian_latex_book.jpg

このところ毎日 Mairusz Wodzicki さんとロシア語ハイフネーションパターンについてメールのやりとりをしている.OT2 や T2D エンコーディングのロシア語旧正書法の TeX パターンファイルを作成したいとのこと.私にも協力してほしいという.彼はなんと, ispell ロシア語旧正書法(革命前のロシア語正書法)の辞書を公開している Serge Winitzki とも親交があり,ロシア語ハイフネーションパターンの制作者である А. Лебедев アレクサンドル・レーベジェフや ロシア語 LaTeX コントリビュータの代表者 В. Волович ヴラジーミル・ヴォローヴィチなどとも頻繁にコンタクトしているという.私になにができるかまったくわからないのだけど,興味津々ではある.

彼はカリフォルニア大学バークレイの数学の先生なので,私が BSD UNIX の伝統は現代のレジェンドだと書き送ったところ,BSD の開発者たちが vi や BSD UNIX を開発していたころの Evans Hall の様子や Bill Joy についての興味深い話を教えてくれた.かつては Solaris を使っていたが現在は Linux ユーザだというのも,BSD ゆかりの大学人であるだけいっそう面白かった.

Wodzicki さんはまた,ロシアの詩人,翻訳家である Ольга Седакова オリガ・セダコヴァの友人でもあり,その作品の熱烈なファンだという.まわりのバークレイの学者連は文学や詩をまったく解さず,寂しいという.欧米でもいまや理科の先生は芸術的教養にはあまり関心がないそうだ.私は Wodzicki さんのメールではじめて彼女の名を知ったのだが,かの高名な古代文学研究者 С. Аверинцев セルゲイ・アヴェリンツェフの薫陶を受けた才媛だそうで,これにも大いに興味をそそられ,Озон ですぐさま彼女の著書 "2 Путешествия" (『二つの旅』) を注文してしまった.

カリフォルニア大学バークレイ校数学科教授 Mariusz Wodzicki さんから,数あるロシア語ハイフネーションパターンをエンコーディングに応じて切替えるコードを含む russianb.ldf についてメールをいただいた.ロシアの CyrTeX-ru users group のメーリングリストで,Wodzicki さんの投稿に,私がボロボロのロシア語でコメントを付けたところ,個別にメールでご挨拶をくれたのである.そのお名前,お仕事をインターネットで検索してみると,ポーランドの方のようである.UC バークレイ校というと,かの UNIX 4-BSD の生みの親,計算機科学のメッカのような大学である.そんな名門で教壇に立つ外国人教授を想像して,ちょっと感動してしまった.

私も,ロシア語ハイフネーションパターンとフォントエンコーディングを切替えることのできる russianb.ldf を公開している.私のものは,\selectruencoding{OT2 | T2A} という新しいインターフェースを提供するものであるのに対し,Wodzicki さんの試みは,既存のコントロールシーケンス \cyrillicencoding に設定した値によってハイフネーションパターンを切替える,よりシンプルなものである.私の方法では \selectlanguage を一度発行すればその中で OT2 と T2A の切替が可能である.一方,\cyrillicencoding による方法ではセットし直すつど \selectlanguage を発行する必要があるが,既存のインターフェースを使い回しているため,LCY エンコーディングへの対応も可能になっている.さすが頭のよいひとの戦術は違うと感心してしまった.

関心のある方は CyrTeX-ru@vsu.ru Mailing List ArchiveMariusz Wodzicki さんの投稿を参照.russian.ldf.extended.zip がダウンロードできる.

| | コメント(0) | トラックバック(0)

このところ,夜中の三時まで仕事をし,朝から顧客との打ち合せという疲れる毎日でくたくたである.今朝,眠くて眠くて,ひいこら言いながら,中央線の日野駅に降り立ったときは,しかし,よい天気,朝のさわやかさにいい気持になった.顧客事業所に入ると工場の古びた壁面に沿って桜が咲いていた.

今日は上の子(中学校)と下の子(小学校)の卒業式だった.同じ日なので,妻が小学校,私が中学校というように,分担して出席.

校長先生が万葉集の「名のらさね」の歌を引いて,ことばと行い(こと)は古来同一のもので君たちもよく心得よ,との戒めの挨拶をした.なかなかのものだった.この先生,ちょっと有名な歌人でもあるが,かなりのお祖父さんでもあり,生徒からはホーンテッドマンションと呼ばれていた.

最後に「仰げば尊し」と「蛍の光」の斉唱.

いつしか年もすぎの戸を
あけてぞ今朝は別れ行く

日本人はこういう別れの発想が大好きなんである.これやこの行くも帰るも別れては知るも知らぬも逢坂の関(蝉丸).「すぎ」と「あけてぞ」が掛詞になっているのに今更のように気づいた.またもうひとつ,「今こそわかれめ」という文言が,実は「ほかならぬいまこのとき別れよう」という係り結びであるということに改めて気づいた.「分かれ目」ではないんである.

卒業式のあとは,御成門の東京プリンスホテルでの謝恩会.なんでこんな金ばっかりかかるところでやんの? 卒業生は元気で,うらやましくなってしまった.私は立食パーティで疲れるばかりであった.

MT の再構築時のサーバエラー("Premature end of script headers...")対策としては本来,メモリを増設するのが望ましい.しかし,オンボロ ThinkPad サーバに投資をするには懐が寂しすぎる.MT のEntriesPerRebuild 設定値を変えたりしてみても限界があるようである.

実記憶装置の増設はさしあたりペンディングとしても,仮想記憶を増やしておくのも手だてとしてあるわけで,FreeBSD Handbook に従ってスワップ領域を追加してみた.仮想記憶の容量は実記憶容量とのバランスを考えて設定しないと,ページングが頻発してパフォーマンスが低下する,いわゆるスラッシングを招く場合がある.そのあたりのリスクを受け容れるべきである.

FreeBSD 5.4 での拡張方法を整理しておく.ただし,この方法はバージョンに依存するので,4.X 系を使っている方は使えないことに注意.

まず追加するスワップ領域をディスク上に作成する./usr/swap0 として 256MB の容量とした.容量を変えたい場合は dd コマンド引数 count 回数値を MB 換算値に指定すればよい.次にファイルのパーミションを設定し,最後に mdconfigswapon コマンドを発行すれば有効になった.

# dd if=/dev/zero of=/usr/swap0 bs=1024k count=256
# chmod 0600 /usr/swap0
# mdconfig -a -t vnode -f /usr/swap0 -n 0 && swapon /dev/md0

pstat コマンドで確認する./dev/md0 が機能していることがわかる.

# pstat -s
Device          1K-blocks     Used    Avail Capacity
/dev/ad0s1b        393216   218864   174352    56%
/dev/md0           262144    38916   223228    15%
Total              655360   257780   397580    39%

リブートは不要である.しかし,システムを停止するとこの swapon 操作は無に帰するので,次回リブートしたときも活きるよう,/etc/rc.conf に以下の行を追加しておく.

swapfile="/usr/swap0"

カーネルコンフィグレーションファイルにおいて md 疑似デバイスが有効になっている必要がある.これは標準の GENERIC カーネルにも組込まれているので,あまり気にせずともよさそうである.カスタマイズしている方は,「device md」の行があるか確認し,なければ追加してカーネル再構築を行う.

MT の EntriesPerPrebuild 値をデフォルトの 40 に戻して,再構築してみたが問題なさそうである.

論文の投稿規定には一般に文字数(和文),語数(欧文)の制限が付く.自分の論文についてこれらを集計したいと思い,インターネットでツールを探索してみたが以外と少ない.あっても LaTeX で書いた論文を対象にすることは難しそうであった.考えてみれば,文字数,単語数とひとことで言ってもそのカウント基準は千差万別であり,汎用的なものを用意するのは現実的でないかも知れない.

Microsoft Word などのワードプロセッサは編集中文書の文字数を表示する機能を備えているけれども,数字や記号などどのレベルで集計しているのか,それをコントロールできるのか,その仕様がよくわからない.また,TeX 原稿テキストだとこの方法は意味がない.

そこで自作することに.とはいっても,大半は UNIX のテキストユーティリティを使い回すのが主体である,日本語対応 dvi2tty で dvi ファイルから抽出したテキストをネタにするところがポイントである.自前で書いたプログラムは,Perl 言語による簡単な単語・文字カウンタとキリル文字変換フィルタだけである.

LaTeX 原稿はノンブルや行番号などを出力するマークアップをしていたり,ロシア語などは dvi 上は必ずしも英字で埋め込まれるわけではないので,dvi2tty の出力テキストはそのままでは正確な単語数を把握するのに不都合がある.そのため事前に原稿を sed で書き換えて救ってやる必要があった.

参考までに単語・文字カウンタを掲載しておく.欧文は単語数,和文は文字数を集計する.UTF-8 テキストを前提としている.ちょっと乱暴だけど,Unicode コードポイント U+3000 以上の文字を和文として扱う仕様である.数字を単語として扱いたくない,などの必要があれば,事前に sed で数字を置換しておくなどの工夫をしておく.このプログラムそのものは LaTeX 専用というわけではない.

#!/usr/bin/perl
#  -*- coding: utf-8; mode: cperl; -*-
#  $Id: artclcount,v 1.6 2007/03/18 13:02:07 isao Exp $
#
#  artclcount: 論文の文字数と単語数を計算する
#
#             2007 (c), isao yasuda, All Rights Reserved.
#
#  USAGE
#  -----
#  artclcount [-p] < text
#    -p: 欧文句読点,括弧類 .:;,!?<>()[]'"`~_ をカウントしない.
#
#  CAUTION
#  -------
#  LaTeX dvi出力を処理する場合は,ノンブル,ヘッダ,注セパレータなども
#  すべて対象となる.これを外すには事前にページスタイル調整,sed 
#  による置換を行っておくこと.
#
use utf8;           # UTF-8 hundling
use Getopt::Std;    # コマンドライン引数処理
use File::Basename; # ファイル名の取得
binmode STDIN,  ":utf8";
binmode STDOUT, ":utf8";
binmode STDERR, ":utf8";
 
%opts = ('p' => 0); # p option: not include punctuations.
Getopt::Std::getopts('p', \%opts) || usage();
 
my($kcharsc,$charsc,$wordc,$numberc,$nonumberc,$charscall,$lno);
my($buffer1,$buffer2,$chr,$word,$pattern,$opattern);
 
$kcharsc=$charsc=$wordc=$numberc=$lno=0;
$pattern='[\.:;,!\?\<\>\(\)\[\]\'\"\`\~\_\s+]';
# 文字としてカウントしない記号のパターン
if ($opts{'p'}) {
    $opattern='[\.:;,!\?\<\>\(\)\[\]\'\"\`\~\_\s+]';
} else {
    $opattern='\s+';
}
while (<STDIN>) {
    # UTF-8 デコード,行末改行除去
    utf8::decode($_);
    $buffer1 = $_;
    chomp($buffer1);
    $buffer2 = "";
    # 漢字文字数カウント
    foreach $chr (split(//, $buffer1)) {
        if ($chr ge "\x{3000}") {
            $kcharsc++;
            $buffer2 .= " ";
        } else {
            $buffer2 .= $chr;
        }
    }
    # 欧文単語カウント(記号 .,:;!? は対象外)
    foreach $word (split(/$pattern/, $buffer2)) {
        if ($word) {
            $wordc++;
            # 数字要素カウント
            if ($word =~ /[0-9]+/) {
              $numberc++;
            }
        }
    }
    foreach $chr (split(//, $buffer2)) {
        $charsc++ unless ($chr =~ /$opattern/g);
    }
    $lno++;
}
$nonumberc = $wordc - $numberc;
$charscall = $kcharsc + $charsc;
print "** Words: $wordc\n";
print "**  - Ordinary: $nonumberc\n";
print "**  - Number:   $numberc\n";
print "** Chars: $charscall\n";
print "**  - Kanji:    $kcharsc\t[with codepoint >= U+3000]\n";
print "**  - Other:    $charsc\t[Ascii, Russian, etc.";
if ($opts{'p'}) {
    print "; not counting .,:;!?<>()[]\'\"`~]\n";
} else {
    print "]\n";
}
printf STDERR "Words/Characters counter processed $lno lines.\n";
 
# Help
sub usage {
    my($prog) = basename($0);
    die <<"EOM";
Usage: $prog \<-p\>
 -p  not count puctuations and signs .,:;!?\<\>\(\)\[\]\'\"\`\~
 * 2006-2007 (c), isao yasuda, All Rights Reserved.
 * absolutely no warranty.
EOM
}

簡単に使い方を記しておく.上記プログラムを artclcount という名で格納するとする.以下の説明では「対象文書」はカウント処理用に複製した TeX 原稿を指している.

  1. 対象文書 (EUC) に対し,\pagestyle{empty} を指定する.これはノンブルなど余計な情報をカウント対象から外すためである.
  2. Babel パッケージで外国語を記述している場合,対象文書に対し,\selectlanguage 命令の直後に \language=255 を指定することにより,ハイフネーション処理がなされないようにしておく.分綴されると一単語が二語と扱われるためである.カウント処理を想定して,予めもとの TeX 原稿にこれらの切替をコメントとして書いておき,sed で一括変換するのがよいと思う.例えば原稿は次のようなマクロで言語切替を行うようにしておき,カウント処理用対象文書でコメントを外すようにすればよい.
    \newcommand{\rutxt}[1]{%
      \begingroup\selectlanguage{russian}%
    % ハイフネーション抑止
    % カウント処理の前に次行をコメント解除する.
    %\language=255%
      #1\endgroup\relax}%
    
  3. ロシア語単語数を計算する必要がある場合,できるだけ T2A エンコーディングで組むとよい.OT2 だと dvi 抽出テキストが空白で出力される文字があり,計算上取り扱いが面倒になる.OT2 原稿ならば対象文書の文字 ёжйъьэюя (大文字,小文字とも) を c (合字として扱われることがない) に変換しておく.
  4. LaTeX で対象文書をコンパイルする.このとき生成される dvi ファイル名を target.dvi とする
  5. dvi2tty (日本語対応版) で target.dvi からテキストを抽出し,count.txt に出力する.このとき,dvi2tty オプションに -w132 -l (一行132文字整形,改頁^Lマーキング) を指定しておくとよいと思う.
    % dvi2tty -w132 -l -o count.txt target.dvi
    
  6. count.txt を UTF-8 にコード変換し,GNU sed で傍点,脚注セパレータ,改頁^Lマーキングを削除し,その結果を count-sed.txt に出力する.このあたりのテキスト整形は count.txt を眺めて決める.
    nkf -w count.txt |\
    sed -e 's/ \. //g' \
        -e 's/___*//g' \
        -e 's/\^L$//g' > count-sed.txt
    
  7. 本カウントプログラムで単語数,文字数を計算する.
    % artclcount < count-sed.txt
    ** Words: 2516 .. 全単語数 (欧文)
    **  - Ordinary: 1917 .. 通常単語数 (欧文)
    **  - Number:   599 .. 数値含む単語数
    ** Chars: 25762 .. 全文字数
    **  - Kanji:    14360 [with codepoint >= U+3000] .. 漢字
    **  - Other:    11402 [Ascii, Russian, etc.] .. 欧文
    

Movable Type 3.2 でメモリ不足でサーバエラーが頻繁する対策を少し探ってみた.EntriesPerRebuild 値を調整することで改善された.

「サイトを再構築」をインデックス,エントリーアーカイブ,...とひとつずつやっていくと,月別アーカイブ作成でエラーとなる場合が多い.これは多くのエントリーをまとめて処理するため,それに応じたエリアを一度に要求する MT 仕様によってきたるようである.そこで少しずつやる手だてはないかと,Google で探してみたら,あった.

mt-config.cgi という MT の動作カスタマイズ用 cgi スクリプトがあり,そこに EntriesPerRebuild なるパラメータがある.デフォルトは 40 である.エントリーアーカイブ作成などはこの数値ごとにまとめて処理されるようである.月別アーカイブ作成は,この数字を適当に弄って試した限りにおいて,これの 10 倍値ごとに束ねて処理されるようである.つまり標準値は 40 x 10 = 400.

いま現在,本サイトの記事数は 200 程度なので,この半分ずつ処理させるとして EntriesPerRebuild を 10 に設定したら,おおむねうまくいった.デフォルト値の 1/4 の設定であって,処理時間がトレードオフとなるのが想定される.が,背に腹は変えられない.

これでようやく,落ち着いて記事を登録できるようになったかと思ったら,カテゴリーアーカイブで引っかかる場合がある.これの分割はどうもできないのか.うーむ.ところで,このメモリ不足によるエラーが httpd-error.log には "Premature end of script headers" と出力されるのはどうも解せない.

MT の登録エントリー数が増えてアーカイブ作成でエラーが発生するようになって困っている方.EntriesPerRebuild 値調整は,それでも,お試しあれ.

西武池袋沿線のとあるお客様のところにお伺いした.面白からぬ打合わせ.不愉快な思いもしたし,時刻が定時あたりでもあったので,帰社する気にもなれず,帰りに久しぶりに池袋で駅舎を出た.西武百貨店の最端にある本屋に行く.結構様変わりしていて,私は ILLUMS なるインテリア専門店に紛れ込んでしまい,掲示案内に従って書店を探すのだが,「書店街」を指し示すその先を見ても壁に打ち当たるとしか思えず,ぐるぐる巡りをしてしまった.

書店リブロは地下 1 階から地上 4 階に及ぶ大型書店になっていた.でも「ぽえむど・ぱろうる」が無くなっていてがっかりした.就職して札幌から東京に出てきたとき,東京の大型書店の規模には少なからぬ驚きを覚えたが,池袋西武リブロの詩集専門店「ぽえむど・ぱろうる」と,そのそばの現代音楽の豊富な CD 兼美術書ショップをはじめて訪れたときは,東京ではこんな奇特な店が成り立っていることに本当にびっくりした.ジュリアン・グラックの詩集を買い,石川九楊の書の栞をもらい,武満徹の室内楽 CD を買ったことを思い出す.

湘南新宿ラインで家路についた.この路線ができて,池袋から最寄りの駅まで 30 分で着いてしまう.車中,世界の中心で愛を叫びそうなカップルがずっといちゃいちゃしていて辟易してしまった.

恩田陸の小説を読んでいたら,「さっき黎二にからんでたでしょ」なる文に行き当たった.当たり前のような日本語である.嫌な予感がして misima に掛けたら,果たして「さつき黎二にからんでたでせ」と不完全な旧仮名変換結果となった.つまり,「からんでたでしょう」の語末の助動詞「う」が欠落し,助動詞「です」未然形で文が閉じられるパターンを見落としていた.「行きましょ」(「ます」)も同じ部類に入る.

本来なら「からんでたでしょ」は飽くまでも口語的表記であって,旧仮名・旧字の古い作家の引用文を簡易に作成するという目的において,そこまで拾う必要があるのか疑問ではある.しかし,茶筌がきちんと解析する範囲はしかるべく変換できないと恥ずかしい.恩田陸は敬愛する作家でもあるし,その作品に出現する以上,口語的とはいえ,この「でしょ・ましょ」は十分な存在意義をもって流通する表記であるともいえる.

「からんでたでしょ」の変換は「からんでたでせう」とすべきだと思われる.もともと「う」が省略される発想がなかったので,この対策は少し手間取ってしまった.語の処理において直前の語が「です・ます」の未然形かどうかを判定して必要に応じ「う」を補わなくてはならない.処理中の語が「う」なら,または「ませ(ん)」タイプの未然形なら重複を招くなどの不正になるので補ってはならない.句読点もなにも「しょ」に続くものがない場合はどうするか.この辺りの判定ロジックを考えるのに時間を要してしまった.

Web 版のみならずインストール版の misima Perl モジュールも更新し,misima-2.3d.tar.gz として公開した.

『オネーギン』の論文を見直していて,ロシア語の分綴がいまひとつの箇所を見つけた.標準の Babel ロシア語言語定義 russianb.ldf では \righthyphenmin 値が 2 に設定されているため,ローマ字翻字入力の ya (я) が 2 文字と解されてしまい,я だけが次の行に送られてしまう.「私だけ?」で,ちょっと格好悪いなあと思い,\righthyphenmin 値を 3 にセットしなおして調整した.

\russianhyphenmins は russianb.ldf で \lefthyphenmin,\righthyphenmin を設定する際に参照されるマクロである.この引数に語頭と語末の最小文字数を定義しておけばロシア語が選択されたときに有効になる.これで я だけがぽつんと行送りになる現象が解消した.

ついでなので,「TeX ロシア語ハイフネーションと文字入力について」にもその方法を追記した.

三月五日の日に ttk さんよりはじめてメールをいただいた.TeX Q and A でときおりコメントを投稿される方である.内容は Unicode 対応の pTeX の実験を公開したので私の多言語 TeX 原稿(Utf82TeX 用)をサンプルとして借用してよいか,というものだった.礼儀正しい文面もさておき,pTeX の内部構造を Unicode 対応としたとの刺激的通知にたいへん興味をそそられ,快諾したのは言うまでもない.今日 TeX Wiki を訪れると,ttk さんの頁のアナウンスがなされていた.

土村さんが公開している ptetex3 は UTF-8 の TeX 原稿が処理できる画期的な試みで,このたびの『美文書第 4 版』にも pTeX 最新事情の中心的話題として紹介されている.ドイツ語やフランス語といったメジャーなラテン文字による外国語は UTF-8 で原語表記のまま組版できるようになったのである.とはいえ,一方では,ptetex3 は内部コードとして JIS を用いる方式を変更していないので,JIS にも文字が定義されているロシア語やギリシア語の文字は Unicode → JIS 変換の過程でいわゆる全角文字として処理されてしまう.このため,欧文として処理されず,ロシア語組版をしたいユーザにとってはハイフネーション,フォントの関係で,目的が満たされたというところには至っていないのではないだろうか.

それに対し,ttk さんの試みは,Unicode 文字を \kcatcode カテゴリーコードの値に応じて処理し分ける工夫を導入することで,ロシア語,ギリシア語,中国語,韓国語などの文字ストリームを本来の言語処理基準に従わせることが可能になっているようである.『upTeX, upLaTeX − 内部unicode版 pTeX, pLaTeX の実装実験』をぜひ参照いただきたい.

原語表記による多言語 TeX 組版の課題は,ひとり入力文字を Unicode で原語表記できればよい,というものではない.既存の言語パッケージ資産を眺めると,ハイフネーションやフォントエンコーディングにおいて,各国語固有の文字コード事情に依存するものが多々あり,それこそ「Babel」の逸話のような混乱状態にある.例えば,タイ語は TIS-620 コードで処理しないと正しくフォントが拾えないし,単語境界をマーキングするツールも機能しない.これらを統一した分りやすい構造で取り扱うことのできるパラダイムが実装されるのには,まだまだ時間がかかると思う.

土村さん,ttk さんの実験はいずれもマルチバイトコードによる日本語と外国語を融合するものとして有意義なものである.アスキーの pTeX プロジェクトにも正式に採用されて,シェイプアップが継続されることを強く望む.Emacs ワールドでは,かつて日本の電総研メンバーが Mule として素晴らしい多言語アプローチを実装し,それがいまや Emacs 本体にマージされ多言語エディタとしての Emacs の凄さを決定的にしたと思う.これと同様に日本人による多言語 TeX へのこだわりは,各国語の既存資産をも統合できる方式の模索を通して,世界の TeX 事情をリードする可能性を秘めていると信じたい.

最近妙に spam メールが多いので,新手の賢い spam 発信ソフトが出回ったのかなあ,なんとかしなくちゃ,と思っていた.またブログソフト Movable Type が頻繁にサーバエラーを返すなどの問題も抱えていた.このところ仕事が忙しくてノーケアの状態だったが,少し時間が取れたので,それら問題の改善のため,自宅設置のサーバ Laura のシステム状態をチェックした.

自宅サーバ Laura (FreeBSD 5.4) のシスログを見てみると,なんと "swap_pager_getswapspace(...): failed" のエラーメッセージが多発していることを発見.つまり仮想記憶がパンク状態にあることが判明したのだ.要するに深刻なメモり不足.

ps コマンドで動作しているプロセスを確認すると,spam メールチェッカである spamassasin のデーモンが見当たらない.メモリ不足の影響で異常終了していたと思われた.これでは spam メールがほぼザルを抜けるようにインボックスに入って来ていたのも当然であった.Movable Type のサーバエラー "Premature end of script headers" 云々もメモリ不足が根本原因であると思う.

本来なら,メモリを増設し,スワップ領域を拡張する必要がある.しかし Laura 稼働環境 IBM ThinkPad i1620 は製品仕様での搭載可能最大メモリ 192MB ですでに運用しており,もう増設が不可になっている.512MB の新品メモリを買って来て入れ替える手も考えられるが,ThinkPad 製品仕様上,これを認識するか不安である.しようがないのでこのままのハードウェア環境で動かすしかない.

Laura では Web,sendmail,NTP,qqpopper など数々のインターネットサーバが稼働しているのみならず,Movable Type,CVS,Web 頁カウンタ servlet,spamassasin,misima,misima-WebService,namazu,MHonArc,電子コンコーダンス作成などの重たい処理が引きもなしに動作しており,192MB 主記憶,384MB 仮想記憶では心もとないのは致し方ない.misima が異常終了しても,びっくりしないでリトライしてみてください.

念のため,システムをリブートし,apache2,tomcat4 などを再起動した.せっかくなのでリブートの前に,freebsd-update プログラムを導入し,セキュリティパッチをシステムに適用した.spam がぴたりと止んだのでさしあたりめでたしめでたしである.

今日もシステムトラブル対応で午前二時にタクシーで帰宅.車中の備え付け小型テレビに白血病予防キャンペーン CF が流れていた.本田美奈子の在りし日の姿.そこで思い出したのが松任谷由実.

私は松任谷由実が大嫌いである.もう二十年以上も前,大学生の頃,ラジオで松任谷由実が出演する番組を聴いていた.その頃彼女には,出すアルバムすべてがチャートインする破竹の勢いがあった.一方,本田美奈子も『1986 年のマリリン』がヒットして,リクエスト番組でしばしば耳にしたものだったが,松任谷は本田のことを「貧乏人がテレビで嬉しそうに踊っているみたい」とコメントし,私はそれを聞いてしまって,なにかこう,どうしようもなく松任谷の人間性を見たような気になって,それ以来,松任谷由実が大嫌いになってしまった.今の若者のセレブブームに覚えるのに似た性質の嫌悪感.今から思うと,80 年代後半のバカ世代,日本人の腐りはじめの予兆のようでもあって,なおのこと『貧乏人』発言は忘れようもないのだ.(私はどうも貧乏人の部類に入るからか...)

ふと口をついて出たひとことが,そのひとのイメージを決定的に規定してしまうことがある.ちょっと口が滑ったのだろうとどんなに思い直そうとしてもダメである.私はとくに根に持つタイプだとも思われないけれども.

それでも松任谷由実にも,その素晴らしさを否定しようのない作品がある.『水の中のASIAへ』がそれ.他の星の数ほどある彼女の作品はことごとくゴミのように思うのだけど,これだけは別格なのだ.私はこれを大学一年の春に FM で聴いて,独特の異国情緒に魅惑されてしまった.『スラバヤ通りの妹へ』など,いい知れぬ懐かしさを覚えるのである.『貧乏人』発言で心底げんなりしたその後も,やはり魅力的であることをやめない.このアルバムは 45ppm LP という形態で発売され,たった 4 曲しか収録していない珍しい盤でもある.次にあげるのは現在入手可能な CD である.

水の中のASIAへ
松任谷由実
東芝EMI (1999/02/24)

無題

| | コメント(0) | トラックバック(0)

アンリ・トロワイヤ死去とのこと.まだ存命だったことのほうに驚きを覚える.
宇多田ヒカル離婚とのこと.まだ結婚生活を続けていたことのほうに驚きを覚える.

妻は有元利夫の絵が好きで,展覧会があると必ず出かける.何年か前,ふとしたことで有元利夫の本物のリトグラフが売り場に出ているのを私は見つけた.結構値が張ったが,どうしてもこれを手に入れたかった.それは 1981 年 9 月から 10 月にかけて有元ゆかりの弥生ギャラリーで催された個展のために制作したポスターである.有元本人が 1981 部刷ったもののうちの 444 枚目のものである.私の所有する数少ない美術品である.

ずっとこのリトグラフは寝室に立てかけていたのだが,子供がその前をずかずか,いそいそ通るのを見るうち,そのうちに引っ掛けて表面のガラスを割るのではと心配になり,私の屋根裏部屋に移すことにした.本やレコード,PC で雑然とした部屋が少し華やかになった.

arimoto_image.jpg

北大の浦井康男教授から論文のコピーが郵送で届く.表題は『近代ロシア文章語(散文)形成期の諸作家における造語体系について---ラジシチェフ,カラムジン,プーシキンの場合---』.「北海道大学文学部研究科紀要 121 (2007 年 2月)」とある.

浦井先生は計算機を使ってロシア語テクストを解析する専門家であり,この分野では先駆的存在と目されていると思う.私はかつてプーシキンの語彙統計についてほんの少しだけ先生のお仕事に協力したことがあり,妻もザリズニャク文法辞書の電子化のお仕事を先生から頂戴したことがある.

本論文は三作家の語彙の文法的出現様式比較により近代ロシア文章語成立に果たした三作家の役割を論ずるという壮大な構想に動機付けられている.私はまだ流し読みしただけで,核心部の意味を吟味できていない.きちんと読んで,私なりの感想を送らなくてはいけない.

***

もうひとつ,一日の日に,友人の T さんから私の『オネーギン』論文についての批評をメールでいただいた.英文学の先生をしている彼女は,露文学は門外漢だと謙遜していたが,さすが文学論文を見つめる眼差しには確かなものがあって,いくつか私の論考の問題点を適切に指摘してくれた.その指摘を踏まえて見直しに取りかかろうと思う.

今日は雛祭り.娘が歌を歌いながら,折紙でお雛様を折っていた.

おだいりさーまとおひなさまー
ふーたりならんでスガシカオ
hinamaturi.jpg

メールをチェックし必要に応じて返信することを義務だと思わないひとにメールアカウントを付与するのは悪だと思う.また,アカウントを付与するのであれば,そういう習慣をマナーとして通達・指導する義務が管理者にはある.なぜなら,メールアカウントをもらったひとは,アドレスを持っていると年賀状なりに書いちゃったりして知人に公開するかも知れないが,メールチェックの習慣がないとメールが来ても放置してしまい(そういうのをリテラシーがないという),知らないうちにそのひとの人間関係を壊すことになりかねないからである.ビジネスの世界では,問い合わせのメールに返信しないと,取り返しがつかないことになるのは常識である.メールアカウントを持っているひとがメールを見ていないなどありえないという前提なのだ.要請が無視されたという顧客クレームに対し,「メールを見ていませんでした」というのは斟酌の余地のない瑕疵なのである.私だって嘲笑するだろう.だから,大学などでリテラシーのない学生に無条件にメールアカウントを付与するなんてナンセンスであるだけでなく,学生本人にとって危険窮まりないと考えてしまう.

Profile

ISAO。システムエンジニア。昭和 30 年代を懐かしむオヤジ。ロシアに興味があります。
[more], [About our site]

Notice

この文書はフィクションであり,実在する個人,団体等とは一切関係ありません。

文書の記述内容は無保証です。不適切な表現があればコメントにてご指摘ください。

管理者が公序良俗に反すると判断したコメント,トラックバックは,断りなく削除される場合があります。

Links

About this archive

Entries at 2007年3月 in chronological order.

Previous: 2007年2月

Next: 2007年4月

Recent Entries in Main Index.
All Entries in Archive Index.

Web Pages

Powered by Movable Type 4.1