misima-2.3d

|

恩田陸の小説を読んでいたら,「さっき黎二にからんでたでしょ」なる文に行き当たった。当たり前のような日本語である。嫌な予感がして misima に掛けたら,果たして「さつき黎二にからんでたでせ」と不完全な旧仮名変換結果となった。つまり,「からんでたでしょう」の語末の助動詞「う」が欠落し,助動詞「です」未然形で文が閉じられるパターンを見落としていた。「行きましょ」(「ます」)も同じ部類に入る。

本来なら「からんでたでしょ」は飽くまでも口語的表記であって,旧仮名・旧字の古い作家の引用文を簡易に作成するという目的において,そこまで拾う必要があるのか疑問ではある。しかし,茶筌がきちんと解析する範囲はしかるべく変換できないと恥ずかしい。恩田陸は敬愛する作家でもあるし,その作品に出現する以上,口語的とはいえ,この「でしょ・ましょ」は十分な存在意義をもって流通する表記であるともいえる。

「からんでたでしょ」の変換は「からんでたでせう」とすべきだと思われる。もともと「う」が省略される発想がなかったので,この対策は少し手間取ってしまった。語の処理において直前の語が「です・ます」の未然形かどうかを判定して必要に応じ「う」を補わなくてはならない。処理中の語が「う」なら,または「ませ(ん)」タイプの未然形なら重複を招くなどの不正になるので補ってはならない。句読点もなにも「しょ」に続くものがない場合はどうするか。この辺りの判定ロジックを考えるのに時間を要してしまった。

Web 版のみならずインストール版の misima Perl モジュールも更新し,misima-2.3d.tar.gz として公開した。

Moon Calendar

Profile

ISAO YASUDA。システムエンジニア。神奈川県在住。昭和 30 年代を懐かしむオヤジ。ロシアに興味があります。
[more], [About our site]

Notice

この文書はフィクションであり,実在する個人,団体等とは一切関係ありません。

R-18 指定サイトです。そのうち「18 歳以上ですか」の認証を入れる予定です。

文書の記述内容は無保証です。不適切な表現があればコメントにてご指摘ください。

コメント,トラックバックは,現在,運用を停止しています。ご意見等ありましたら isao@yasuda.homeip.net 宛電子メールにてお願いします。

Links

About this entry

Written by isao at 2007年3月15日 19:26.

Previous: \russianhyphenmins

Next: 久しぶりの池袋

Recent Entries in Main Index.
All Entries in Archive Index.

February 2012

Sun Mon Tue Wed Thu Fri Sat
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29      
Powered by Movable Type 4.1 blog counter