竹形誠司 ブログ
談話室    »トピック一覧
掲示板へのスパムが多いため、「ご質問」のコーナーはユーザー登録制とさせていただきました。お手数ですが、上の「新規ユーザーの登録」メニューより登録をお願いします。
帳票Web
アプリケーション

受注開発始めました
詳しくは こちら
竹形 誠司 著/ラトルズ刊
JSP帳票アプリケーション実践開発入門
JSP帳票アプリケーション
実践開発入門

JSP業務アプリケーション短期開発入門
JSP業務アプリケーション
短期開発入門

Java+MySQL+Tomcatで始めるWebアプリケーション構築入門
Java+MySQL+Tomcatで始めるWebアプリケーション構築入門

Java+MySQL+Tomcatで作る掲示板とブログ
Java+MySQL+Tomcatで作る
掲示板とブログ
愛について
by KILROY[KILROY]
 『あめ つち ほし そら やま かは みね たに くも きり むろ(室) こけ ひと いぬ うへ すゑ ゆわ(硫黄) さる お(生)ふせよ えのえを なれゐて』。

 『仮名手本忠臣蔵』といえば赤穂四十七士の話なわけなのだが、最近の「五十音図」というと‘ん’まで含めても四十六文字しかないということを知った。現在、義務教育だと「ゐ」と「ゑ」が教えられていないらしいのだ。

 ワ行というのはもともと「子音+母音」という原則からは外れている。ヤ行と並んで「母音+母音」から構成されているわけだ。そんなわけで、「わ・ゐ・ゑ・を」は「UA・UI・UE・UO」だったりするわけで、「UU」だとただの「U」っつーか「W」(‘W’を「ダブル」と訓むのは「ダブル・ユー」に起源する)になっちゃうので、その部分は欠落しているということになるらしい。

 さて。

 「そうなると、ヤ行のエ段というのもありそうなものだが?」とか考える人もいそうな気がする。つーか私は考えた。そしたら十世紀中ごろまでは実際あったらしい。

 冒頭に掲げた句は『あめつち』といって、十世紀中ごろの「字母表(かなの一覧表)」の一種である。「えのえ」には諸説あるのだが、後のほうの「え」は「枝・衣・愛」が充てられる「ヤ行の‘え’」だということである。

 現在いじくっている(自作の)日本語処理システム、元は内部表現としてローマ字ふうのコードを採用していたが、現在は「かな」ベースに変更してある。

 ……正直、困った。

 「それとも『愛』とかをカナ(ヤ行エ段。カタカナは『衣』とか?)に含めてしまおうか」とか考えたものの、そうすると辞書順に並べようと思ったときに、文字コード順に並ばなくなってしまう。さらに、『古事記』『日本書紀』の時代には母音の「イ」と「エ」に二種類あったことも知られていて、こうなると「日本語」を包括的に(というか、通時的に)扱おうと思ったら、ますます「既存のカナ文字コードに頼った処理システム」や「文字コードのカナの並び順に頼った並べ替え」には無理がある、ということになる。

 真面目に日本語処理をやろうと思ったら、文字コード体系みたいなところまで掘り下げないといけないことを思い知って、暗澹たる気分になった。

 ちなみに下の娘の名前は「愛」である。最近では娘の名前を見るたびに、ちょっと暗い気分になったりする。嗚呼。
投稿:KILROY[KILROY]/2007年 05月 06日 02時 07分 /更新:2007年 05月 06日 16時 42分
RE:愛について
by 竹形 誠司[takegata]
へぇ〜。じゃ、ヤ行のエは平仮名が作られる前に使われなくなってしまったってことなんでしょうかね。今から作るっていうのはどうですかね。たとえば、こんなのどうですか。

YE
YE


でも、文字コード表で「ゆ」と「よ」の間には、既に「ょ」が入ってるんですね。残念!

P.S.
10ccが「愛ゆえに」という曲で、「A compromise would surely help the situation 」と歌っておりますが、まぁ、そういうこともあるでしょうねぇ。
投稿:竹形 誠司[takegata]/2007年 05月 06日 18時 52分 /更新:2007年 05月 06日 19時 54分