背景

[ 次ページ ]

いわゆる文字のない言語や特殊な文字体系を用いる言語のデータをコンピュータで処理する場合，ASCII 文字やその組み合わせで代用したり，独自に外字やフォントを作成したりして対応してきた研究者は多い。しかし，独自に作成された外字やフォントはそれらを組み込んだコンピュータでしか利用できず，また ASCII 文字で代用した場合も文字の組み合わせと音の対応が研究者によってまちまちであるため，研究者の間でデータや研究成果のやりとりを行う際に，文字化けが起こったり，音声記号の代用として使われている文字と音声記号との対応関係が推定できない場合があるなど，問題が多い。

紙のメディアを媒介としない電子的な文書交換が急速に一般化しつつある現在，音声記号や特殊な文字を含む言語データの確実なやりとりを紙のメディアに依存して行うことの限界が誰の目にも明らかになりつつある。いわゆる文字のない言語のデータの記録の手段である音声記号のエンコーディングが統一されていない状態のまま，コンピュータを用いて文書が作られ続けるなら，早晩，言語学者たちののハードディスク上に蓄積されている言語データが，そっくり文字変換処理の対象となって，膨大な時間と費用を費やさなければならない事態になるのは必至であり，最悪の場合，紙のメディアに出力してないハードディスク上の言語データの一部が，著しい文字化けによってもとの姿に復元できなくなってしまう可能性さえある。

[ 次ページ ]