Copyright © 1999, 2001 Anatoly Kuklin and Kazuto Matsumura. All rights reserved.

マリ語基本語彙集 - Mari Core Vocabulary

はじめに - Preface


Preface to the original 1999 version
This small lexicon of the Mari language is a working paper intended for the annual report on a three-year project supported by the Ministry of Education, Science, Sports and Culture (Grant-in-Aid for International Scientific Research, Field Research, 1996-1998, #08041008).
The authors are aware of certain shortcomings in the current version of this Mari lexicon. Firstly, a number of very basic words are missing: they are mainly postpositions as well as verbs used as auxiliaries which form compound or "paired" verbs. Secondly, most example sentences are yet to be provided with Japanese translation. Thirdly, the manuscript is yet to be proofread by Kuklin, who lives in inland Russia, where he does not enjoy the same facilities of communication and transportation his Japanese colleague is used to.
Most of the Mari lexical materials used in this lexicon have been provided by Kuklin. Matsumura is responsible for the preparation of the initial 1000-word list this lexicon is based on as well as the computer processing and editing of the typewritten manuscript into a dictionary form.
In addition to this Cyrillic-Japanese version, there is a Cyrillic-Latin version in which all Japanese translations are transcribed in Latin alphabet.
Tokyo, March 1999
  • Kazuto MATSUMURA
    (Graduate School of Humanities and Sociology, University of Tokyo)
  • Anatoly KUKLIN
    (Mari Pedagogical Unviersity, Yoshkar-Ola, Mari-El)

マリ語は,本格的ですぐれた辞書がいくつか出ているが,いずれも学術出版としてオーソドックスな辞書編さんの方法をとっているために,基本的な語彙を実用的な目的で学ぶ際には,どれも 「たすきに長し」 の感が否めないのが現状である。また,身体部位や動植物名などを一箇所にまとめたシソーラス (分類語彙集,連想語彙集) の類も見当たらないようである。この語彙集は,このような現状を,マリ語の学習者のために少し改善できないかと考えて作られた試作品である。

この Web 版マリ語語彙集 (以下「Web 版」) は,文部省科学研究費補助金 (国際学術研究,平成8~10年度,課題番号08041008) による研究の報告として,1999年3月31日付で出版された 「マリ基礎語彙集」 (以下「印刷版」) を作った際に版下とした MS Word 文書と,その元になった ASCII ファイルの元原稿を用いて作成したものである。

この語彙集は,このままでもマリ語学習の教材として役立つと思われるが,次のような点で,理想からは程遠い未完成品である。第1に,語彙表による語彙収集は,後置詞などの機能語や文法化した名詞や動詞の用法を調査するには適しないため,マリ語の文において基本的な働きをする機能語や機能語に準じる名詞・動詞の多くが収録されていない。第2に,一部をのぞき,用例に日本語訳が添えられていない。第3に,ロシアとの通信事情が悪く,校正原稿をやりとりする時間がなかったため,アナトリ・ククリン (マリ教育大学,ロシア連邦マリ・エル共和国) による最終校正が行われる前の段階の原稿のまま印刷されたが,この Web 版もその時の原稿のままである。

印刷版の出発点となったのは,松村がロシア語と日本語 (キリル文字転写) の対訳で作成した1000語のリストである。ククリン は,そのリストに載っている語ひとつひとつに対して,対応するマリ語とその語の用例を加え,タイプライターで原稿を作成した。田中孝史氏は,ククリン原稿のマリ語・ロシア語・日本語の部分が機械的に区別できるような簡単なタグを付加しながら,キリル文字のタイプ原稿を Mac 上で入力した。松村は,田中氏による入力を整形して,キリル文字をすべて ASCII 文字に置き換えた語彙集の元原稿を作成した。その後のコンピュータによるテキスト処理と編集作業は,すべてこの元原稿 (ASCII ファイル) に対して施されている。印刷版を出版するにあたっては,マリ語・ロシア語の部分をマリ語表記用のキリル文字の Windows フォントに合った文字コードに,日本語部分をローマ字に変換しわける段階までは Perl スクリプトで行い,その語の編集作業は,日本語部分の漢字仮名による再表記やプリントアウトは MS-Word 95 で行った。MS-Word 版は,印刷版の版下用のファイルのため,言語タグをすべて削除している。

Web 版作成は,(1) 印刷版の版下の MS-Word 文書を MS-Word 97 に読み込んで Unicode 文書として保存しなおしたものを,Unicode 対応のエディタに読み込んで UTF-8 文書に変換,(2) そのあと,Perl で,漢字かな表記の部分だけを抽出して Shift-JIS に再変換したものを,印刷版の元原稿の ACSII ファイルに埋め込んで,日本語テキスト部分が Shift-JIS,キリル文字テキスト部分が ASCII 転写というテキストファイルの元原稿を作成,(3) そのあと,文書全体の UTF-8 変換,HTMLタグ付与を Perl で行うという手順で行われた。MS-Word 文書を直接使わなかったのは,キリル文字部分に使ったフォントが標準的なものではなかったためである。元原稿に対しては,明らかな誤植の修正以外の変更は加えず,印刷版をできるかぎり忠実にHTML文書化することをめざした。

この Web 版は,マリ語・ロシア語・日本語の混在した文書を,Unicode (UTF-8) 対応の Perl によって処理する私にとって最初の試みであり,また,辞書の体裁をないしていない試作品であって,満足できるものとは思っていない。また,ククリン氏から届いている印刷版への増補原稿を追加して,内容の面での改訂版をなるべく早く作成したいという考え (願い?) は変わっていない。

2001年6月23日

松村 一登