コーパス言語学(1) (2006夏)

レポートの課題

火曜日4時限の「コーパス言語学(1)」の単位取得を希望する者は,次の要領でレポートを提出すること。

  1. 日本語のテクスト(テキストファイルで 0.5MB~1MB 程度) を用意する。文庫本2~3冊程度の量である。
  2. 第8週「テクスト・データの整形」で扱った範囲を目安として,テクストをタグ付けする。<s> タグまであれば十分。これをコーパスファイルと呼ぶ。
  3. 上で作ったコーパスファイルから,授業で書いたプログラムを使って,「動詞連用形+たて」の形式 (例:「作りたての」「焼きたてを」) の出てくる文をすべて抜き出し,KWIC 索引の形で出力する。 なお,該当しない文で正規表現にマッチしたものは消去すること。
  4. 次のものを ZIP 形式で圧縮しフロッピーディスクにおさめて提出する。
    • タグ付けする前のテクスト(テキストファイル形式, UTF-8)
    • コーパスファイル(テキストファイル形式, UTF-8)
    • 「動詞連用形+たて」の KWIC 索引 (テキストファイル形式, UTF-8)
  5. 併せて,KWIC 索引をA4判で出力したものをハードコピーで提出する。
更新日 2006/07/11