コーパス言語学(1) (2006夏)
レポートの課題
火曜日4時限の「コーパス言語学(1)」の単位取得を希望する者は,次の要領でレポートを提出すること。
- 日本語のテクスト(テキストファイルで 0.5MB~1MB 程度) を用意する。文庫本2~3冊程度の量である。
- 第8週「テクスト・データの整形」で扱った範囲を目安として,テクストをタグ付けする。<s> タグまであれば十分。これをコーパスファイルと呼ぶ。
- 上で作ったコーパスファイルから,授業で書いたプログラムを使って,「動詞連用形+たて」の形式 (例:「作りたての」「焼きたてを」) の出てくる文をすべて抜き出し,KWIC 索引の形で出力する。 なお,該当しない文で正規表現にマッチしたものは消去すること。
- 次のものを ZIP 形式で圧縮しフロッピーディスクにおさめて提出する。
- タグ付けする前のテクスト(テキストファイル形式, UTF-8)
- コーパスファイル(テキストファイル形式, UTF-8)
- 「動詞連用形+たて」の KWIC 索引 (テキストファイル形式, UTF-8)
- 併せて,KWIC 索引をA4判で出力したものをハードコピーで提出する。
- 上の「標準の課題」以外のテーマでレポートを提出しようと考えている場合は,個別に相談されたい。
- 提出方法: 授業名,提出者名を明記した封筒に入れ,弥生キャンパス総合研研究棟3階,言語動態学
研究室に持参すること。
- 提出期限: 2006年9月29日(金)
更新日 2006/07/11