Oxford NINJAL Corpus of Old Japanese (ONCOJ)
今後の研究計画及び抱負
ONCOJ は常に更新中のコーパスである。 公開する予定として(現在作業中のものや計画中のものを含める)以下のものがある。
- 見出し語番号付与 語彙素を同定し、見出し語番号を振るという作業は進んでおり、次のアップデートを目処に五十音図を最後まで作業する予定である。
- テキスト 『延喜式祝詞』と『続日本記宣命』を ONCOJ に収録する予定である。
- アノテーション ゼロ代名詞、非有界依存構文、代名詞の照応などの情報をアノテーションに取り入れる試験的な研究は現在進行中である。
- ドキュメンテーション 本コーパスで用いられる上代日本語の形態論・統語論分析と、それらを表すタッグ付の規則をまとめたアノテーション・マニュアルを提供する予定である。
- 翻訳 各テキストに英語の対訳を付けるという作業は進行中である。著作権が許す限り色々な出典の英訳を提供する予定である。
- 辞書の充実化 単語リストの延長として、上代語・英語辞書を開発している。コーパスのデータと関連付けたリソースとして重要なツールになると考えられる。
- 外部資料へのリンク 外部のコーパス、データベース、目録などへのリンクを検討している。
- ウェブサイトの機能 さらなるダウンロード・表示などの機能を開発している。
- 情報の充実化 文学、人物、歴史などについてのアノテーションも検討中である。