今後の研究計画及び抱負

ONCOJ は常に更新中のコーパスである。 公開する予定として(現在作業中のものや計画中のものを含める)以下のものがある。

  • 見出し語番号付与 語彙素を同定し、見出し語番号を振るという作業は進んでおり、次のアップデートを目処に五十音図を最後まで作業する予定である。
  • テキスト 『延喜式祝詞』と『続日本記宣命』を ONCOJ に収録する予定である。
  • アノテーション ゼロ代名詞、非有界依存構文、代名詞の照応などの情報をアノテーションに取り入れる試験的な研究は現在進行中である。
  • ドキュメンテーション 本コーパスで用いられる上代日本語の形態論・統語論分析と、それらを表すタッグ付の規則をまとめたアノテーション・マニュアルを提供する予定である。
  • 翻訳  各テキストに英語の対訳を付けるという作業は進行中である。著作権が許す限り色々な出典の英訳を提供する予定である。
  • 辞書の充実化 単語リストの延長として、上代語・英語辞書を開発している。コーパスのデータと関連付けたリソースとして重要なツールになると考えられる。
  • 外部資料へのリンク 外部のコーパス、データベース、目録などへのリンクを検討している。
  • ウェブサイトの機能 さらなるダウンロード・表示などの機能を開発している。
  • 情報の充実化 文学、人物、歴史などについてのアノテーションも検討中である。

 

fsa