2018 Fiscal Year Annual Research Report
統語・意味解析情報タグ付きコーパス開発用アノテーション研究:複文を中心に
Project/Area Number |
15H03210
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
PARDESHI P.V. 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 教授 (00374984)
|
Co-Investigator(Kenkyū-buntansha) |
岸本 秀樹 神戸大学, 人文学研究科, 教授 (10234220)
野田 尚史 大学共同利用機関法人人間文化研究機構国立国語研究所, 日本語教育研究領域, 教授 (20144545)
吉本 啓 東北大学, 高度教養教育・学生支援機構, 教授 (50282017)
窪田 悠介 筑波大学, 人文社会系, 助教 (60745149)
長崎 郁 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, プロジェクト非常勤研究員 (70401445)
HORN S.W. 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, プロジェクト非常勤研究員 (70801538)
バトラー アラステア 弘前大学, 人文社会科学部, 准教授 (90588873)
|
Project Period (FY) |
2015-04-01 – 2020-03-31
|
Keywords | 関係節 / 従属節 / アノテーション / 統語・意味解析 |
Outline of Annual Research Achievements |
本研究は現代日本語の特徴の一つである関係節および従属節を中心とする複文について言語学的情報を検索、抽出するために必要なアノテーション方法を研究し、それに基づいて約5万文(約90万語)に対してタグ付け作業を行い、複文に関するより高度の環境整備を整えることを目標とする。この作業は国立国語研究所の「統語・意味解析コーパスの開発と言語研究」プロジェクトと連携をしながら進め、以下の成果があった。 ① コーパス構築:3万文規模のコーパスの公開(国立国語研究所のウェブサイトを通じて、http://npcmj.ninjal.ac.jp/)
上記のほか、研究成果の一部を国内外の研究会で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
平成30年12月、構築したデータベースへの検索に必要な正規表現を自動的に生成するプログラムを開発し、インターフェース公開に向けて準備を進めていたところ、当初の予想に反し、プログラムの検索式に問題があり、インターフェースが正常に作動しないことが判明した。プログラムの修正は全て人の目でチェックする必要があるため時間を要し、研究計画に遅延が生じた。
|
Strategy for Future Research Activity |
C-26様式で掲載した計画に従ってデータ公開用のインターフェースを完成させ、一般公開する。
|
Research Products
(16 results)