2018 Fiscal Year Annual Research Report
Large-scale corpus based research on functional words in Japanese and its application to the development of a search tool
Project/Area Number |
16K13228
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
PARDESHI P.V. 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 教授 (00374984)
|
Co-Investigator(Kenkyū-buntansha) |
砂川 有里子 筑波大学, 人文社会系(名誉教授), 名誉教授 (40179289)
今井 新悟 早稲田大学, 日本語教育研究センター, 教授 (50346582)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | アノテーション研究 / 機能表現 / レキシカルプロファイリング / コーパス / BCCWJ |
Outline of Annual Research Achievements |
本研究は、日本語コーパスから機能表現を抽出し、機能表現の振る舞いを網羅的かつ視覚的に確認することのできるレキシカルプロファイリングの手法を確立することを目標としている。従来のプロファイリングでは、動詞、形容詞、副詞、名詞などの内容語が対象であったが、日本語の文の構成に関わる機能表現についても、同様のプロファイリングが実現できれば、コーパスの利用価値がいっそう高まると期待される。初年度(2016年)は、まず約100種類の初級レベルの機能表現を選定し、機能表現ごとに形態論的情報をまとめたデータベースを作成し、そのデータベースをもとにBCCWJから試験的に機能表現を抽出し、機能表現を抽出する際の課題を整理した。次年度(2017年)は、機能表現をより正確に洩れなく抽出するために、機能表現を文節が連続するタイプと非連続のタイプの2種に分類し、前者の機能表現について、プロファイリングツールのプロトタイプ版を開発し、機能表現をインターフェース上でいかに提示すべきかという実用上の問題について検討した。最終年度の2018年度は、非連続の文節に現れるタイプBの機能表現の抽出を実施した。具体的には、文節関係を検索することのできるグラフデータベースの利用による抽出を検討していた。また、初級レベルの機能表現のプロファイリングツールを今年度後半に一般公開した(http://nlb.ninjal.ac.jp/fep/)。
|
Remarks |
本科研の最大の目標は大規模コーパスに基づく日本語機能語の基礎研究と機能語検索ツールへの応用である。研究の結果として開発された機能語検索ツールはウェブで無償公開している。
|