研究課題/領域番号 |
18H03297
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 国立情報学研究所 |
研究代表者 |
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 定型表現 / 執筆支援 / ドメイン・コーパス / 辞書自動構築 / 意味表現 |
研究成果の概要 |
本研究では、英作文における定型表現集の活用を支援するための自然言語処理技術の研究開発に取り組み、特に学術論文に焦点をあてて、論文の文中の定型表現および伝達機能の抽出および検索手法を提案した。本研究を通して、手法の構築や評価に広く利用可能なコーパスを構築・公開するとともに、伝達機能の抽出における深層学習モデルの有効性や定型表現抽出における文法知識の活用法を示すことができた。
|
自由記述の分野 |
情報通信/知能情報学、ヒューマンインターフェースインタラクション、データベース
|
研究成果の学術的意義や社会的意義 |
英語による文書作成を支援するための定型表現集が数多く出版されているが、その大半は電子化されておらず、電子化されていたとしても執筆途中に必ずしも気軽に利用できるものではない。本研究では、体系化された定型表現を大規模なドメイン・コーパスに対応付けることによって、ドメインに特化した言い回しや伝達機能などを含む豊富な文脈情報が獲得できることを示した。本研究で得られた知見は、これまで困難であった定型表現の予測や検索の実現に結び付くものである。
|