2016 Fiscal Year Research-status Report
超大規模コーパスからの統計的知識獲得と構成論的記号計算の融合による句の類義性認識
Project/Area Number |
15K16045
|
Research Institution | Tohoku University |
Principal Investigator |
松林 優一郎 東北大学, 情報科学研究科, 助教 (20582901)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 概念構造 / 項構造解析 / 類犠牲認識 / 分散意味論 / 選択選考モデル / 文章生成 |
Outline of Annual Research Achievements |
本年度の研究においては、実応用に即した句の意味計算技術の構築を目標として、以下の三つの課題を進めた。 (1) 述語の項構造解析:実際の意味解析技術である述語項構造解析において、前年度に行った最先端のシステムにおける現状の問題点の分析結果にしたがい、計算モデルの改善を行った。具体的には、ニューラルネットワークを用いたモデリングにより、これまで人手により設計されていた特徴量の組み合わせ方法を自動学習する手法と、これまで記号的に表現されていた特徴を数値ベクトルとして表現する手法の導入により、これまでの解析手法と比べ、大幅な性能改善を得た(松林,乾 2017)。 また、このモデルをさらに発展させ、文中の複数の述語に対して、比較的単純な構造を持つ項を事前に分析し、その情報をより複雑な構造を持つ項を特定するための事前情報として用いる計算モデルについて開発を進めた。 (2) 項の選択選好モデル: 句の類似性モデルの構築作業の一部として、述語とその項となる名詞の間の意味的な関係を表現する選択選好モデルを題材として、単語の分散表現にもとづく句の意味表現モデルを用いて、述語と項の組み合わせに関する妥当性や意味的な類似性を表現する計算モデルを構築し、その成果を国際会議論文として報告した(Inoue, Matsubayashi, et al., 2016)。 (3) 意味の類似性を考慮した文章構造解析モデル:句の意味の類似性や文脈上の一貫性を計算する技術に関する応用研究の一環として、歌詞における文章構造を題材として、類似するフレーズの分布に基づいて構造の切れ目を判定することで、歌詞のみの情報から楽曲におけるAメロ、Bメロ、サビ等の音楽的境界を認識する技術を構築した(Watanabe, Matsubayashi, et al., 2016)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
述語の項構造中心とした意味の計算モデル、及びその実応用課題についてそれぞれ概ね本年度計画に沿った成果を出せている。 研究成果の対外発表も順調であり、言語処理分野で国内最大規模である言語処理学会での発表および、3件の国際会議発表を行った。研究発表においては、1件の優秀発表賞を受賞した。
|
Strategy for Future Research Activity |
本年度の研究において、日本語の実応用的な意味解析においては、特に省略された項を解析する技術の改善が今後の深刻な課題であることが浮き彫りとなった。このため、来年度は研究計画を一部変更し、省略解析技術の改善を中心に据え、意味計算モデルの構築を進める。 特に、人間が文章読解において行う、文脈理解に必要最小限の自然な省略補完をモデリングすることを念頭に、複数人の人手によるコーパスアノテーション結果に基づく省略補完の分析及び、計算モデルの開発を行う。
|
Causes of Carryover |
本年度の研究において、日本語の実応用的な意味解析においては、特に省略された項を解析する技術の改善が今後の深刻な課題であることが浮き彫りとなった。このため、来年度は研究計画を一部変更し、省略解析技術の改善を中心に据え、意味計算モデルの構築を進めることとした。これに伴い、本年度予定していた類義表現計算の評価作業にかかる人件費を繰越し、より自然な省略補完を実現するための訓練評価用コーパスの構築にかかる人件費に当てることとした。
|
Expenditure Plan for Carryover Budget |
変更後の計画においては、人間が文章読解において行う、文脈理解に必要最小限の自然な省略補完をモデリングすることを念頭に、複数人の人手によるコーパスアノテーション結果に基づく省略補完の分析及び、計算モデルの開発を行うこととしている。この際に必要な人手によるコーパスアノテーションのための人件費として使用する。
|
Research Products
(6 results)
-
-
-
-
-
[Presentation] Modeling Discourse Segments in Lyrics Using Repeated Patterns2016
Author(s)
Kento Watanabe, Yuichiroh Matsubayashi, Naho Orita, Naoaki Okazaki, Kentaro Inui, Satoru Fukayama, Tomoyasu Nakano, Jordan B. L. Smith and Masataka Goto
Organizer
International Conference on Computational Linguistics
Place of Presentation
Osaka International Convention Center, Japan
Year and Date
2016-12-13 – 2016-12-16
Int'l Joint Research
-