研究課題/領域番号 |
17K12738
|
研究機関 | 東京工業大学 |
研究代表者 |
西川 仁 東京工業大学, 情報理工学院, 助教 (00765026)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 自動要約 / 深層学習 / 文簡約 |
研究実績の概要 |
当初計画には含めていなかったが,本研究課題の遂行にあたって自動要約におけるゼロ代名詞の問題があらためて浮上してきたため,ゼロ代名詞照応解析の研究を実施した.これは大規模日本語均衡コーパスBCCWJを訓練事例と用い,深層学習を利用してゼロ代名詞照応解析を行うもので,これについては十分な成果が得られたものと考えている.
簡約コーパスの構築は順調に推移しており,間もなく実際に機械学習を利用する際の訓練事例として利用する予定である.
大規模な要約コーパスを利用した要約アルゴリズムの構築についても進展があり,新しい復号アルゴリズムを考案した.結果はまだ十分なものとは言えないものの,更なる改良によって十分な精度を示すことができると考えている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
コーパスの構築は順調に推移している.アルゴリズムの開発も行ったものの,結果についてはまだ十分なものと言えないため,「やや遅れている」とした.ただし,既に開発アルゴリズムを多少改良すれば良好な結果が得られる目処は得られている.また,当初課題には含めていなかった点については十分な成果があった.
|
今後の研究の推進方策 |
前述した新しい復号アルゴリズムの改良に努める.また,研究を加速させるため学内,学外の他の研究チームと連携して研究を推進する予定である.
|
次年度使用額が生じた理由 |
簡約コーパスの作成のために費用を確保しておいたが,これを自動構築する目処が立ったため,当該費用分,残額が生じた.なお,これまで無料で利用できていた大規模要約コーパスが,有償での利用となったため,残額はこれを引き続き利用するための予算とする予定である.
|