2018 Fiscal Year Research-status Report
Project/Area Number |
17K12738
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
西川 仁 東京工業大学, 情報理工学院, 助教 (00765026)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 自動要約 / 深層学習 / 文簡約 |
Outline of Annual Research Achievements |
当初計画には含めていなかったが,本研究課題の遂行にあたって自動要約におけるゼロ代名詞の問題があらためて浮上してきたため,ゼロ代名詞照応解析の研究を実施した.これは大規模日本語均衡コーパスBCCWJを訓練事例と用い,深層学習を利用してゼロ代名詞照応解析を行うもので,これについては十分な成果が得られたものと考えている.
簡約コーパスの構築は順調に推移しており,間もなく実際に機械学習を利用する際の訓練事例として利用する予定である.
大規模な要約コーパスを利用した要約アルゴリズムの構築についても進展があり,新しい復号アルゴリズムを考案した.結果はまだ十分なものとは言えないものの,更なる改良によって十分な精度を示すことができると考えている.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
コーパスの構築は順調に推移している.アルゴリズムの開発も行ったものの,結果についてはまだ十分なものと言えないため,「やや遅れている」とした.ただし,既に開発アルゴリズムを多少改良すれば良好な結果が得られる目処は得られている.また,当初課題には含めていなかった点については十分な成果があった.
|
Strategy for Future Research Activity |
前述した新しい復号アルゴリズムの改良に努める.また,研究を加速させるため学内,学外の他の研究チームと連携して研究を推進する予定である.
|
Causes of Carryover |
簡約コーパスの作成のために費用を確保しておいたが,これを自動構築する目処が立ったため,当該費用分,残額が生じた.なお,これまで無料で利用できていた大規模要約コーパスが,有償での利用となったため,残額はこれを引き続き利用するための予算とする予定である.
|
Research Products
(4 results)