研究課題/領域番号 |
18K11429
|
研究機関 | 山梨大学 |
研究代表者 |
鈴木 良弥 山梨大学, 大学院総合研究部, 教授 (20206551)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 語感 / 音韻 / 意図判定 |
研究実績の概要 |
研究課題「語彙と音韻,及び発音に基づく語感の計算モデル構築と複数文書要約への適用」に関して,令和元年度は特に語感データベースの構築とそのデータベースへの発音記号,声道特徴情報の追加を行った.また,新聞記事データから社説を抜き出し,書き手の意図の分類を行った. 具体的には前もって社説内の各文の意図として分類できると判断した「批判的」,「同調的」,「条件付賛成」,「条件付反対」,「独自の提案・提言」の5種類の分類を用い,書き手の意図の分類を毎日新聞の社説を用いて行った.音韻情報と発音の仕方に関する情報(語感)を含むデータを用いたときの意図判定と語感情報を利用しなかった場合の意図判定結果を比較し,意図判定には語感情報が寄与していることを確認した.語感の情報の中でどの情報が一番寄与しているかを確認するために,情報を1つずつ削除したときに結果がどうなるかを実験した.今後実験データを増やして,毎日新聞以外の新聞社説でも意図判定に語感情報が有用であることを確認する.またデータを増やしたときにも語感の情報の中で一番寄与する情報に変化があるのかについて実験を行う.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
昨年度までの当初研究予定は,作成した語感データベースを利用することにより要約対象となる文書における書き手の意図を判定することであった.具体的には書き手の意図の分類を「批判的」,「同調的」,「条件付賛成」,「条件付反対」,「独自の提案・提言」の5種類に分けられると仮定して,分類を行う.社説のような意見を述べる文章でも,客観的事実を述べている部分などがあるため,その部分は「その他」として扱う. それに対し,進捗状況は毎日新聞の社説を利用して,正解データを人手で作成した.具体的には毎日新聞社説を文ごとに分割し,それぞれの文に対して5種類の意図か,「その他」のラベルを付与した.語感情報(音韻情報,発音の仕方)を語彙情報に追加することにより,意図のある文かどうかの判定だけでなく,意図間の区別を高精度でできることを確認した.現在,データ数を増やし新聞の種類も増やしても意図間の区別を高精度でできることを確認し,国際会議論文にまとめるため執筆中である.
|
今後の研究の推進方策 |
今年度は,まず,毎日新聞以外の社説に対して意図の抽出と分類ができることを確認する.その上で分類結果を利用して書き手の意見抽出とつながりを考慮した要約生成を行う.具体的にはある出来事に対してグラフベースの深層学習を拡張することにより報道機関のその出来事に対する重要視の度合い,及び意図のタイプごとにそのタイプに属する記事集合から書き手の主張を抽出する.各意図タイプ間の関係を考慮した上で,最終的に事実とそれに対する主張を要約として生成する.その後,人手により正解要約データを作成する.また,高精度の要約が得られると報告されているRecursive Neural Networkを用いた手法を実装し,本手法で作成した要約結果と比較を行う.最後に,成果報告として論文を投稿する.
|
次年度使用額が生じた理由 |
令和元年度は,まず毎日新聞の社説のみを対象として社説内の各文の意図分類を行った.毎日新聞の社説のみであればすでに購入済みの計算機だけで実験を行うことができたので,購入しなかった.また,毎日新聞の社説のみにデータを絞ったため学生には評価データ作成の依頼はしなかった. 毎日新聞の社説を用いた実験の結果,語感情報を用いることで高精度で意図分類を行うことができることが確認できたためデータを増やして実験するために最新の計算機を購入することにした.1月下旬から実験用計算機を購入しようと調査していたが,新型コロナウィルス感染拡大により計算機のパーツが品薄になり,希望の計算機が入手できないことがわかったので令和元年度の購入を断念し,平成2年度に最新の計算機を購入することにした.また,平成2年度はデータを増やして実験を行うため,学生の協力を得て評価データを作成する.
|