研究課題/領域番号 |
18K11429
|
研究機関 | 山梨大学 |
研究代表者 |
鈴木 良弥 山梨大学, 大学院総合研究部, 教授 (20206551)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 語感データベース / 音韻情報 / 発音の仕方 |
研究実績の概要 |
研究課題「語彙と音韻,及び発音に基づく語感の計算モデル構築と複数文書要約への適用」に関して,平成30年度は特に語感データベースの構築について研究を行った.「語感の辞典」(岩波書店),「日本語オノマトペ辞典(擬音語・擬態語4500語)」(小学館)に収録されている語彙をデータベースに登録した.また,「感情表現辞典」(東京堂出版)の語句も登録した.各語彙には,語感推定に必要となる音韻情報と発音の仕方に関する情報を付与し,教師付きデータを作成した.しかし,音韻情報と発音の仕方のデータはより多くの項目を追加する必要があることがわかり,現在より正確なデータを追加しているところである. 音韻情報については十分な情報を入力できていると思われるが,特に発音の仕方(声道の形状,動き,口腔,鼻腔の特徴などの情報)を細かく入力する必要があると考え,現在入力中である. また,現在不完全ながら,作成した教師付きデータを用い,深層学習により学習を行いモデルを作成した.現在,作成した学習モデルを用い,辞書に登録されていない語彙を語感辞書クラスに分類することを行っている.また,複数の新聞社の新聞(毎日新聞,朝日新聞,読売新聞,及び日本経済新聞)を用い,評価データを作成している.それと並行して,語感辞書作成とそれを利用した語感推定に関する論文を国際会議PACLING2019(ベトナム,ハノイ 10月 計算言語学に関する国際会議)に投稿する準備をしているところである.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成30年度に実施した「語感辞書の構築」はほぼ完成した.音韻情報と発音の仕方に関する情報の入力について簡便なデータは入力済みであるが,精度向上のため,より精密な情報を入力する必要があることがわかり,現在新しい情報の入力を行っているところである.深層学習による語感推定の実験は平成30年度にも行ったが,音韻情報と発音の仕方に関する情報を変更したため,今年度も引き続き継続して行うこととした.
|
今後の研究の推進方策 |
平成30年度に実施してきた「語感データベースの構築」についてはほぼ完了したので,音韻情報と発音の仕方のデータの更新を今年度の8月までに完了させる. その後,「意図の体系化と抽出」に関する研究を実施する.この研究は平成30年度に作成した語感データベースを利用することにより要約対象となる各文書における書き手の意図を判定する.書き手の意図は,批判的,同調的,条件付賛成,条件付反対,独自の提案・提言の5種を検討しており,文間の修辞関係,及び文中の主体者の語感とそれに対する書き手の語感から判定される.語感と修辞関係,及び意図が付与された教師付きデータを深層学習により学習し,要約対象とする各文書を5種の意図タイプへ分類する.
|
次年度使用額が生じた理由 |
計画では計算機と新聞記事データを平成30年度に購入する予定であったが,以下の理由により平成31年度に購入することにした.1.平成31年度に行う「意図の体系化と抽出とその評価」のため,深層学習を行う必要があり,より高性能な計算機が必要であるとわかったため.2.平成30年度に予定していた国際会議に参加できなかったため,平成31年度に参加することにしたため. 仕様計画:1.深層学習を利用するため高性能なGPUとCPUを搭載した計算機を2台購入する.2.語感データベース評価のためのデータとして最新の新聞記事を購入する.3.成果発表のため国際会議で研究発表を行う.
|