2015 Fiscal Year Annual Research Report
意味の対応付けによる辞書資源群の多言語セマンティックWeb化
Project/Area Number |
25280117
|
Research Institution | Waseda University |
Principal Investigator |
林 良彦 早稲田大学, 理工学術院, 教授 (80379156)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 恒昭 東京大学, 総合文化研究科, 教授 (60334299)
岩根 久 大阪大学, 言語文化研究科(研究院), 教授 (50176559)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 情報資源の構築・管理 / 意味属性 / 意味的類似度 / セマンティックWeb / リンクデータ |
Outline of Annual Research Achievements |
本研究課題の3年目の平成27年度は,主に以下の課題に取り組んだ. (1) 異言語間の概念対応関係の自動分類: 教師付き機械学習の枠組みにより,不適切な対応付け候補をフィルタリングした後に,対応関係の意味的分類を行う方式の検討を進め,これが有効な範囲と課題を明らかにした.また,対応付け候補の抽出の精度向上に資するため,現行の異言語の文間の意味的類似度方式における機械翻訳の精度の影響について詳しく評価を進め,方式的な限界を極めつつあることを確認するとともに,今後の課題を明確化した.国内学会発表:1件,査読付き国際会議(採録済.2016年5月発表予定):2件. (2) 語義・概念に関する分散表現の異言語間の概念対応付けに対する適用性の評価: より深い語義・概念レベルでの対応付けに適用できる可能性のある資源として,語義・概念に関する分散表現ベクトルがある.この資源の意味タスクへの適用法について評価を行い,本課題への適用に関する知見を得た.国内会議発表:2件. (3)動詞概念の対応付けに関する検討: 昨年度の分担者の加藤(東大)との共同研究を継続し,EDR電子化辞書における日本語動詞概念とPrinceton WordNetにおける英語動詞の対応付け方式,および,対応付けの可能な領域を明らかにした.国内会議発表:1件. (4) 異言語間の概念対応付けの多言語展開,LOD化に関する検討: 昨年度までの検討に引き続き,分担者の岩根(阪大)とともに,フランス語などの他言語への展開,および,得られた対応関係のLOD化に関する検討を行った.特に後者に関しては,関連する研究・展開活動が活発な欧州の研究者と連携を深めた.審査付き国際ワークショップ共同提案(採択済):1件
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の計画書においては,(1) 対応付けの機械学習の基盤の確立,(2) 心理的な意味属性の拡張方式の高度化,(3) RDFによる情報構造化の基本方針を確立すると記述していた.これらのうち,(1)については,精度はまだ十分ではないものの基本的な方式の提案・評価を行うことができており,さらに,新たな学習データを準備していることからほぼ計画どおりに進捗しているといえる.(2)については,まだ基本方式の検討の段階にあるが,関連する技術調査や知見の蓄積については着実に進みつつある.(3)については,すでに関連研究者との連携などから基本方式の見通しはついており,(1)の研究の実施結果を受けて,結果をリンクデータ化すれば良い段階となっている.以上の他では,動詞概念の対応付け方式の見通しが得られたこと,異言語の文間意味的類似度の高度化,新たな意味(語義・概念)属性に関する資源の利用などについての進捗があったことから,全体としては,「おおむね順調に進展している」と自己評価する.
|
Strategy for Future Research Activity |
本研究課題の4年目(最終年度) の平成27年度は,以下のように推進する. (1) 属性統合による異言語間の意味概念対応付けの高度化とLOD化: 平成27年度は,それまでに作成した日英方向のアノテーションデータの問題点を分析し,これらを精錬するとともに,新たに英日方向のアノテーションデータを作成した.そこで本年は,これらを利用して,双方向の対応付けを同時に行うことにより,精度と対応付けを同時に達成する方式の提案・評価を進める.また,その際は,これまでに検討してきた属性群に加え,心理的な意味属性や,コーパスから得られる分散表現による意味属性などを統合的に活用する方式を目指す.また,得られた範囲の関係付けデータをリンクデータ化する作業を進める. (2) 異言語の文間意味的類似度計算方式の確立: これまでに検討してきた方式の限界を打破するため,言語横断的あるいは言語独立な分散表現の構築・利用の方式を明らかにする. (3) 心理的な意味属性に関する資源構築・利用の課題の明確化: このサブテーマの実施の進捗は予定より遅れている.研究代表者が実施している別の科研費研究課題(挑戦的萌芽研究)の成果(概念の想起関係の利用)や,画像などのマルチモーダルな属性情報を併用することにより,既存の小規模・高精度な心理的意味属性を量的に拡大する方式について見通しを得,新たな研究課題として確立し,その実施計画を明確化することを目指す.
|
Causes of Carryover |
当初購入を検討していたPCワークステーションの購入を見送ったため.
|
Expenditure Plan for Carryover Budget |
アノテーションデータ(機械学習における学習・テストデータとして利用)の作成,もしくは,成果として得られた概念間の対応付けをリンクデータ化するための作業補助費として使用する.
|
Remarks |
本研究課題に深く関連する内容に関して,国際ワークショップを関連研究者とともに共同で提案し,セマンティックWeb分野の代表的国際会議であるISWC2016に採択された.
|