2016 Fiscal Year Research-status Report
局所的な周辺文脈を利用した日本語の教師なしAll-words型語義曖昧性解消
Project/Area Number |
15K16046
|
Research Institution | Ibaraki University |
Principal Investigator |
古宮 嘉那子 茨城大学, 工学部, 講師 (10592339)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 語義曖昧性解消 / all-word / 日本語 / 分散表現 |
Outline of Annual Research Achievements |
平成28年度は,特に分散表現や深層学習についての論文を読み,国内外の学会で情報収集を行った.それと共に,平成27年度以前の研究を論文化し,研究会や国際会議で発表を行った.たとえば,ICT-ISPC(2016年5月 バンコク)にて,「Estimating Concept Embeddings from Their Child Concepts」というタイトルで発表を行った. また,前の科研費の内容からの発展(本科研費との関わりもある)として「Selecting Training Data for Unsupervised Domain Adaptation in Word Sense Disambiguation」をPRICAI2016(2016年8月 プーケット)にて発表した.さらに,CICLING2017(2017年 4月 ブダペスト)において,「 Domain Adaptation for Word Sense Disambiguation using Word Embeddings」を発表予定である.また,トピックモデルよりも深層学習のほうが良い結果が得られそうであるため,分散表現を利用してall-wordsの語義曖昧性解消を行った.その結果として「『分類語彙表』の類義語と分散表現を利用したall-words語義曖昧性解消」と題した発表を言語処理学会で行った.またこのほかにも,ジャーナルを投稿中である. そのほかを合わせると,平成28年度は,国際会議の論文を六報,11回の研究会発表を行った(共著も含む). 平成28年度には,これら,2016年度の成果を国際会議で発表すると共に,これまでの国際会議の結果を改良してジャーナル論文を重点的に書き,また研究のさらなる改良を行う予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現在の研究の大きな流れとして,トッピックモデルよりも,深層学習を利用した方が良い結果が出そうであると判断し,分散表現を利用した語義曖昧性解消の研究にシフトして研究を行った結果,いくつかの研究結果が出て,論文をまとめているところである.昨年は,教師有りおよび教師なしのどちらの学習手法で行うかを考えていたが,現在は当初の予定通り,教師なしで実験を行っている.(ただし昨年度には,教師あり学習によるall-words語義曖昧性解消のシステムも作成して公開している.) 研究の進みについては大きな問題はないと考えている.しかし,トピックモデルの代わりに分散表現を使ったことで,当初の研究計画とは大きく異なってきた.
|
Strategy for Future Research Activity |
もともとは概念辞書と概念の付与されたEDR日本語コーパスを利用した概念による語義曖昧性解消を考えており,昨年度はこちらとさらに,BCCWJおよび岩波国語辞典を利用した語義による語義曖昧性解消を実施していた.平成28年度はこのどちらとも異なる,分類語彙表を利用したall-wordsの語義曖昧性解消を行っており,こちらも良い結果が出ている.来年度はこの結果を論文にすると共に,上記三つの知識を相互に利用できないかを検討したいと考えている.また,分類語意表によるコーパスには,短単位に加えて長単位の語義タグも付与されているため,長単位の語義タグを予測するために,予測された短単位の語義タグを利用できないかどうか検討中である.
|
Causes of Carryover |
二年目としては四つの国際会議に参加し,予定していた額を使ったが,一年目の繰越分については一部しか利用していない状態である.(一年目は他の科研費および運営費での研究成果が出て,その費用で学会参加を行い,発表と同時に情報収集を行うことができたため,思ったよりも費用がかからなかった).
|
Expenditure Plan for Carryover Budget |
昨年度に出た成果を海外で発表すると共に,ジャーナル論を執筆し,その掲載料として利用予定である.また,海外発表では,今年から修士の学生をもつことになったため,学生に発表を行わせる予定である.
|