2015 Fiscal Year Research-status Report
局所的な周辺文脈を利用した日本語の教師なしAll-words型語義曖昧性解消
Project/Area Number |
15K16046
|
Research Institution | Ibaraki University |
Principal Investigator |
古宮 嘉那子 茨城大学, 工学部, 講師 (10592339)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 語義曖昧性解消 / 日本語 / all-words |
Outline of Annual Research Achievements |
平成27年度は,all-wordsの語義曖昧性解消についての論文を読み,国内外の学会で情報収集を行った.また,10月から11月にかけて中国の上海で開催された国際会議PACLICにおいて,周辺語義モデルを利用したall-wordsの語義曖昧性解消について発表を行った( 発表タイトルは「Surrounding Word Sense Model for Japanese All-words Word Sense Disambiguation」である).これは日本語のall-wordsの語義曖昧性解消のモデルであり,大きな意義があるものである.また,共同研究者とともに教師有りのall-wordsの語義曖昧性解消についてのシステムを作成して,言語処理学会にて発表された「KyTea を利用した日本語 all-words WSD」に携わった.このシステムは日本語のall-wordsの語義曖昧性解消を手軽に行えるツールであり,日本語のall-wordsの語義曖昧性解消を行うとした当研究の目的の大きな前進であるといえる. また,語義曖昧性解消に利用される概念辞書について,分散表現を利用して概念を推定する研究を行い,これについて「概念辞書における子概念からの親概念の分散表現の推定」と題して平成28年3月に仙台で開催された言語処理学会の年次大会で発表を行った.現在,国際会議に投稿中である.そのほかを合わせると,平成27年度は,ジャーナル論文を一報,国際会議の論文を六報,11回の研究会発表を行った(共著も含む). 平成28年度には,これらの成果を国際会議やジャーナル論文で発表するとともに,研究のさらなる改良を行う.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
国際会議にて教師なしのall-wordsの語義曖昧性解消について発表を行った.当初の予定では,このモデルについて新しいコーパス(概念辞書と概念の付与されたEDR日本語コーパス)で再実験をし,その上で三年かけてこのモデルを掘り下げる予定であった.しかし現在は,BCCWJおよび岩波国語辞典を利用した教師ありのall-wordsの語義曖昧性解消についても実験を行っている.今後は,両方の可能性を探りつつ,より良い手法を研究する予定である.そのため,最も大きな目標である「日本語のall-wordsの語義曖昧性解消」についてはおおむね順調に進んでいるが,研究計画とは大きく異なった研究となる可能性がある.
|
Strategy for Future Research Activity |
上述したように,概念辞書と概念の付与されたEDR日本語コーパスを利用した概念(単語によらない言葉の意味.複数の単語がひとつの概念を持ちえる)による語義曖昧性解消と,BCCWJおよび岩波国語辞典を利用した語義(単語ごとに定義された言葉の意味.複数の単語がひとつの語義を持つことはない)による語義曖昧性解消のふたつを実施しており,場合によっては予定に反して後者を行う可能性がある.その場合には,もともとの研究計画から大きく異なることになる.しかし,最も大きな目標である,「日本語のall-wordsの語義曖昧性解消」を達成することを第一に研究を進めていく予定である.また,上記の二つの設定でともに成果が出ているため,まずは,これらの成果を論文として発表していく予定である.
|
Causes of Carryover |
費用は情報収集のための学会参加に充てる予定であったが,他の科研費および運営費での研究成果が出て,その費用で学会参加を行い,発表と同時に情報収集を行うことができたため,思ったよりも費用がかからなかった.
|
Expenditure Plan for Carryover Budget |
今年度は昨年度に出た成果を海外で発表する予定である.具体的にはすでに四つの国際会議に投稿しており,これらの渡航費等に使用する予定である.
|