2022 Fiscal Year Annual Research Report
Transfer Learning of Word Sense Disambiguation with Corpora Tagged with Multiple Tag Sets
Project/Area Number |
18K11421
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
古宮 嘉那子 東京農工大学, 工学(系)研究科(研究院), 准教授 (10592339)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 語義曖昧性解消 / 単語区切り / 分散表現 / BERT |
Outline of Annual Research Achievements |
前年に行った二つの国語辞典の語義タグを使った研究については、再実験の結果、比較手法とあまり変わらない結果となったため、国際会議の論文には追加の研究が必要という結論に至った。一方、やはり前年に言及した区切りの異なった単語に関係して、ある複合語の単語の分散表現(word2vec)をそれぞれの構成後から合成する研究について、執筆したジャーナル論文が公開された。また、関連論文として、「簡易小型化 BERT による日本語構文解析」という構文解析の論文も公開された。 また、異なった古文と現代文という二つの基準の語義タグを使った研究を行い、分散表現(word2vec)を利用した手法でジャーナルを1報、現代文のBERTを利用したレキシカル・サンプルタスクの研究で国際会議を1報、さらに現代文のBERTを利用したコーパス中の全単語を対象とした語義曖昧性解消の研究で、研究会の論文を1報執筆し、発表を行った。研究会の論文はブラシュアップして国際会議に投稿予定である。 さらに、語義曖昧性解消ではないが、単語区切りに関係する副次的な研究として、平仮名の単語分割の論文を国内学会で発表した。こちらについても、2023年度以降に国際会議に投稿予定である。 さらに、日本語歴史コーパスの語義曖昧性解消の関連論文として、日本語歴史コーパスの古文から現代文への翻訳を事前学習モデルであるT5を用いて行った研究について国内学会で発表を行った。こちらについても、2023年度以降に国際会議に投稿予定である。 また、科学技術論文における「問題」の周辺文からの問題内容の抽出を国内学会で発表した。これも関連論文である。
|
Research Products
(8 results)