研究課題/領域番号 |
18K11421
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東京農工大学 (2021-2022) 茨城大学 (2018-2020) |
研究代表者 |
古宮 嘉那子 東京農工大学, 工学(系)研究科(研究院), 准教授 (10592339)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | 語義曖昧性解消 / 分散表現 / 対応付け / 辞書 / 単語区切り / 複合語 / 古文 / BERT / コーパス / 教師なし / 疑似データ / バイリンガル分散表現 / 単語 / Fine Tuning / 語義 / 転移学習 |
研究成果の概要 |
複数の語義タグセットのついているコーパスを用いた語義曖昧性解消の研究を行った。 まず、二つの辞書の対応付けの研究をバイリンガル分散表現およびBERTを用いて行った。さらに、古文の語義曖昧性解消について現代文と古文の二つのタグを意識した語義曖昧性解消の研究を行った。さらに、タグの違いは単語区切りの違いと大きな関係があることから、複合語の分散表現の合成の研究をバイリンガル分散表現とニューラルネットワークのマルチタスク学習を用いて行った。さらに、それに関連して平仮名の単語分割の研究を行った。
|
研究成果の学術的意義や社会的意義 |
科研費を申請した際にはまだBERTなどの事前学習モデルは存在しなかった。そのため、複数の異なったタグセットのコーパスを利用した「語義曖昧性解消」の研究を行う予定であった。しかし、BERTの出現により翻訳などの下段タスクの前処理としての語義曖昧性解消の意義は小さくなったと考え、辞書の対応付けの研究を行うこととした。また、事前学習モデルはタガーを提供し、語彙を限定しているため、単語区切りが異なる問題があることに気づいたため、複合語の分散表現の合成の研究と平仮名の単語分割の研究を行った。さらに、古文のような言語学的観点からは、語義を知ることに意味があると考え、古文の語義曖昧性解消の研究を行った。
|