研究課題/領域番号 |
18K11421
|
研究機関 | 茨城大学 |
研究代表者 |
古宮 嘉那子 茨城大学, 理工学研究科(工学野), 講師 (10592339)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | バイリンガル分散表現 / コーパス / 語義曖昧性解消 / 単語 / 単語区切り / 分散表現 |
研究実績の概要 |
昨年度、国内学会に出した論文について、国際学会で発表を行った。ひとつめは、分類語彙表の分類番号(意味を表すクラスの番号)と岩波国語辞典の語義の対応をとる研究である。これは分類語彙表の分類番号と岩波国語辞典の語義の両方が付与された、現代日本語書き言葉コーパスを用いて実験を行っている。ilingual word embeddingsを利用して、ふたつの辞書における意味の対応をとる方法であったが、最頻出の語義をとる手法に比べて,正解率を上回ることができなかった。これに対して、Bilingual word embeddingsの新しい手法を試してみたが、やはり最頻出の語義を出力する方が良いという結果になった。 ふたつめは、Fine-tuningを使った分散表現の改良の実験である。 またこれらとは別に、複数のコーパスを利用する際に、単語の区切り方が違うという問題に対して、bilingual word embeddingsを利用した手法と、マルチタスク学習を用いた手法を提案した。前半の手法は国際会議にて発表を行い、後半の手法に関しては、国内学会で発表を行った。 また、ふたつめの研究と、みっつめの研究を評価するために、木構造を持つ概念辞書を用いた、分散表現の評価手法について提案を行い、ふたつめの研究結果と共に論文とした。しかし、今のところ、word2vecを用いた分散表現を使った研究となっているため、BERTを利用すればよりよい結果が得られるのではないかと考えている。そのため、今後はBERTを利用して同様の問題を改善する必要があると考えている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
新型コロナウイルスによるオンライン授業の対応や、入試業務への対応に時間がかかったため、去年までの遅れを取り戻すには至らなかった。そのため、国際学会での発表は思ったよりも多くできたが、BERTを利用した実験に関してはやり残したところがあると考えている。
|
今後の研究の推進方策 |
今年度は、二つの目標がある。 ひとつは、単語の区切り方が違うコーパスについて、これまでの結果をまとめて、英語の論文とすることである。 もうひとつは、これまで行ってきた実験を、BERTを使って改善し、よりよい結果を出すことである。
|
次年度使用額が生じた理由 |
国際学会を四本発表したが、そのすべてが新型コロナウイルスの影響で、オンライン開催となり、また、会議の登録料が無料となったため、次年度使用額が生じた。 国際会議や国内学会が再び現地開催となれば、旅費及び登録料が再びかかるようになると考えている。 繰り越した額は、今年から大学を移り、新たにPC等を購入する必要が出てきたので、それらの支出にあてること、また、今後の研究の発表等に充てたいと考えている。
|