語義曖昧性解消技術と領域適応手法を利用した情報抽出手法の研究開発
Project/Area Number |
17KK0002
|
Research Category |
Fund for the Promotion of Joint International Research (Fostering Joint International Research)
|
Allocation Type | Multi-year Fund |
Research Field |
Intelligent informatics
|
Research Institution | Tokyo University of Agriculture and Technology (2021-2022) Ibaraki University (2017-2020) |
Principal Investigator |
古宮 嘉那子 東京農工大学, 工学(系)研究科(研究院), 准教授 (10592339)
|
Project Period (FY) |
2018 – 2023
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥10,140,000 (Direct Cost: ¥7,800,000、Indirect Cost: ¥2,340,000)
|
Keywords | 「問題」 / 抽出 / 分散表現 / 語義曖昧性解消 / アノテーション / コーパス / 問題抽出 / コーパス作成 / BERT / 情報抽出 / 領域適応 / 人工知能 / 言語学 |
Outline of Annual Research Achievements |
科学技術論文における「問題」の周辺文からの問題内容の抽出についての研究を、国内学会の論文として発表した。現在追加実験を行い、ベースラインを上回る結果が得られたため、加筆してジャーナル論文として発表予定である。 また、関連論文として、異なった区切りの異なった単語に関係して、ある複合語の単語の分散表現(word2vec)をそれぞれの構成語から合成する研究について、執筆したジャーナル論文が公開された。また、これも関連論文として、「簡易小型化 BERT による日本語構文解析」という構文解析の論文も公開された。 また、語義曖昧性解消の研究として、異なった古文と現代文という二つの基準の語義タグを使った研究を行い、分散表現(word2vec)を利用した手法でジャーナルを1報、現代文のBERTを利用したレキシカル・サンプルタスクの研究で国際会議を1報、さらに現代文のBERTを利用したコーパス中の全単語を対象とした語義曖昧性解消の研究で、研究会の論文を1報執筆し、発表を行った。研究会の論文はブラシュアップして国際会議に投稿予定である。さらに、日本語歴史コーパスの語義曖昧性解消の関連論文として、日本語歴史コーパスの古文から現代文への翻訳を事前学習モデルであるT5を用いて行った研究について国内学会で発表を行った。こちらについても、2023年度以降に国際会議に投稿予定である。 さらに、T5 による特定キャラクター風発話への変換とその言語モデルの構築についての関連論文を国内学会で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
実験自体は終わっている。もともとコロナや大学を移籍した影響で遅れていた分が、完全には取り戻せずに現在に至っている状態である。あとは論文をジャーナル論文として投稿する予定である。
また、本プロジェクトは国際研究についてのものであり、イギリスの大学の研究者を日本に招くことも目的の一つとしていた。こちらに関しては、招へいの時期が、コロナの影響により、2020年の4月から2023年の4月に変更になった。2023年5月現在、すでに終えているが、2023年3月までには終えることができなかったので、科研費を延長すこととした。
|
Strategy for Future Research Activity |
実験自体は終わっており、現在ジャーナル論文を執筆中である。あとは、今後の国際研究について、どのように関係を続けていくのか、今年度に議論する予定である。
|
Report
(5 results)
Research Products
(37 results)