• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

Research and development of information extraction methods using word sense disambiguation and domain adaptation

Research Project

Project/Area Number 17KK0002
Research InstitutionTokyo University of Agriculture and Technology

Principal Investigator

古宮 嘉那子  東京農工大学, 工学(系)研究科(研究院), 准教授 (10592339)

Project Period (FY) 2018 – 2023
Keywords「問題」 / 抽出 / BERT / 語義曖昧性解消 / アノテーション
Outline of Annual Research Achievements

科学技術論文における「問題」の周辺文からの問題内容の抽出についての研究を行っていたが、学術論文執筆中に、問題が発生したため、再実験に取り組むこととなった。すでに実験用のモデルは作成してあるが、学習データの数が足りないと判断したため、アノテーションを追加で粉うこととした。現在、問題内容についてのアノテーションの採取段階である。そのため、メインの研究の進行は遅れている。2024年度中にメインの研究の学術論文を投稿予定である。言語学的な知見からのアノテーションルールの知見を得たため、こちらについても論文で紹介するつもりである。
一方、関連研究についてはいくつも成果が出ている。語義曖昧性解消の論文として、22年度に研究会で発表した、古文に現代文のBERTを利用したコーパス中の全単語を対象とした語義曖昧性解消の研究について、国際会議の論文を発表した。また、日本語の語義曖昧性解消について、英語のコーパスを使って学習したモデルを翻訳により利用する手法について研究会で発表した。さらに、BCCWJという日本語の現代語のコーパスとして最大のコーパスに対して、語義曖昧性解消の手法で分類語彙表番号を語義としてすべてに付与する研究を行い、研究会において発表を行った。これら二つの研究会の論文については、国際会議または学術論文に投稿予定である。
また、ユニグラムとバイグラムのBERTによる平仮名の形態素解析の論文を執筆した。
さらに、2023年度は二つの文系の研究会で招待講演を行ったが、その両方とも語義曖昧性解消について紹介している。
また、2023年度の4月に、ケンブリッジ大学で知り合った当時の学生さんを招へいし、講演会を行った。

  • Research Products

    (7 results)

All 2023 2018

All Int'l Joint Research (1 results) Presentation (6 results) (of which Int'l Joint Research: 2 results,  Invited: 2 results)

  • [Int'l Joint Research] University of Cambridge(英国)2018

    • Year and Date
      2018-05-01 – 2019-04-30
    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      University of Cambridge
    • Co-investigator Overseas
      Simone Teufel
    • Department
      Computer Laboratory
    • Job Title
      Professor
  • [Presentation] All-Words Word Sense Disambiguation for Historical Japanese2023

    • Author(s)
      Shoma Asada, Kanako Komiya, and Masayuki Asahara
    • Organizer
      The 37th Pacific Asia Conference on Language, Information and Computation
    • Int'l Joint Research
  • [Presentation] Word Segmentation of Hiragana Sentences Using Hiragana BERT2023

    • Author(s)
      Jun Izutsu, Kanako Komiya, and Hiroyuki Shinnou
    • Organizer
      PRICAI 2023 (LNCS)
    • Int'l Joint Research
  • [Presentation] 『現代日本語書き言葉均衡コーパス』に対する分類語彙表番号悉皆付与2023

    • Author(s)
      浅田 宗磨,古宮嘉那子,浅原 正幸
    • Organizer
      言語処理学会第30回年次大会
  • [Presentation] 翻訳とBabelNetを利用した日本語の語義曖昧性解消2023

    • Author(s)
      Ganbat Naranbuuvei,浅田宗磨,古宮嘉那子
    • Organizer
      言語処理学会第30回年次大会
  • [Presentation] 語義曖昧性解消 コーパスへの意味タグの付与システム2023

    • Author(s)
      古宮嘉那子
    • Organizer
      語彙・辞書研究会 秋の研究会
    • Invited
  • [Presentation] 近代以前の日本語を対象にした自然言語処理の紹介2023

    • Author(s)
      古宮嘉那子
    • Organizer
      日本語学会2023年度春季大会 シンポジウム「情報技術と大規模テキスト資源がひらく日本語史研究」(
    • Invited

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi