• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

複数タグセットのタグがついたコーパスによる語義曖昧性解消の転移学習

研究課題

研究課題/領域番号 18K11421
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関東京農工大学 (2021-2022)
茨城大学 (2018-2020)

研究代表者

古宮 嘉那子  東京農工大学, 工学(系)研究科(研究院), 准教授 (10592339)

研究期間 (年度) 2018-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
キーワード語義曖昧性解消 / 分散表現 / 対応付け / 辞書 / 単語区切り / 複合語 / 古文 / BERT / コーパス / 教師なし / 疑似データ / バイリンガル分散表現 / 単語 / Fine Tuning / 語義 / 転移学習
研究成果の概要

複数の語義タグセットのついているコーパスを用いた語義曖昧性解消の研究を行った。
まず、二つの辞書の対応付けの研究をバイリンガル分散表現およびBERTを用いて行った。さらに、古文の語義曖昧性解消について現代文と古文の二つのタグを意識した語義曖昧性解消の研究を行った。さらに、タグの違いは単語区切りの違いと大きな関係があることから、複合語の分散表現の合成の研究をバイリンガル分散表現とニューラルネットワークのマルチタスク学習を用いて行った。さらに、それに関連して平仮名の単語分割の研究を行った。

研究成果の学術的意義や社会的意義

科研費を申請した際にはまだBERTなどの事前学習モデルは存在しなかった。そのため、複数の異なったタグセットのコーパスを利用した「語義曖昧性解消」の研究を行う予定であった。しかし、BERTの出現により翻訳などの下段タスクの前処理としての語義曖昧性解消の意義は小さくなったと考え、辞書の対応付けの研究を行うこととした。また、事前学習モデルはタガーを提供し、語彙を限定しているため、単語区切りが異なる問題があることに気づいたため、複合語の分散表現の合成の研究と平仮名の単語分割の研究を行った。さらに、古文のような言語学的観点からは、語義を知ることに意味があると考え、古文の語義曖昧性解消の研究を行った。

報告書

(6件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 2018 実施状況報告書
  • 研究成果

    (39件)

すべて 2023 2022 2021 2020 2019 2018

すべて 雑誌論文 (6件) (うち査読あり 6件、 オープンアクセス 6件) 学会発表 (32件) (うち国際学会 10件) 図書 (1件)

  • [雑誌論文] Composing Word Embeddings for Compound Words Using Linguistic Knowledge2023

    • 著者名/発表者名
      Komiya Kanako、Kono Shinji、Seito Takumi、Hirabayashi Teruo
    • 雑誌名

      ACM Transactions on Asian and Low-Resource Language Information Processing

      巻: 22 号: 2 ページ: 1-22

    • DOI

      10.1145/3561299

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 簡易小型化 BERT による日本語構文解析2022

    • 著者名/発表者名
      Shinji Kono、Komiya Kanako、Hiroyuki Shinnou
    • 雑誌名

      自然言語処理

      巻: 29 号: 3 ページ: 854-874

    • DOI

      10.5715/jnlp.29.854

    • ISSN
      1340-7619, 2185-8314
    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 分散表現を利用した日本語歴史コーパスにおける語義曖昧性解消の通時適応2022

    • 著者名/発表者名
      古宮 嘉那子、田邊 絢、新納 浩幸
    • 雑誌名

      国立国語研究所論集 = NINJAL Research Papers

      巻: 23 号: 23 ページ: 59-73

    • DOI

      10.15084/00003566

    • ISSN
      2186-1358
    • URL

      https://repository.ninjal.ac.jp/records/3583

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Morphological Analyzer Using the Bi-LSTM Model Only for Japanese Hiragana Sentences2022

    • 著者名/発表者名
      Jun Izutsu, Kanako Komiya
    • 雑誌名

      International Journal on Natural Language Computing

      巻: 11 号: 1 ページ: 29-45

    • DOI

      10.5121/ijnlc.2022.11103

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Extracting Speech Patterns of Japanese Fictional Characters Using Subword Units2022

    • 著者名/発表者名
      Mika Kishino, Kanako Komiya
    • 雑誌名

      International Journal on Natural Language Computing

      巻: 11 号: 1 ページ: 1-14

    • DOI

      10.5121/ijnlc.2022.11101

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 概念辞書の類義語と分散表現を利用した教師なし all-words WSD2019

    • 著者名/発表者名
      Suzuki Rui、Komiya Kanako、Asahara Masayuki、Sasaki Minoru、Shinnou Hiroyuki
    • 雑誌名

      自然言語処理

      巻: 26 号: 2 ページ: 361-379

    • DOI

      10.5715/jnlp.26.361

    • NAID

      130007706831

    • ISSN
      1340-7619, 2185-8314
    • 年月日
      2019-06-15
    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] Word Sense Disambiguation of Corpus of Historical Japanese Using Japanese BERT Trained with Contemporary Texts2022

    • 著者名/発表者名
      Kanako Komiya, Nagi Oki and Masayuki Asahara
    • 学会等名
      the 36th Pacific Asia Conference on Language, Information and Computation,
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 日本語歴史コーパスのAll-words WSD2022

    • 著者名/発表者名
      臼井久生, 古宮嘉那子
    • 学会等名
      言語処理学会第29回年次大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 平仮名BERTを用いた平仮名文の分割2022

    • 著者名/発表者名
      井筒順, 古宮嘉那子, 新納浩幸
    • 学会等名
      言語処理学会第29回年次大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 平仮名BERTによる平仮名文の分割2022

    • 著者名/発表者名
      井筒順, 古宮嘉那子, 新納浩幸
    • 学会等名
      第253回自然言語処理研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 科学技術論文における「問題」の周辺文からの問題内容の抽出2022

    • 著者名/発表者名
      平林照雄, 古宮嘉那子,浅原正幸
    • 学会等名
      言語資源ワークショップ2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Morphological Analysis of Japanese Hiragana Sentences Using the Bi-LSTM CRF Model2021

    • 著者名/発表者名
      Jun Izutsu, Kanako Komiya
    • 学会等名
      10th International Conference on Natural Language Processing (NLP 2021)
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] Extraction of Linguistic Speech Patterns of Japanese Fictional Characters Using Subword Units2021

    • 著者名/発表者名
      Mika Kishino, Kanako Komiya
    • 学会等名
      10th International Conference on Natural Language Processing (NLP 2021)
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] 現代文 BERT を利用した日本語歴史コーパスの語義曖昧性解消2021

    • 著者名/発表者名
      多喜 凪, 古宮嘉那子
    • 学会等名
      言語処理学会第28回年次大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] BERTを用いた二つの辞書の対応付け2021

    • 著者名/発表者名
      河野稜斗, 平林照雄, 古宮嘉那子
    • 学会等名
      言語処理学会第28回年次大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 共学習によるレビュー文書からのネガティブな意見文の抽出2021

    • 著者名/発表者名
      三戸尚樹, 古宮嘉那子, 佐々木稔
    • 学会等名
      言語処理学会第28回年次大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] レビューから抽出されたキーフレーズと感情スコアを用いた評判分析2021

    • 著者名/発表者名
      HUANG YIPU, 佐々木稔, 古宮嘉那子
    • 学会等名
      言語処理学会第28回年次大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Bi-LSTM CRF モデルを用いた平仮名文の形態素解析2021

    • 著者名/発表者名
      井筒順, 古宮嘉那子
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 日本語の論文コーパスにおける「問題」の語義アノテーション2021

    • 著者名/発表者名
      平林照雄, 河野慎司, 古宮嘉那子, 新納浩幸
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] SentencePieceを用いたキャラクターの特徴語抽出2021

    • 著者名/発表者名
      岸野望叶, 古宮嘉那子
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 論文の要旨からのタイトル生成におけるキーワードと分野別fine-tuningの効果2021

    • 著者名/発表者名
      金野佑太, 古宮嘉那子
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] SVMを用いたBCCWJにおける同形異音語の読み推定2021

    • 著者名/発表者名
      小林汰一郎, 古宮嘉那子
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Automatic Creation of Correspondence Table of Meaning Tags from Two Dictionaries in One Language Using Bilingual Word Embedding2020

    • 著者名/発表者名
      Teruo Hirabayashi, Kanako Komiya, Masayuki Asahara and Hiroyuki Shinnou
    • 学会等名
      13th BUCC Workshop at LREC 2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Generation and Evaluation of Concept Embeddings Via Fine-Tuning Using Automatically Tagged Corpus2020

    • 著者名/発表者名
      Kanako Komiya, Daiki Yaginuma, Masayuki Asahara, Hiroyuki Shinnou
    • 学会等名
      PACLIC 2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Composing Word Vectors for Japanese Compound Words Using Dependency Relations2020

    • 著者名/発表者名
      Teruo Hirabayashi, Kanako Komiya, Masayuki Asahara
    • 学会等名
      PACLIC 2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Neural Machine Translation from Historical Japanese to Contemporary Japanese Using Diachronically Domain-Adapted Word Embeddings2020

    • 著者名/発表者名
      Masashi Takaku, Tosho Hirasawa, Mamoru Komachi, Kanako Komiya
    • 学会等名
      PACLIC 2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] 複数の事前学習済みモデルを用いたQAサイト質問回答ペアの分類2020

    • 著者名/発表者名
      佐々木稔, 古宮嘉那子
    • 学会等名
      IDRユーザフォーラム 2020
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 品詞情報を利用した複合語の分散表現の合成2020

    • 著者名/発表者名
      河野 慎司, 古宮嘉那子
    • 学会等名
      音声言語および自然言語処理シンポジウム
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] MeCab による平仮名のみの形態素解析2020

    • 著者名/発表者名
      井筒順, 明石陸, 加藤涼, 岸野望叶, 小林汰一郎, 金野佑太, 古宮嘉那子
    • 学会等名
      言語処理学会第26回年次大会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] マルチタスク学習を利用した短単位の分散表現から長単位の分散表現の合成2020

    • 著者名/発表者名
      河野慎司, 古宮嘉那子
    • 学会等名
      言語処理学会第26回年次大会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 通時的な領域適応を行った単語分散表現を利用した古文から現代文へのニューラル機械翻訳2020

    • 著者名/発表者名
      高久雅史, 平澤寅庄, 小町守 , 古宮嘉那子
    • 学会等名
      言語処理学会第26回年次大会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Bilingual Word Embeddingsによる短単位と長単位のアラインメント2020

    • 著者名/発表者名
      平林照雄, 古宮嘉那子, 新納浩幸
    • 学会等名
      語処理学会第26回年次大会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Composing Word Vectors for Japanese Compound Words Using Dependency Relations2019

    • 著者名/発表者名
      Kanako Komiya, Takumi Seitou, Minoru Sasaki, Hiroyuki Shinnou
    • 学会等名
      CICLING 2019
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会
  • [学会発表] All-words WSDとfine-tuningを利用した分類語彙表の語義の分散表現の構築2019

    • 著者名/発表者名
      柳沼 大輝, 古宮 嘉那子, 新納 浩幸
    • 学会等名
      言語資源活用ワークショップ 2019
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 単語区切りの違いによるQAサイトの質問回答ペアの分類2019

    • 著者名/発表者名
      佐々木稔, 古宮嘉那子
    • 学会等名
      IDRユーザフォーラム 2019
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Bilingual Word Embeddingsによる『岩波国語辞典』の語義と『分類語彙表』の語義の対応付け2019

    • 著者名/発表者名
      平林照雄, 古宮 嘉那子, 新納浩幸
    • 学会等名
      言語処理学会第25回年次大会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Fine-tuning for Named Entity Recognition Using Part-of-Speech Tagging2018

    • 著者名/発表者名
      Masaya Suzuki, Kanako Komiya, Minoru Sasaki and Hiroyuki Shinnou
    • 学会等名
      The 32nd Pacific Asia Conference on Language, Information and Computation
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] Detecting Unknown Word Senses in Contemporary Japanese Dictionary from Corpus of Historical Japanese2018

    • 著者名/発表者名
      Aya Tanabe, Kanako Komiya, Masayuki Asahara, Minoru Sasaki and Hiroyuki Shinnou
    • 学会等名
      Japanese Association for Digital Humanities 2018
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [図書] 機械学習教本2019

    • 著者名/発表者名
      柴原 一友、築地 毅、古宮 嘉那子、宮武孝尚、小谷 善行
    • 総ページ数
      240
    • 出版者
      森北出版
    • ISBN
      9784627854512
    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2018-04-23   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi