• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

Webからの能動的候補獲得による専門用語対訳辞書の自動拡張

研究課題

研究課題/領域番号 24650122
研究機関東京大学

研究代表者

影浦 峡  東京大学, 大学院情報学環・学際情報学府, 教授 (00211152)

研究分担者 竹内 孔一  岡山大学, 自然科学研究科, 講師 (80311174)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード専門語彙 / Webクローリング / 対訳抽出 / 語彙成長 / 語彙ネットワーク
研究実績の概要

今年度は技術的な評価を進めるとともに、本研究の概念全体についても整理を行った。
(a) 語彙の構造を反映した語彙成長モデルについては、漢語・外来語の語構成要素の成長の違いを、検討に用いた6分野の用語集について明らかにし、また、語構成要素ネットワーク(語構成要素を頂点、用語中での共起を辺として定義される)を使って、漢語と外来語語構成要素の語彙における役割をモデル化した(これらは分野によって大きくことなる)。
(b) Webクローラとしては、apiを置換え、また検証用のコーパスのうち、計算機科学分野のコーパスがコーパス収集の際の日本語キーワード選択が適切でなかったため小さなものとなってしまったことからその再収集を行い、実験条件を整備するとともに、前年度に行った二部グラフ分割に基づく候補語生成と対訳対応付けだけでなく、語彙ネットワークをpartitive clusteringに基づき語彙分割し予め部分語彙に分けた上で候補語を生成する手法の検討を行なっている。
(c) 見出し語集合をどのように確定するかは辞書学における最大の未解決問題であり、コーパスの頻度などは参考にされてはいるものの、これまでのところ、現実には辞書編集者が経験により決めてきたところが大きい。本研究では、(b)の検証実験におちえいわゆる自然言語処理応用として見たときに、対訳抽出において既往のコーパスベースの手法以上のパフォーマンスを出していることが確認できているが(ただし抽出される用語の範囲が異なるためそれほど数値比較は意味のあるものではない)、それに加えて、今年度は、本研究の萌芽としての意味を整理し、本研究が、辞書学の未解決課題に対して、専門用語は複合語が多いという特徴を利用したため専門用語辞書にしか今のところ適用は保証されないとはいえ、一定の道筋を示したことを明らかにした。

  • 研究成果

    (4件)

すべて 2015 2014

すべて 学会発表 (2件) (うち招待講演 1件) 図書 (2件)

  • [学会発表] Terminology-driven terminology augmentation2014

    • 著者名/発表者名
      Koichi Takeuchi and Kyo Kageura
    • 学会等名
      The 14th China-Japan Natural Language Processing Joint Research Promotion Conference
    • 発表場所
      Chengdu
    • 年月日
      2014-10-12 – 2014-10-14
  • [学会発表] The sphere of terminology: between ontological system and textual corpora2014

    • 著者名/発表者名
      Kyo Kageura
    • 学会等名
      Terminology and Knowledge Engineering
    • 発表場所
      Berlin
    • 年月日
      2014-06-19 – 2014-06-21
    • 招待講演
  • [図書] Dury, et al. eds. La Neologie en Langue de Specialite ("Augmenting terminology by crawling new term translation pairs from textual corpora")2015

    • 著者名/発表者名
      Kyo Kageura
    • 総ページ数
      275
    • 出版者
      CRTT
  • [図書] Kockaert and Steurs, eds. Hadbook of Terminology ("Terminology and lexicography")2015

    • 著者名/発表者名
      Kyo Kageura
    • 総ページ数
      872
    • 出版者
      John Benjamins

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi