• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

語構成を考慮した多言語の語彙および用語解析システムの研究開発

研究課題

研究課題/領域番号 18300051
研究機関奈良先端科学技術大学院大学

研究代表者

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

研究分担者 乾 健太郎  奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (60272689)
浅原 正幸  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80379528)
橋本 喜代太  大阪府立大学, 人間社会学部, 助教授 (50278818)
キーワード自然言語処理 / 辞書 / 用語解析 / 形態素解析 / 語構成 / 多言語処理 / 複合語 / コロケーション
研究概要

次の3項目に分けて研究を実施した.
(1)中国語および日本語の合成語の語構成の整理と分類:これまで作成してきた中国語と日本語の辞書に存在する合成語を中心に,語構成の分析と分類を行った.合成語を複合語と派生語に分類し、前者については、構成語間の文法関係についての分類を行なった。また、後者については派生接辞(拘束形態素)の分類を行なった。日本語辞書については、次の視点によって複合表現の分類を行い,辞書に登録すべき合成語の整理を行なった.
(1)文法的振る舞い(例えば,品詞)が変化するもの.
(2)全体の意味が構成語だけから予測できないもの.
(3)読みが構成語の読みをつなげたものではなく音韻的変化を起こすもの.
(4)専門用語など,それ自体で特定の意味をもつもの.
(2)言語解析用辞書の語彙項目の拡充および各登録語の語構成記述:日本語形態素解析器「茶笙」で用いている辞書に含まれる複合語について,語構成の記述を網羅的に行った.また,大規模な未解析データにおける出現頻度を考慮して,未知語処理の解析精度を向上させる手法を考案し,辞書に不足する語を大規模な言語データから自動抽出する方法について検討した.
(3)複合表現・専門用語の自動解析手法の開発:特定の分野に頻出する用語の抽出と意味分類について基礎的な手法の開発と実験を行った.インターネット上で構築が進んでいるWikipediaを対象とし、そのDOM構造を利用して,高い精度で用語の分類を行なう手法を提案した.

  • 研究成果

    (4件)

すべて 2006

すべて 雑誌論文 (4件)

  • [雑誌論文] Machine Learning-based Methods to Chinese Unknown Word Detection and POS Tag Guessing2006

    • 著者名/発表者名
      Chooi-Ling Goh, Masayuki Asahara, Yuji Matsumoto
    • 雑誌名

      Journal of Chinese Language and Computing 16・4

      ページ: 85-206

  • [雑誌論文] 言語資源を活用した実用的な対訳表現抽出2006

    • 著者名/発表者名
      北村美穂子, 松本裕治
    • 雑誌名

      自然言語処理 13・1

      ページ: 3-25

  • [雑誌論文] 動詞項構造辞書への大規模用例付与2006

    • 著者名/発表者名
      平野徹, 飯田龍, 藤田篤, 乾健太郎, 松本裕治
    • 雑誌名

      自然言語処理 13・3

      ページ: 113-132

  • [雑誌論文] The Construction of a Dictionary for a Two-layer Chinese Morphological Analyzer2006

    • 著者名/発表者名
      Chooi-Ling Goh, Jia Lu, Yuchang Cheng, Masayuki Asahara, Yuji Matsumoto
    • 雑誌名

      Proceedings of the 20th Pacific Asia Conference on Language Information and Computation 20

      ページ: 332-340

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi