• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

語構成を考慮した多言語の語彙および用語解析システムの研究開発

研究課題

研究課題/領域番号 18300051
研究機関奈良先端科学技術大学院大学

研究代表者

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

研究分担者 乾 健太郎  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (60272689)
浅原 正幸  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80379528)
橋本 喜代太  大阪府立大学, 人間社会学部, 准教授 (50278818)
キーワード自然言語処理 / 辞書 / 用語解析 / 形態素解析 / 語構成 / 多言語処理 / 複合語 / コロケーション
研究概要

次の3項目に分けて研究を実施した.
(1)中国語および日本語の合成語の語構成の整理と分類:中国語と日本語の合成語を複合語と派生語に分類し、語構成に関する分類を行なった。特に、中国語の3文字からなる合成語について、構造の記述を網羅的に行い、自動分類に関する実験を行った。
(2)言語解析用辞書の語彙項目の拡充:形態素解析器「茶筌」用の辞書の拡張を目指して、大規模テキストからの未知語の自動抽出に関する検討を行った。また、中国語と日本語の新規の複合語の抽出と登録を行った。中国語について、合討約13万語の辞書を構築した。
(3)複合表現・専門用語の自動解析手法の開発:特定の分野に頻出する用語の抽出と意味分類を目指し、Web上の大規模なデータからの自動抽出に関する研究を行った.特に、インターネット上で構築が進んでいるWikipediaを対象とし、そのDOM構造を利用して,用語の意味分類を行なう手法を提案し、固有表現辞書の自動構築を行った。

  • 研究成果

    (4件)

すべて 2008 2007 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件) 備考 (1件)

  • [雑誌論文] 大域的な情報を用いた未知語の品詞推定2008

    • 著者名/発表者名
      中川哲治, 松本裕治
    • 雑誌名

      情報処理学会論文誌 49

      ページ: 1437-1450

    • 査読あり
  • [雑誌論文] アラインメントと機械学習を応用した並列句解析2007

    • 著者名/発表者名
      原 一夫, 新保 仁, 松本 裕治
    • 雑誌名

      人工知能学会論文誌 22

      ページ: 248-255

    • 査読あり
  • [学会発表] Analyzing Chinese Synthetic Words with Tree-based Information and a Survey on Chinese Morphologically Derived Words2008

    • 著者名/発表者名
      Jia Lu, Masayuki Asahara and Yuji Matsumoto
    • 学会等名
      SIGHAN Workshop on Chinese Language Processing
    • 発表場所
      Hyderabad, India
    • 年月日
      2008-01-11
  • [備考]

    • URL

      http://cl.naist.jp/

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi