• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

語構成を考慮した多言語の語彙および用語解析システムの研究開発

研究課題

研究課題/領域番号 18300051
研究機関奈良先端科学技術大学院大学

研究代表者

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

研究分担者 乾 健太郎  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (60272689)
浅原 正幸  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80379528)
橋本 喜代太  大阪府立大学, 人間社会学部, 准教授 (50278818)
キーワード複合語解析 / 辞書システム / 自然言語処理 / 未知語解析 / 多言語処理 / 形態素解析
研究概要

日本語および中国語の複合語の語構成分類を統語および意味関係に基づいて行い,内部構造情報の記述法を考案した.また,複合語の内部構造記述を行うためのインタフェースと検索機能を備えた辞書管理システムを開発した.今年度行った具体的な研究開発事項は以下の通りである.
(1)統語および意味分類にもとづく複合語の構造の分析と複合語内部構造記述法の設定:複合語を構成する構成語間の統語および意味関係に基づく分類を行った.特に,日本語専門用語については,文字単位による係り受けによって,縮退を伴う複合現象の記述が可能なタグ付け手法を提案した.
(2)言語解析用辞書の語彙項目の拡充と語構成記述の表示機能をもったユーザインタフェースの開発:綴り,読み,品詞,構成語など複合語のもつ種々の情報を指定して,任意の語を検索し,内部構造表示する検索機能,および,複合語の内部構造タグ付け支援機能を有した辞書システムを構築した.
(3)専門用語および固有表現の自動抽出手法の開発:Wikipediaからの固有表現の自動抽出,および,専門分野の文書からの用語抽出と自動分類に関する研究を行った.
(4)複合語・専門用語の自動解析手法:複合語の内部構造の自動解析を行うために,機械学習に基づく解析手法を開発した.また,機械学習の訓練およびテストデータとして用いるため,日本語および中国語それぞれ約800語の複合語・専門用語の内部構造タグ付けを行った.

  • 研究成果

    (3件)

すべて 2008

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件)

  • [雑誌論文] Anayz ing Chinese Synthetic Words with Tree-based Information and a Survey on Chinese Derived Words2008

    • 著者名/発表者名
      Jia Lu
    • 雑誌名

      International Journal of Computer Processing of Language 2 1

      ページ: 101-122

    • 査読あり
  • [雑誌論文] グラフ構造を持つ条件付確率場によるWikipedia文書中の固有表現分類2008

    • 著者名/発表者名
      渡邉陽太郎
    • 雑誌名

      人工知能学会論文誌 2 3

      ページ: 245-254

    • 査読あり
  • [学会発表] コーパス自動解析ツールと利用環境について2008

    • 著者名/発表者名
      松本裕治
    • 学会等名
      関西言語学会第33回大会
    • 発表場所
      大阪樟蔭女子大学
    • 年月日
      2008-06-08

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi