• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

専門分野テキストコーパスからの体系化された用語抽出

研究課題

研究課題/領域番号 19500135
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関国立情報学研究所

研究代表者

小山 照夫  国立情報学研究所, 情報社会相関研究系, 教授 (80124410)

研究分担者 竹内 孔一  岡山大学, 大学院・自然科学研究科, 講師 (80311174)
研究期間 (年度) 2007 – 2009
研究課題ステータス 完了 (2009年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2009年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2008年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2007年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード用語抽出 / 用語体系化 / 自然言語処理 / 形態素解析 / 部分研究領域 / 複合語構造解析 / 部分研究領域同定 / 用語分類 / 語彙概念構造
研究概要

本研究ではまず、専門分野テキストコーパスに出現する複合語用語を、高い精度で網羅的に抽出する手法を確立した。日本語名詞形態素の内で、複合語構成上制約のあるものを整理し、また、形態素解析誤りの影響を受けやすい部分からの候補抽出を避けることによって、一定の抽出精度を保ちながら、コーパス内出現頻度の低いものまで網羅的に用語を抽出することが可能となる。本研究ではまた、複合語の入れ子関係を用いた用語の階層的構造化と、部分研究領域に強く関連する形態素を選択し、これらの形態素を要素として含む複合語を選択することにより、部分研究領域に関連づけた用語体系化が可能となる事を明らかとした。

報告書

(4件)
  • 2009 実績報告書   研究成果報告書 ( PDF )
  • 2008 実績報告書
  • 2007 実績報告書
  • 研究成果

    (12件)

すべて 2010 2009 2008 2007 その他

すべて 雑誌論文 (5件) 学会発表 (5件) 備考 (2件)

  • [雑誌論文] 日本語テキストからの複合語用語抽出2010

    • 著者名/発表者名
      小山照夫
    • 雑誌名

      情報知識学会誌 vol.19、No.4

      ページ: 306-315

    • NAID

      10025992156

    • 関連する報告書
      2009 研究成果報告書
  • [雑誌論文] 日本語テキストからの複合語用語抽出2010

    • 著者名/発表者名
      小山照夫
    • 雑誌名

      情報知識学会誌 19

      ページ: 306-315

    • NAID

      10025992156

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] 形態素出現パタンに基づく文書集合類似性評価2008

    • 著者名/発表者名
      小山照夫, 竹内孔一
    • 雑誌名

      情報処理学会研究報告2008-NL-188 2008-NL-188

      ページ: 51-56

    • NAID

      110007082300

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 用語クラスタリングに基づく部分研究領域推定と用語分類2008

    • 著者名/発表者名
      小山照夫、竹内孔一
    • 雑誌名

      情報処理学会研究報告 2008-NL-183

      ページ: 87-92

    • NAID

      110006623479

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] 日本語複合語用語の入れ子関係に基づく体系的階層化2007

    • 著者名/発表者名
      小山照夫、竹内孔一
    • 雑誌名

      電子情報通信学会技術研究報告 NLC2007-1-28

      ページ: 49-54

    • 関連する報告書
      2007 実績報告書
  • [学会発表] 候補の接続関係を考慮した複合語用語抽出2009

    • 著者名/発表者名
      小山照夫、竹内孔一
    • 学会等名
      情報処理学会研究報告、情報処理学会
    • 発表場所
      京都大学
    • 年月日
      2009-09-29
    • 関連する報告書
      2009 研究成果報告書
  • [学会発表] 候補の接続関係を考慮した複合語用語抽出2009

    • 著者名/発表者名
      小山照夫
    • 学会等名
      情報処理学会自然言語処理研究会
    • 発表場所
      京都大学
    • 年月日
      2009-09-29
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 形態素出現パタンに基づく文書集合類似性評価2008

    • 著者名/発表者名
      小山照夫、竹内孔一
    • 学会等名
      情処研報, 情報処理学会
    • 発表場所
      九州大学
    • 年月日
      2008-11-26
    • 関連する報告書
      2009 研究成果報告書
  • [学会発表] 用語クラスタリングに基づく部分研究領域推定と用語分類2008

    • 著者名/発表者名
      小山照夫、竹内孔一
    • 学会等名
      情処研報、情報処理学会
    • 発表場所
      国立情報学研究所
    • 年月日
      2008-01-22
    • 関連する報告書
      2009 研究成果報告書
  • [学会発表] 日本語複合語用語の入れ子関係に基づく階層的体系化、信学技報2007

    • 著者名/発表者名
      小山照夫、竹内孔一
    • 学会等名
      電子情報通信学会
    • 発表場所
      徳島大学
    • 年月日
      2007-07-24
    • 関連する報告書
      2009 研究成果報告書
  • [備考]

    • URL

      http://research.nii.ac.jp/~koyama/official/tmrec/

    • 関連する報告書
      2009 研究成果報告書
  • [備考]

    • URL

      http://research.nii.ac.jp/~koyama/official/tmrec/index.html

    • 関連する報告書
      2009 実績報告書

URL: 

公開日: 2007-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi