• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2003 年度 実績報告書

専門用語における新語の寿命を予測するモデルの構築

研究課題

研究課題/領域番号 15700216
研究機関国立情報学研究所

研究代表者

辻 慶太  国立情報学研究所, 人間・社会情報研究系, 助手 (30333545)

キーワード専門用語 / 新語 / 時系列 / 自動抽出 / コーパス
研究概要

本研究は,専門分野に現れた新語の中から,専門用語として普及する語を自動的に特定する手法・モデルの開発を目指すものである。そのような目的のもと本年度は,(1)英語の学術雑誌と会議録の本文を,扱いやすいテキストデータとして整備する作業を重点的に行った。本研究は時系列的な計量言語学研究を目指すものであるが,それに適したデータは現在少ない為,上記の作業が必要であった。その結果,Journal of the American Society for Information Science and TechnologyとSIGIRの会議録に含まれる論文,それぞれ1025個,712個をテキスト形式で整備した。(2)語形成にはいくつかのタイプがあるが,本年度は2つの名詞の複合によって生み出された語を調査対象新語とした。また専門用語として普及する,寿命を保つとはどういうことかについて考察を深め,分野においてよく用いられる語,専門的な概念と結びついた語などいくつかの分類可能なタイプを考えた。(3)そして新語の中からそれぞれのタイプに成長する語の自動特定を目指し,これまで提案されてきた専門用語自動抽出手法のいくつかを適用し,有効性を検証した。その結果,概念と結びついた語になる新語の特定にはTFIDFの利用が効果的であること,よく用いられる語の特定には,語構成要素の名詞の出現頻度と共起頻度及び両者の増加率への着目が効果的であることが確認された。

  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] 辻慶太, 芳鐘冬樹: "専門分野において重要となる新語の特定に向けた基礎研究"言語処理学会第10回年次大会発表論文集. 189-192 (2004)

  • [文献書誌] 辻慶太, 芳鐘冬樹: "専門用語として普及しそうな語の自動抽出"第51回日本図書館情報学会研究大会発表要綱. 105-108 (2003)

URL: 

公開日: 2005-04-18   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi