研究課題/領域番号 |
14701020
|
研究種目 |
若手研究(A)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 国立情報学研究所 |
研究代表者 |
COLLIER Nigel (COLLIERNIGEL Nigel) 国立情報学研究所, 情報学基礎研究系, 助教授 (60333275)
|
研究期間 (年度) |
2002 – 2003
|
研究課題ステータス |
完了 (2003年度)
|
配分額 *注記 |
25,090千円 (直接経費: 19,300千円、間接経費: 5,790千円)
2003年度: 11,050千円 (直接経費: 8,500千円、間接経費: 2,550千円)
2002年度: 14,040千円 (直接経費: 10,800千円、間接経費: 3,240千円)
|
キーワード | セマンティク ウェブ / テキスト マイニング / 情報抽出 / アノテーション / オントロジー / 自然言語処理 |
研究概要 |
PIAプロジェクトには2つの重要な特徴がある。(1)専門家が構築したオントロジーを使い、人手によってアノテートされたウェブページからの機械学習に基づいてウェブを自動的にアノテートできる高性能アノテーションサーバーの構築と、(2)機械学習をサポートするためのオントロジープリミティブの集合に基づいたオントロジーサーバーのデザインである。 全体の目標をかんがみて、今年度の進行状況を報告する。 (1)オントロジーサーバーのためのメタオントロジの実装に成功し、その結果は2003年度のKESに掲載された。 (2)同一指示アノテーションの広範なガイドラインは2004年度LRECに掲載された。 (3)オントロジーフォージクライアントの展開と生物学及び文化遺産分野でのケーススタディの発表(2003年度SWFAT,2003年度GIW,2003年度DSR) (4)ラベル付トレイニングサンプルから機械学習を使って、技術用語の自動的アノテーションのサポートベクターマシーンの長期テスト。その結果は"Journal of Artificial Intelligence in Medicine"の特別号と2004年度特別号"Journal of BioInformatics"に発表される。 更に2004COLINGにおいてこの研究分野で主要ワークショップを開くことになった。このワ-クショップは"The International Joint Workshop on Natural Language Processing in Biomedicine and it's Applications (BioNLP/NLPBA 2004)"と呼ばれ、技術用語の自動アノテーションのタスク共有も行う。このワークショップにはこの分野の主な研究者が集まって議論し、自然言語処理学分野と生物学分野におけるこの研究の重要性に焦点をあてる。
|