研究分担者 |
橋田 浩一 独立行政法人産業技術総合研究所, サイバーアシスト研究センター, 副所長
佐藤 理史 京都大学, 情報学研究科, 助教授 (30205918)
河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)
駒谷 和範 京都大学, 情報学研究科, 助手 (40362579)
|
研究概要 |
GDA(Global Data Annotation)の標準化、応用、その周辺技術について次のような研究成果を得た. (1)GDAによる実際データのタグ付け:毎日新聞10年分中の200記事について、GDAに基づいた照応・共参照を含めたタグ付けを行った.このデータは、産総研より公開予定. (2)GDA概念のMPEG-7標準への組込み:MPEG-7の言語データの意味構造記述方式であるMDSのLinguistic DSに対する,GDAとUNL(Universal Network Language)に基づいて行った提案がMPEG-7第2版WD(Working Draft)に組み入れられた。また、ISO/TC37/SC4の言語資源管理の標準化との整合性を現在調整中である.さらに、簡単なGDA・UNL変換により、GDAタグ付き日本語文の英語・イタリア語・スペイン語・アラビア語への自動翻訳の可能性も示すことができた。 (3)音楽情報のMPEG-7タグ付けの検討:MPEG-7では音楽データの記述方法における問題点として、人工知能でのオントロジーと同様の問題を内在していることを指摘し,楽器音識別のための楽器カテゴリー自動構築法と未知楽器の識別法を開発した. (4)音声会議録の自動話者インデキシング:複数話者が交代で話している音声会議を取り上げ,大量対話データを用いた事前学習による多数話者モデルの獲得,及び,衆議院速記録から得られたドメイン知識を用いた専門用語への対応により,話者認識を用いた高性能の話者インデキシングを開発した. (5)プライバシー重視のアクセス法:言語データや会議録,さらには,音楽データへのアクセス法として,セキュリティとともに、プライバシーを重視した手法を提案し、その有効性を実証するために,SPKI(Simpleな公開鍵暗号基盤)に基づいた手法を開発し,Webサーバに実現をした.
|