• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

LCTLを含む多言語平行マルチメディア資源の構築と構造化方式の研究

研究課題

研究課題/領域番号 19300047
研究機関大阪大学

研究代表者

堀 一成  大阪大学, 大学教育実践センター, 准教授 (80270346)

研究分担者 竹原 新  大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
小島 一秀  大阪大学, サイバーメディアセンター, 講師 (60372637)
上原 順一  大阪大学, 言語文化研究科, 准教授 (30252737)
鈴木 慎吾  京都産業大学, 外国語学部, 助教 (20513360)
キーワード外国語 / 多言語処理 / コンテンツ・アーカイブ / 言語資源 / XML / GDA / LCTL
研究概要

本年度は主に、統語情報とオントロジー情報を共に言語資源に付加する作業のためのソフトウェア開発、タグ付きペルシア語資源の充実、ロシア語音声資源の構築を行った。また、年度当初には予定していなかったタグ付きトルコ語資源の構築作業も開始した。
一昨年度から開発を開始している、外国語学専攻の作業者用タグ付き言語資源作成支援ツールについては、昨年度開発したオントロジー情報付加のための機能と、一昨年度来開発を継続している統語情報付加のための機能を統一し、オントロジー情報をXMLデータの属性として付与できるようFLASHアプリケーションを改良した。この成果は平成22年3月の言語処理学会で発表した。このツールを用いて言語資源構築作業をするうち、従来のタグ付け方式であるGDAの多言語対応に対する不備な点が明らかになり、現在その改良となるタグ付加方式の提案をすべく研究中である。
ペルシア語資源については、基本会話文1000文のGDAによる構造化の作業を補足的に行った。これに加え、日本語の基本会話文1000文のGDAによる構造化の作業も行った。補足的な作業は今後もあり得るが、ほぼ作業は終了した。これらの作業はいずれも補助者を活用して行った。
ロシア語の言語資源構築については、テーマごとに11の部分に分れている1000以上のフレーズを含む会話集の録音を完了した。また、この音声資料の編集作業を開始した。いずれも雇用した大学院生などの支援を得ている。
トルコ語資源については、ペルシア語で構築済みのデータを参考に、基本的な会話文100文程度を選び、同内容のトルコ語会話文データとそのGDAタグ付け作業を進めた。

研究成果

(2件)

すべて 2010 その他

すべて 学会発表 備考

  • [学会発表] 多言語資源作成のための統語属性付与支援FLASHアプケーションの開発2010

    • 著者名/発表者名
      鈴木慎吾・山崎直樹・堀一成
    • 学会等名
      言語処理学会・第16回年次大会
    • 発表場所
      東京大学 本郷キャンパス
    • 年月日
      2010-03-10
  • [備考] 大阪大学 多言語資源研究グループ Webページ

    • URL

      http://mldb.cep.osaka-u.ac.jp/

URL: 

公開日: 2011-06-15   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi