• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

LCTLを含む多言語平行マルチメディア資源の構築と構造化方式の研究

研究課題

研究課題/領域番号 19300047
研究機関大阪大学

研究代表者

堀 一成  大阪大学, 大学教育実践センター, 准教授 (80270346)

研究分担者 竹原 新  大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
小島 一秀  大阪大学, サイバーメディアセンター, 講師 (60372637)
上原 順一  大阪大学, 言語文化研究科, 准教授 (30252737)
鈴木 慎吾  京都産業大学, 外国語学部, 助教 (20513360)
キーワード外国語 / 多言語処理 / コンテンツ・アーカイブ / 言語資源 / XML / GDA / LCTL
研究概要

本年度は、最終年度にあたるため、言語資源の最終蓄積作業、言語資源構築作業用ソフトウェア開発の進行、これまでの結果取りまとめと学会発表を行った。
言語資源の構築作業は、英語のGDAに基づく肌構造化会話文集(1000文)を完成させた。また、前年度から着手していたトルコ語会話文のXML構造化作業を、挨拶文などを中心とする基本会話部分(100文強)について進展させた。これにより、肌構造化した会話文集は、英語・日本語・ペルシア語についてはそれぞれ1000文、トルコ語については約100文が完成したことになる。前年度までに構築済みの構造化されていない会話文集(1000文)は12言語分、そのうちの5言語分に対応する音声データ、日本語頻度情報により選定した基本語5000単語(7言語分)に、上記データが加わったことになる。これらの成果を取りまとめ、2011年3月の言語処理学会第17回年次大会で報告した。
外国語専攻の作業者が統語情報とオントロジー情報を共に言語資源に付加するためのソフトウェア開発を行った。この成果は2010年9月の第9回情報科学技術フォーラムに査読論文を投稿するとともに発表を行った。また、形態素解析エンジンMeCabでロシア語処理が円滑に行えるよう、辞書の開発手法についても研究を行い、論文として発表した。
2011年3月に東北および関東地方で大地震と津波による被害が発生した。本課題で作成した言語資源の一部を、在留外国人被災者の救援活動に役立ててもらえるよう整理し、ネット上で提供している。

研究成果

(4件)

すべて 2011 2010 その他

すべて 雑誌論文 学会発表 備考

  • [雑誌論文] MeCabで利用可能なロシア語辞書について2011

    • 著者名/発表者名
      上原順一
    • 雑誌名

      言語文化研究

      巻: 37号(印刷中)

    • 査読あり
  • [雑誌論文] 多言語資源作成のための統語・オントロジー情報を付与するアプリケーションの開発2010

    • 著者名/発表者名
      鈴木慎吾、山崎直樹、堀一成
    • 雑誌名

      第9回情報科学技術フォーラム論文集 第4分冊

      ページ: 119-122

    • 査読あり
  • [学会発表] GDAに基づく統語情報付与XML化多言語並行資源の構築2011

    • 著者名/発表者名
      堀一成, 他5名
    • 学会等名
      言語処理学会 第16回年次大会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2011-03-08
  • [備考] 大阪大学 多言語資源研究グループ Webページ

    • URL

      http://mldb.cep.osaka-u.ac.jp/

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi