• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

LCTLを含む多言語平行マルチメデオア資源の構築と構造化方式の研究

研究課題

研究課題/領域番号 19300047
研究機関大阪大学

研究代表者

堀 一成  大阪大学, 大学教育実践センター, 准教授 (80270346)

研究分担者 竹原 新  大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹  関西大学, 外国語教育研究機構, 教授 (30230402)
小島 一秀  大阪大学, サイバーメディアセンター, 講師 (60372637)
石島 悌  大阪府立産業技術総合研究所, 情報電子部, 主任研究員 (80359398)
上原 順一  大阪大学, 言語文化研究科, 准教授 (30252737)
キーワード外国語 / 多言語処理 / コンテンツ・アーカイブ / 言語資源 / XML / GDA / LCTL
研究概要

本年度は主に、言語資源タグ付け方式の検討のための作業とサポートソフトウェアの開発、ペルシア語資源へのタグ付け試行・ロシア語資源の構築、携帯端末への資源データ搭載調査作業を行った。
本プロジェクトで独自に選定した「言語学的た興味深い文100」(オリジナルは日本語)に,統語情報を示すタグをつける作業を進め,完成させた。また,これを中国語に翻訳し,同様のタグ付け作業を進めた。今後は,これをタグ付けのためのガイドラインとして,日本語と中国語の文法情報付きデータをさらに拡充していく予定である。また,さらに他の言語に翻訳して,タグ付け作業を進める予定である。また作業を補助するためのFLASHソフトウェアを開発し、その成果を言語処理学会で発表する。購入物品の防音室を導入し、録音作業可能な体制を整えた。
GDA化の作業を進めていたペルシア語の会話データについて、試験的に分野ごとによるXMLデータ化の作業を行った。文単位でID番号を付与し、言語名(ペルシア語)を識別するためのデータを付与した。この結果、作成したデータは、ID番号を付与された各文章において、日本語、英語、ペルシア語が並記され、且つ、ペルシア語の部分はGDA方式により構造化された状態となり、試験的とはいえデータとして一通りの完成となった。
ロシア語の言語資源構築については、会話リストにロシア語部分を追加する作業を行った。このリストには約1100項目が記載されており、結果的に、ほぼ全体についてロシア語文を記載することができた。ロシア語文の記載に際しては、文体的なニュアンスは母語話者の判断を尊重した。
携帯端末への応用としてWindows Mobile端末への資源搭載作業を行っているがフォントの扱いに問題があることがわかった。対処方法を検討中である。

  • 研究成果

    (2件)

すべて 2008 その他

すべて 学会発表 (1件) 備考 (1件)

  • [学会発表] 多言語資源作成のための文構造タグ付加支援FLASHアプリケーションの開発2008

    • 著者名/発表者名
      鈴木慎吾・山崎直樹・堀一成
    • 学会等名
      言語処理学会・第14回年次大会
    • 発表場所
      東京大学・駒場キャンパス
    • 年月日
      2008-03-18
  • [備考] 多言語同時処理室Webページ

    • URL

      http://mlang1.minoh.osaka-u.ac.jp/

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi