• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

LCTLを含む多言語平行マルチメデオア資源の構築と構造化方式の研究

Research Project

Project/Area Number 19300047
Research InstitutionOsaka University

Principal Investigator

堀 一成  Osaka University, 大学教育実践センター, 准教授 (80270346)

Co-Investigator(Kenkyū-buntansha) 竹原 新  大阪大学, 世界言語研究センター, 准教授 (20324874)
山崎 直樹  関西大学, 外国語教育研究機構, 教授 (30230402)
小島 一秀  大阪大学, サイバーメディアセンター, 講師 (60372637)
石島 悌  大阪府立産業技術総合研究所, 情報電子部, 主任研究員 (80359398)
上原 順一  大阪大学, 言語文化研究科, 准教授 (30252737)
Keywords外国語 / 多言語処理 / コンテンツ・アーカイブ / 言語資源 / XML / GDA / LCTL
Research Abstract

本年度は主に、言語資源タグ付け方式の検討のための作業とサポートソフトウェアの開発、ペルシア語資源へのタグ付け試行・ロシア語資源の構築、携帯端末への資源データ搭載調査作業を行った。
本プロジェクトで独自に選定した「言語学的た興味深い文100」(オリジナルは日本語)に,統語情報を示すタグをつける作業を進め,完成させた。また,これを中国語に翻訳し,同様のタグ付け作業を進めた。今後は,これをタグ付けのためのガイドラインとして,日本語と中国語の文法情報付きデータをさらに拡充していく予定である。また,さらに他の言語に翻訳して,タグ付け作業を進める予定である。また作業を補助するためのFLASHソフトウェアを開発し、その成果を言語処理学会で発表する。購入物品の防音室を導入し、録音作業可能な体制を整えた。
GDA化の作業を進めていたペルシア語の会話データについて、試験的に分野ごとによるXMLデータ化の作業を行った。文単位でID番号を付与し、言語名(ペルシア語)を識別するためのデータを付与した。この結果、作成したデータは、ID番号を付与された各文章において、日本語、英語、ペルシア語が並記され、且つ、ペルシア語の部分はGDA方式により構造化された状態となり、試験的とはいえデータとして一通りの完成となった。
ロシア語の言語資源構築については、会話リストにロシア語部分を追加する作業を行った。このリストには約1100項目が記載されており、結果的に、ほぼ全体についてロシア語文を記載することができた。ロシア語文の記載に際しては、文体的なニュアンスは母語話者の判断を尊重した。
携帯端末への応用としてWindows Mobile端末への資源搭載作業を行っているがフォントの扱いに問題があることがわかった。対処方法を検討中である。

  • Research Products

    (2 results)

All 2008 Other

All Presentation (1 results) Remarks (1 results)

  • [Presentation] 多言語資源作成のための文構造タグ付加支援FLASHアプリケーションの開発2008

    • Author(s)
      鈴木慎吾・山崎直樹・堀一成
    • Organizer
      言語処理学会・第14回年次大会
    • Place of Presentation
      東京大学・駒場キャンパス
    • Year and Date
      2008-03-18
  • [Remarks] 多言語同時処理室Webページ

    • URL

      http://mlang1.minoh.osaka-u.ac.jp/

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi