• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

コーパスによる日本語のレジスターモデルの研究

研究課題

研究課題/領域番号 13F03303
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

田中 牧郎  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授

研究分担者 HODOSCEK Bor  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 外国人特別研究員
キーワードコーパス / メタデータ / レジスター / データマイニング
研究概要

25年度では、本研究の目的①である現代日本語書き言葉均衡コーパスBCCWJにおけるレジスターモデルの構築を中心に研究を行った。その中でも、BCCWJにおけるメディアラベルおよび他のメタデータとレジスターの差異を報告することに焦点を当てた。そのために、BCCWJのメディアラベルおよびメタデータがレジスター分析にもたらす影響およびレジスター分析を行う際の注意点についてデータマイニング手法(Sub-group DiscoveryおよびExceptional Model Mining)を用いて調査し、その成果を第19回公開シンポジウム「人文科学とデータベース」(2013年11月30日、立命館大学)と第5回コーパス日本語学ワークショップ(2014年3月6日~7日、国立国語研究所)にて学会発表した。国立国語研究所の同ワークショップでも、言語資源(リソース)に関する指定討論を担当した。「じんもんこんシンポジウム2013」(2013年12月9-14日、京都大学)では、レジスターモデルの元となる言語特徴の抽出について学会発表した。これらの研究によりレジスターをコーパスで扱う以上での要点が明らかになり、本研究の目的②であるレジスターモデルを応用した検索システムの開発の準備ができたと思われる。研究発表はまだ行っていないが、その結果に基づき、レジスターのモデルの基盤となるメタデータをシステムの開発に応用する開発作業も開始している。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

レジスターモデルの構築に必要なメタデータの整備が概ね完了している。システムのユーザビリティ評価は25年度に行わず26年度に実施するが、本研究の達成に影響しないと思われる。

今後の研究の推進方策

今後はシステムの開発とそのユーザビリティ調査を中心に実施する。

  • 研究成果

    (3件)

すべて 2014 2013

すべて 学会発表 (3件)

  • [学会発表] コーパスのメタデータを用いた日本語におけるレジスターのモデル化2014

    • 著者名/発表者名
      HODOSCEK Bor
    • 学会等名
      第5回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所、東京
    • 年月日
      20140306-07
  • [学会発表] 現代日本語コーパス比較分析のための中間語彙層の抽出と応用2013

    • 著者名/発表者名
      HODOSCEK Bor、山元啓史
    • 学会等名
      人文科学とコンピュータシンポジウム「じんもんこん2013」
    • 発表場所
      京都大学、京都
    • 年月日
      2013-12-12
  • [学会発表] The role of metadata in the Balanced Corpus of Contemporary Written Japanese in the analysis of register2013

    • 著者名/発表者名
      HODOSCEK Bor、山元啓史
    • 学会等名
      第19回公開シンポジウム「人文科学とデータベース」
    • 発表場所
      立命館大学アート・リサーチセンター(京都府京都市北区)
    • 年月日
      2013-11-30

URL: 

公開日: 2015-07-15  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi