2013 Fiscal Year Annual Research Report
Project/Area Number |
13F03303
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
田中 牧郎 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授
|
Co-Investigator(Kenkyū-buntansha) |
HODOSCEK Bor 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 外国人特別研究員
|
Keywords | コーパス / メタデータ / レジスター / データマイニング |
Research Abstract |
25年度では、本研究の目的①である現代日本語書き言葉均衡コーパスBCCWJにおけるレジスターモデルの構築を中心に研究を行った。その中でも、BCCWJにおけるメディアラベルおよび他のメタデータとレジスターの差異を報告することに焦点を当てた。そのために、BCCWJのメディアラベルおよびメタデータがレジスター分析にもたらす影響およびレジスター分析を行う際の注意点についてデータマイニング手法(Sub-group DiscoveryおよびExceptional Model Mining)を用いて調査し、その成果を第19回公開シンポジウム「人文科学とデータベース」(2013年11月30日、立命館大学)と第5回コーパス日本語学ワークショップ(2014年3月6日~7日、国立国語研究所)にて学会発表した。国立国語研究所の同ワークショップでも、言語資源(リソース)に関する指定討論を担当した。「じんもんこんシンポジウム2013」(2013年12月9-14日、京都大学)では、レジスターモデルの元となる言語特徴の抽出について学会発表した。これらの研究によりレジスターをコーパスで扱う以上での要点が明らかになり、本研究の目的②であるレジスターモデルを応用した検索システムの開発の準備ができたと思われる。研究発表はまだ行っていないが、その結果に基づき、レジスターのモデルの基盤となるメタデータをシステムの開発に応用する開発作業も開始している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
レジスターモデルの構築に必要なメタデータの整備が概ね完了している。システムのユーザビリティ評価は25年度に行わず26年度に実施するが、本研究の達成に影響しないと思われる。
|
Strategy for Future Research Activity |
今後はシステムの開発とそのユーザビリティ調査を中心に実施する。
|
Research Products
(3 results)