研究課題/領域番号 |
24500303
|
研究種目 |
基盤研究(C)
|
研究機関 | 国立情報学研究所 |
研究代表者 |
小山 照夫 国立情報学研究所, 情報社会相関研究系, 教授 (80124410)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 専門用語管理 / Web情報システム / ユーザインタフェース |
研究概要 |
今年度はシステムの基本設計とオープンリソースの組み合わせによるシステムの第一次的実装を行った。統合的用語管理のためのデータベースとして、用語テーブル、シソーラステーブル、多義語テーブルを中心とし、用語管理支援のためにさらに、文献抄録テーブルおよび用語候補テーブルを用意することとした。これらについて具体的なスキーマを決定した上で、MySQLデータベース管理システムを用いて第一次バージョンのデータベースを構築した。 データベーススキーマ定義にあたっては、学会などあらかじめ決められた複数の研究分野について、分野ごとに独立したデータベースをそれぞれ複数のメンテナがWebブラウザ経由で、ネットワークを介して操作することが可能な環境を提供できるようにした。このデータベースを保守する環境として、ApacheWebサーバとRubyおよびPythonによるCGIを組み合わせた試験的システムを構築した。このシステムには用語候補抽出機能を用いた用語管理支援を統合しており、さらに補助的な機能として、用語とシソーラスデータのアップロード/ダウンロード機能も組み込んでいる。 これと並行して、統計処理機能を統合する目的で、オープンソースであるR統計パッケージと、パッケージをRuby,Python言語から呼び出すインタフェースに関する調査を行い、両言語から統計パッケージを呼び出すための環境を構築した。これにより、データベースと統計解析を統合できる環境の整備を完了した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
システムの概要を決定するのみならずデータベースとデータ操作システムの実装およびその基本機能確認まで完了したことは、当初の予定より進んでいる点である。一方で形態素関連の解析に関する検討がやや遅れている点を考慮するなら、ほぼ当初計画どおりの進展状況であると考えられる。
|
今後の研究の推進方策 |
今後の研究推進の方策としては、まず試作したシステムのユーザインタフェースの機能評価と改善を行う。実際にシステムを使用することを通して、機能面や使い勝手の評価を行い、これに基づくシステムの改訂を進める。一方で、現在のCGIによるステートレスなシステム実装を、より効率の良いステートフルな実装に変更していくことを目指す。またこれと平行して、用語管理支援のための統計的手法に関する検討を行い、システムに機能を統合する方向性を明かにする。さらに、形態素統計解析に基づいて用語候補抽出アルゴリズムの洗練を行うことを予定している。
|
次年度の研究費の使用計画 |
システム評価と開発のための環境を整備するため、新規にノートPCを購入する。連携研究者(岡山大学竹内講師)との連絡、および研究発表のために旅費を使用する。システム開発補助のために学生への謝金を使用する。その他、資料印刷などに研究費を使用する予定である。
|