2006 Fiscal Year Annual Research Report
「ソフトウェア=プログラム+ドキュメント」の視点に基づく多言語対応大規模コーパス
Project/Area Number |
16200001
|
Research Institution | Aichi Prefectural University |
Principal Investigator |
稲垣 康善 愛知県立大学, 情報科学部, 教授 (10023079)
|
Co-Investigator(Kenkyū-buntansha) |
山本 晋一郎 愛知県立大学, 情報科学部, 助教授 (40240098)
山村 毅 愛知県立大学, 情報科学部, 助教授 (00242826)
松原 茂樹 名古屋大学, 情報連携基盤センター, 助教授 (20303589)
手嶋 茂晴 名古屋大学, 組み込みシステム研究センター, 特任教授 (50394599)
|
Keywords | 情報抽出 / 依存構造 / 情報抽出 / コーパス検索 / 識別子の対応付け |
Research Abstract |
本年度は,プログラムードキュメント間対応コーパスに基づく応用アプリケーションの実現により,対応コーパスの有効性の確認および問題点の検証を行った. 1.プログラマ向け応用アプリケーションの開発 ソフトウェア開発では,プロジェクト毎にプログラムの識別子に対する慣習的な命名法が存在する.これに従うことで,開発者は識別子名からその内容に関する認識を共有することができる.また,プログラム理解に必要なコストを低減する効果もある.慣習に不慣れなプロジェクト新規参入者が慣習に沿った命名を行うことを支援するツールを開発した.このシステムは,開発中のプロジェクトに存在する,すでに命名された識別子の集合とその実体に対する説明文から命名規則を推測し,これをもとに命名の支援を行う.今回,Javaのメソッドを対象に,メソッド名決定支援ツールを作成した. 2.ドキュメント作成者向け応用アプリケーションの開発 プログラムの保守や再利用のためにはプログラムの理解が必要である.プログラム理解にはそのドキュメントや作成者の記述したコメントの存在意義は大きい.特に,世界からメンバーが参加するオープンソースソフトウェアの開発においては,正しい英語でコメントをプログラム中に残すことが重要である.そこで,プログラムにコメントを挿入する作業を支援するツールを開発した.こ礼は単なる英作文の支援ではなく,コメント文特有の表現を考慮したシステムである.教育目的で開発されたという背景から模範的なコメントを豊富に持つオープンソースソフトウェアであるMINIXからコメント英文のコーパスを作成した.このコーパスを語の依存構造を用いて検索することで,コメント文記述を行う際に,より的確な表現の例文を提示して記述の支援を行うツールを作成した.
|