2011 Fiscal Year Research-status Report
大規模な注釈つきコーパス分析のための直感的コーパスツール開発
Project/Area Number |
23501115
|
Research Institution | Waseda University |
Principal Investigator |
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | コーパス / 応用言語学 / データベース / ライティング / AntConc |
Research Abstract |
2011年度中、統合テキスト分析ソフトウェア「AntConc」のユーザー数は益々増え、1年のみで合計12万回以上ダウンロードされた。また、全世界の教育施設でコーパス言語学やテクニカルライティングの指導に当たって、「AntConc」が標準ソフトとして位置づけられている。その上、医学、文学、翻訳などの新たな分野でも「AntConc」のユーザーが増え、新教育・新研究を生み出すためソフトウェアとなっている。 2011年度中、「AntConc」に新機能を加え、インターフェースを大幅に変えることにより、Macintosh OSXをはじめ、各OSのネーティブサポートが可能となった。また、Lexical Bundleを分析するため、単語の出現分布を図るための機能をつけた。「AntConc」をより直感的に使うため、「AntConc」のユーザーグループのフィードバックを反映し、インターフェースや設定を簡素化した。その上、より大きいコーパスを円滑に処理するためのデータベース構築の実験を開始した。また、ソフトウェアの説明資料を大幅に改善し、スクリーンキャストの説明ビデオチュートリアルを作り、印刷できる説明ガイドもより分かりやすく書き直した。2011年中、Univ. of California、Santa Barbaraのグリース教授を訪問し、統計の機能を強化するため、コーパスのインポートから結果のアウトプットまで、細かい修正案を得た。また、2011年度中、イギリス、日本、中国、台湾では「AntConc」に関する研究発表、特別講演会、ワークショップなどを行った。また、テクニカルライティングの授業での応用について論文も発表した。その上、コーパスツール開発により西安交通大学のアドバイザーとして勤め、アジアの各国の教育施設でコーパスの利用を幅広い分野で広げるよう努力した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究実績の概要で説明した通り、「AntConc」の改善作業を順調に進めている。特にMacintosh OSXをはじめ、各OSのネィーティブサポートが可能となり、新統計の機能を加え、ユーザーグループのフィードバックにより更に直感的に使えるようになった。Univ. of California、Santa Barbaraのグリース教授の訪問により、「R」の統計ソフトとの統合について検討を始め、実験によって可能であることを確認した。「R」の統計ソフトとの統合により、幅広い統計計算や結果の可視化が可能となる。大きいコーパスを円滑に処理するため、データベース構築についての研究を始め、順調に進んでいる。一方、2011年度中、Univ. of Michiganのローマー氏とオドネル氏を訪問し、授業での使い方や、Python言語への書き換えについて助言を得る予定だったが、二人の転職により、訪問が2012年度に延期された。それによって、Python言語への書き換えを2012年度中に行うことにし、書き換えた後、予定していた新機能の一部を加える予定である。
|
Strategy for Future Research Activity |
2012年度中、Georgia State Universityのローマー氏を訪問し、授業での使い方や、Python言語への書き換えについて助言を得る予定である。その後、Python言語への書き換えを進めると同時に「R」の統計ソフトとの統合について、新たな研究を始める予定である。即ち、2011年度中に行われなったことを確実に行う。その後、2011年度中に行われたデータベース構築の実験を更に発展させ、「AntConc」に新しいデータベース構築を導入する予定である。また、テクニカルライティングなどの授業でコーパスをより円滑に使うため、品詞タグのツールを開発し、統合する。その上、文書のマクロレベルでの分析が可能となるため、ディスコース言語特徴を自動的に抽出するツールの開発を始める。これによって、段落のトピック、詳細などを表すセンテンスを自動的に見つけ、可視化することにより、新しい指導法が可能となる。
|
Expenditure Plans for the Next FY Research Funding |
データベース構築の実験を行うため、計算速度の速いコンピュータを1台購入する。また、Georgia State Universityのローマー氏を訪問し、品詞タグツールの重要性や「AntConc」そのものの使い方について、助言を得る。品詞タグのツールとディスコース言語特徴検出ツールを開発するため、自然言語処理や機械学習に関する参考書を購入し、国内外の専門家を訪問し、より円滑に開発を進めるため、助言を得る。
|
Research Products
(24 results)