• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1996 年度 実績報告書

超大規模データによる構文研究手法の研究

研究課題

研究課題/領域番号 08451093
研究種目

基盤研究(B)

研究機関青山学院大学

研究代表者

近藤 泰弘  青山学院大学, 文学部, 助教授 (20126064)

キーワードKWIC / UNIX / WWW / データ処理 / ワークステーション / コーパス
研究概要

研究に必要なデータの初期の収集とワークステーションによる開発環境の設定を行った。本研究のためには高速にデータ処理が可能なUNIXをOSとするワークステーション(高速計算機)が必須であったため、これらを設置し、データ処理を行うための基礎的ソフトウェアの開発を行った。データ処理言語としてはperl言語を採用した。
開発環境のテストはいくつかの処理系を用いておこなったが、最終的にはUNIXの一種であるBSDUNIXを用いて今後の研究を行うことに決定した。国語学的研究を計算機で行うことについては従来はパソコンのWindowsなどを用いて行われることが多かったが、本研究ではその扱うファイル量がきわめて大きいこと、また多くのプログラムを並行的に動作させる必要性があることなどから、どうしてもUNIXの採用が望ましいという結論を得ることができた。
ソフトウェアについては、形態素解析を終了したデータについて、文法研究に適したファイル形態について考察し、そのために最適なソフトを開発した。また、それらのデータ処理のための試験的データを購入し、その処理を開始した。ソフトとしては従来からこの種の研究に用いられているKWIC形式の出力を中心として行うことに決定した。
また、以上の成果の公表のために、インターネット上にWWWサーバーを構築し、研究成果を公開することが可能な条件を整えたことも本年度の研究成果の一部である。サーバーのURLは次の通りである。
http://klab.ri.aoyama.ac.jp
今後、このURLを通して研究成果の公開を行う予定である。

URL: 

公開日: 1999-03-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi