本研究は、パソコンの扱いに習熟していないロマンス諸語研究者を対象に、日本語システム上で当該諸言語のテキストデータを簡単に作成・処理できるようにするための、非機種依存の環境を提供することを目的とする。 前半部分にあたるテキスト・データ形式の提案については、主にスペイン語研究者が用いている既存の入力形式を参考にしつつ、実際のデータ処理の必要性を考え合わせて策定し、EspTextと名付けた。その概要は、重点領域「人文科学とコンピュータ」平成7年度報告書に掲載される。 開発した処理ツールは2つの軸に沿って分類できる。ひとつはEspTextと他の形式の間の変換ツール/本来のデータ処理ツールという軸、もうひとつはコマンドライン/GUI(グラフィカル・ユーザ・インタフェィス)ツールという軸。GUIツールは、本研究が想定しているようなロマンス諸語研究者のために必須であるが、現時点では全てのツールをGUI化することはできていず、引き続き作業を進めている。 開発したツールを最初の軸に従って分類してみる。 1.変換ツール(出力用変換を含む) ・英語版DOSやマッキントッシュのテキスト形式とEspTextの双方向変換(atoa:GUIあり)。 ・EstTextの文字種情報のRTF(Rich Text Format)への変換(esp2rtf:コマンドライン版のみ)。 ・WordPerfect for Windowsマクロ(双方向)。 ・EspTextファイル簡易ビューア(Windows版)。 2.本来の処理ツール ・KWIC(文脈付き語彙索引)作成ツール(espkwic:GUI開発中)。 ・行末ハイフン処理(dehyph:GUI版あり)。 espkwicは実際にはツール群であり、出力形式は現在のところLaTeX形式のみだが、今後、複数の形式をサポートするための開発を続ける予定。
|