研究課題/領域番号 |
23650045
|
研究機関 | 一橋大学 |
研究代表者 |
武村 知子 一橋大学, 言語社会研究科, 教授 (60323896)
|
研究分担者 |
橋本 喜代太 大阪府立大学, 人間社会学部, 准教授 (50278818)
|
研究期間 (年度) |
2011-04-28 – 2013-03-31
|
キーワード | コーパス |
研究概要 |
電子文書に関する議論かまびすしい現在、大きな問題は、ウェブ上に表示されるテクストの「スタイル」に関して分野横断的に共有できる基礎資料の欠如である、という認識に基づく本研究の目的は、電子文書における表示の「スタイル」とそれを支持するプログラム上のマークアップ言語の相関性に着目し、情報伝達特性に関する研究を行うための基礎資料となる有用なデータベースシステム「スタイル・コーパス」及び検索システムの設計・構築を試行し、汎用性のある形態を持った電子文書の普及流通を図るための研究に寄与することを目指す。平成23年度はそのための基礎固めの年であり、1)書記言語における伝達性に関する各関係分野における既存の理論の整理検討を行い、2)コーパス及びデータベース作成の方針を確定するための理論構築を開始した。1)に関しては、筆記・印刷を含めた初期言語文化史に関する資料の不足を補い、現代における電子テクスト関連の議論に欠けている部分、すなわちマークアップ言語と表示スタイルの相関性がもたらす伝達性に関する人文学的考察を遂行中である。この点に関して目下まとまった研究資料がほとんど存在しないことはいよいよ明らかになった。2)に関しては、本格的に大規模データ収集を開始する前段階として、スタイル上の特徴を持つHTML文書を数十種選定し、分析の準備を行うと同時に、既存の言語コーパスを検討して有用な特質を抽出し、スタイルコーパス設計の方針の策定に着手した。また、この点に関する既存の最先端研究分野において、参照すべき資料を収集した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
有為な分析には大量のサンプルが必要であり、本来は平成23年度中に要員を募集して効率よくサンプル蒐集と分析を行い、業者契約を行って実際にコーパス設計を開始するところまで進める予定であったが、研究経費の分割配分等の理由によりスケジュールを変更した。それに伴い、本来200~300種収集する予定だったサンプルの残り分の収集分析及びコーパス設計実装開始は平成24年度に行う。そのかわりに人文学的考察および既存研究の検討はやや進んだ。
|
今後の研究の推進方策 |
当初予定した流れに沿って進める。24年度には、人文学的理論構築と並行してサンプルの収集・分析を行い、汎用性のあるスタイルコーパス試作版の基本設計・実装実験を行い、コーパスに付随する検索システムの設計方針を定める。実験および測定結果に基づき、再検討と改良を加える。最終的に何らかの形で公開し、成果発表を行う。
|
次年度の研究費の使用計画 |
未使用分735,999円については、スケジュール変更により、平成24年度のサンプル収集・分析及びコーパス設計実装に使用する。1)人件費/サンプル収集・分析要員および、実験測定要員を募集する。2)物品費/業者を選定・契約してコーパスの設計・実装実験を遂行する。また、これに伴って若干の追加機材が必要となることが見込まれる。文献資料費は、リアルタイムで進行する議論を追う必要上、引き続き一定程度の金額が見込まれる。3)旅費/研究分担者が大阪、代表者が東京在住のため打ち合わせおよび成果発表のために数度往復する。4)成果公開費/成果発表は、学会・学会誌発表に類するもの以外は基本的にウェブを用いて行うことを予定しており、若干の人件費の他はそれほど大きな支出源にはならないと予想される。
|