2011 Fiscal Year Research-status Report
イテリメン語の語彙データベース構築と比較研究ー系統・接触関係の解明に向けてー
Project/Area Number |
23520493
|
Research Institution | Chiba University |
Principal Investigator |
小野 智香子 千葉大学, 人文社会科学研究科(系), 特任研究員 (50466728)
|
Project Period (FY) |
2011-04-28 – 2015-03-31
|
Keywords | イテリメン語 / チュクチ・カムチャツカ諸語 / 語彙データベース / 系統関係 / 言語接触 / 方言比較研究 / ロシア |
Research Abstract |
本年度は主として過去に収集した語彙データの整理、データ構造の分析と検討を行った。1. 過去に収集した語彙データの整理・分析:古いワープロソフト、表計算ソフトなど、フォント・文字コードやフォーマットの異なる語彙データをUnicode でエンコーディングし、データベースソフトウェアを使用してデータの一元化を開始。過去のフィールド調査により収集した音声・映像をPCで分析可能な形にエンコードし、語彙音声の切り出しを行った。また文字起こしをしたテキストの形態素分析を行って発表した(小野 2011)。2. 新たな語彙データの収集:ロシア科学アカデミー言語学研究所を訪問し、研究所が所有する1930年代-1970年代のイテリメン語データを収集して、その電子化を行った。カード形式の手書き資料についてはスキャンしてPDF画像として電子化し、そのデータ構造の解析を開始した。さらにロシアの研究者による1980年代のイテリメン語調査の録音データを入手した。3. 文献からの語彙データの整理:文献資料の語彙データを電子化する作業を開始した。4. データベース構築のためのフレームづくり:以上のような、様々な形式のデータをできるだけ統一し、データベースを構築するためのフレームの検討を開始した。自身のフィールドワークにより収集した音声・映像資料をテキストに起こす場合には、文字のエンコーディングについての標準化が確立されつつあるが、過去の研究者の手書き資料を文字に起こす作業の際のトランスクリプションおよびエンコーディングのルールについて、検討を開始したところである。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
1930年代-1970年代に記録された手書き資料のデータ構造の解析が当初の予想を超えて困難であることが明らかになり、データベースのフレーム構築作業の当初計画を見直すこととなった。まずデータ構造の分析に時間をかける必要があると判断したため、本格的なデータ入力作業には至っていない。
|
Strategy for Future Research Activity |
データベース構築にあたり、1930年代―1970年代の手書きカード資料のデータ構造の解析を続ける。データ構造の検討と分析を終了した後、データベースのフレームを検討し、実際のデータ入力を開始する。出版された語彙資料およびフィールド調査で得られた音声・映像資料の電子化については、今年度も引き続き継続して実施する。
|
Expenditure Plans for the Next FY Research Funding |
平成23年度内に手書きカード資料のデータ構造解析が終了しなかったため、平成23年度に使用する予定だった研究費を使用して、次年度に実施することとした。1. 物品費 106,066円:言語学・チュクチ・カムチャツカ諸語等に関する文献、消耗品等(うち平成23年度未使用分 6,066円)2. 旅費 600,000円:ロシア調査旅費、学会・研究会参加旅費等3. 謝金 240,000円:データベースフレーム構築等の謝金および業務委嘱、データ電子化、翻訳等(うち平成23年度未使用分 140,000円)4. その他 100,000円:複写費等
|
Research Products
(2 results)