2018 Fiscal Year Research-status Report
書き言葉コーパスと話し言葉コーパスとを活用した外来語表記のゆれの研究
Project/Area Number |
17K02794
|
Research Institution | Ritsumeikan University |
Principal Investigator |
小椋 秀樹 立命館大学, 文学部, 教授 (00321547)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | コーパス / 外来語 / 表記 / 発音 |
Outline of Annual Research Achievements |
1.外来語表記のゆれの実態と外来語の発音のゆれの実態とを大規模コーパスを用いて明らかにするため,『現代日本語書き言葉均衡コーパス』と『日本語話し言葉コーパス』とから抽出した用例を基に,用例データベースの構築作業を継続した。 用例データベース構築作業が当初計画から遅れていることを踏まえ,応募の段階において,本研究が当初計画どおりに進まないときの対応策として挙げていたとおり固有名詞(人名,地名,企業名,商品名)を調査対象外にすることとした。誤解析の修正については,2017年度実施状況報告書に記載したとおり高頻度語を優先して行った。研究用アノテーションの付与については,なじみ度の付与を自動で行うとともに,比較的機械的に付与が可能な語構成に関する情報の付与に着手した。 2.昨年度に引き続き,今年度も,用例データベース構築作業と並行して予備的分析を行った。分析対象は,連母音[ei]と語中長音とした。連母音[ei]については,長音符号による表記,長音による発音が定着していることが確認された。ただし表記については,新しく日本語に入ったと考えられる語やファッション関係の語を中心に連母音表記が定着している語が見られるなど,語や分野と表記との間に対応関係が見られた。このように,一部で表記と発音との間にずれが観察された。語中長音については,誤解析修正等のデータ整理を終えた段階である。 3.前年度行った予備的分析(外来語語末長音の表記のゆれと発音のゆれとの関係に関する調査・分析)の結果を論文にまとめ,発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
1.作業の進捗が遅れていることから,複数名の学生アルバイトの確保を目指した。しかし適任の者を確保することがなかなかできなかった上に,学生アルバイトの作業の習熟に時間を要した。 2.用例確認作業の中で誤解析が多く発見され,その修正作業に時間を要した。
|
Strategy for Future Research Activity |
用例データベースの規模を縮小することで,作業効率を上げ,次年度前半での完成を目指す。 その方策は以下のとおり。 (1) 固有名詞を対象から外す。 (2)『現代日本語書き言葉均衡コーパス』で500例以下の,『日本語話し言葉コーパス』で300例以下の外来音を対象から外す。
|
Causes of Carryover |
学生アルバイトの確保,及び作業の習熟に時間を要したことから,用例データベース構築作業を完了できなかった。 研究の進捗状況に鑑み,調査対象から固有名詞を除外する,『現代日本語書き言葉均衡コーパス』で500例以下の,『日本語話し言葉コーパス』で300例以下の外来音を対象から外すといった対策を講じ,次年度前半での用例データベース構築完了を目指す。この作業においては,誤解析修正,研究用アノテーションの付与を実施することから,作業補助者を複数名雇用し,そのために作業用パソコン等,必要な備品の購入も行う。
|
Research Products
(1 results)