研究課題/領域番号 |
19K12241
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 龍谷大学 |
研究代表者 |
馬 青 龍谷大学, 先端理工学部, 教授 (30358882)
|
研究分担者 |
南條 浩輝 滋賀大学, データサイエンス学系, 教授 (50388162)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | Web検索支援 / 日本語学習支援 / プログラミング学習支援 / 情報獲得 / 用語抽出 / 系列ラベリング / 深層学習 / 対照学習 / 文法誤り検出 / 課題文の重要箇所検出 / 事前学習の追加 / レビューテキスト / レーティング / 非構造化文書 / 診療科推定 / 機械学習 / 個人化推薦 / レビュー評価 / 診療支援 / 非文法的表現 / 情報抽出 / 用語抽出・獲得 / トピックモデル / 文書分類 / ツイート推定 / Web利活用支援 / 自然言語処理 / 日英混在表現 / 不自然言語表現 |
研究開始時の研究の概要 |
最近の科研費基盤研究などで得られた研究成果をベースに、それらをさらに発展させ、そこから得られた手法・知見に基づき、外国人や高齢者、子供を対象とした、快適なWeb利活用のための自然言語処理とそれを用いた支援基盤に関する研究を提案する。具体的には、(1)日英混在表現を含む非文法的な・不自然な言語表現で記述されたユーザ入力や、音声認識から得られた不完全・非構造化な処理対象となる言語データを扱い、(2)Web利用における言語障壁を取り除くための支援、すなわち、適切な検索用語の提示、ナレッジコミュニティ利用の利便性向上、口コミ情報等のユーザ生成テキストから有用な情報抽出・推薦手法の提案、の研究を行う。
|
研究成果の概要 |
言語処理能力が不十分な外国人、高齢者、子供など特定の層を対象に快適なWeb利用を支援する自然言語処理技術の基盤形成を目指し、非構造化文書からの検索用語の抽出によるWeb検索支援、日本語の文法誤りの検出及び誤り文と正しい文の分類・変換を通じた日本語学習者支援、プログラム課題文からの重要箇所の抽出に基づくプログラミング学習者支援、ナレッジコミュニティの活用支援、SNSからの情報獲得の支援など、様々な課題に焦点を当てて研究を推進した。 これらの研究では、機械学習や深層学習を基軸にしたアプローチを採用し、大規模実データを用いた検証によりその有効性を確認し、さまざまな手法やシステムの開発に成功した。
|
研究成果の学術的意義や社会的意義 |
本研究成果は、言語処理能力が不十分な外国人、高齢者、子供など特定の層の人々に快適なWeb利用を支援する自然言語処理技術の基盤形成に大きく貢献している。複数の科研基盤などで得られた研究成果・技術を融合している点、すなわち、情報検索・情報抽出・意味処理などの単独の応用ではなく、それらの諸自然言語処理技術と、Web関連技術・統計技術・機械学習などを融合的に利用している点が本研究成果の学術的な特色である。また、本研究成果は、他の関連研究の基本要素技術の発展に寄与できる可能性が高く、関連して得られる知見は、人間の言語獲得・理解のメカニズム解明の重要なヒントとなり得ると考える。
|