研究課題/領域番号 |
19H04417
|
研究機関 | 筑波大学 |
研究代表者 |
宇津呂 武仁 筑波大学, システム情報系, 教授 (90263433)
|
研究分担者 |
吉岡 真治 北海道大学, 情報科学研究院, 教授 (40290879)
乾 孝司 筑波大学, システム情報系, 准教授 (60397031)
亀田 能成 筑波大学, 計算科学研究センター, 教授 (70283637)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 学術用語解説ウェブページ / 解説型ウェブページ / 深層学習 / ページ推薦 |
研究実績の概要 |
本研究では,特定の物事,概念,出来事,手順等の解説を掲載し,その内容を分かり易く伝えるウェブページを「解説型ウェブページ」と呼ぶ.本研究では特に,図解等の視覚効果を多く含む「解説型ウェブページ」である理数系学術用語解説ページを代表例として,分かり易さと見易さの因子を特定する.そして,「解説型ウェブページ」の分かり易さと見易さを自動評定するとともに評定結果の理由を提示するシステムを開発する.さらに,習熟者・初心者,大まかな概念が知りたい・詳細な解説が欲しい,等の閲覧者のプロファイリング結果に応じ,各閲覧者に最も適したページを推薦するシステムを開発する. 2020年度においては,(1) 学術用語解説ウェブページの分かり易さ・見易さの自動評定モデル,(2) 学術用語解説ウェブページの分かり易さ・見易さに基づく閲覧・推薦システム,の二つの研究項目について研究を行った. (1)においては,深層学習手法に基づき,ページ構成要素の同定モデル,ページ構成要素をふまえた見易さの自動評定モデル,および,ページ構成要素をふまえた見易さの自動評定理由提示モデルのモデル化を行った.そして,多様な学術分野を対象として,深層学習モデル訓練用のページ構成要素データセットを作成した.さらに,作成したページ構成要素データセットを用いて,各モデルの訓練・評価を行い,提案モデルの有効性を示した. (2)においては,複数の学術用語解説サイトのページに対して見易さの自動評定モデルを適用し,その評定結果をふまえて,評定の高い順に学術用語解説サイトを並べ替えて提示する閲覧インタフェースを作成した.そして,理数系学術用語解説ページを代表例としてこの閲覧インタフェースを適用した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2020年度においては,(1) 学術用語解説ウェブページの分かり易さ・見易さの自動評定モデル,(2) 学術用語解説ウェブページの分かり易さ・見易さに基づく閲覧・推薦システム,の二つの研究項目について研究を行った. このうち,(1)の「学術用語解説ウェブページの分かり易さ・見易さの自動評定モデル」は,(2)の「学術用語解説ウェブページの分かり易さ・見易さに基づく閲覧・推薦システム」の要素技術として位置付けることができる. (1)の「学術用語解説ウェブページの分かり易さ・見易さの自動評定モデル」においては,深層学習手法に基づき,ページ構成要素の同定モデル,ページ構成要素をふまえた見易さの自動評定モデル,および,ページ構成要素をふまえた見易さの自動評定理由提示モデルのモデル化を行った.そして,多様な学術分野を対象として,深層学習モデル訓練用のページ構成要素データセットを作成した.さらに,作成したページ構成要素データセットを用いて,各モデルの訓練・評価を行い,提案モデルの有効性を示した.具体的には,大規模データセットを用いて事前訓練された物体検出モデルであるYOLOv5モデルを利用することにより,ページ構成要素の同定を自動で行う手法を提案した.ページ構成要素を考慮した見易さ自動評定タスクでは,ResNet-50の部分アーキテクチャを利用してモデルを設計し,ページ画像に加えてページ構成要素の領域情報を入力することで,自動評定精度を向上させることができた.また,ページ構成要素を考慮した理由提示タスクにおいては,見易さ自動評定モデルの勾配を利用することで,自動評定結果に最も寄与したページ構成要素を特定した.これにより,見易さ自動評定に加えてページ構成要素を特定した理由提示を実現することができた.
|
今後の研究の推進方策 |
今後の研究の推進方策としては,(1) 学術用語解説ウェブページにおける利用者像別の分かり易さ・見易さの因子を同定したデータセットの作成,(2) 学術用語解説ウェブページの分かり易さ・見易さに基づく閲覧・推薦システム,の二つの研究項目について研究を行い,解説型ウェブページの分かり易さ・見易さの自動評定方式に基づく情報推薦・情報アクセスシステムを開発する. (1)においては,学術用語解説ウェブページの利用者像の一例として,<初学>:これから学習する初学者レベルで,この学術分野の全体像を体系的に学びたい,<習熟>:この学術分野は既に学習途中で中級レベルであり,できるだけ詳細な解説を求めている,の二通りを想定し,利用者像別に,分かり易さ・見易さの因子となり得る情報を人手で同定したデータセットを作成する.このデータセット作成の際には,複数の学術分野において,複数の学術用語解説サイトのページを情報源としてサンプルを収集し,分かり易さ・見易さの因子の事例として多様なサンプルから構成されるデータセットを構築する. (2)においては,まず,(1)のデータセットにおける,利用者像別の分かり易さ・見易さの因子について分析を行う.また,2020年度に開発した学術用語解説ウェブページの分かり易さ・見易さの自動評定モデルにおいては,深層学習手法に基づき,ページ構成要素の同定モデル,ページ構成要素をふまえた見易さの自動評定モデル,および,ページ構成要素をふまえた見易さの自動評定理由提示モデルのモデル化を行っている.そこで,これらの成果におけるページ構成要素のモデル化部分を有効活用することにより,(1)のデータセットにおける,利用者像別の分かり易さ・見易さの因子の同定モデルを開発する.
|