2018 Fiscal Year Research-status Report
作られる物と使われる物が記述された大規模文書群の検索に関する研究
Project/Area Number |
18K11986
|
Research Institution | Gunma University |
Principal Investigator |
安川 美智子 群馬大学, 大学院理工学府, 助教 (70361384)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 情報検索 / 情報組織化 / 情報資源の構築・管理 / 自然言語処理 / データベース |
Outline of Annual Research Achievements |
2018年度は研究実施計画の通り、日本語の料理レシピ分析のための文書データの収集を行った。具体的には、GoogleのWeb検索APIを利用して、料理レシピにおいて顕著に出現する検索キーワードにより得られた検索結果のURLを用いて、料理や食に関するに日本語のWebページを10万件以上収集した。収集したデータは、研究計画の2年目以降に予定しているデータ分析と検索評価実験で活用していく予定である。
また、2018年度は、料理情報処理に関する国内・海外の研究のサーベイと、情報学分野全般における文献調査のための関連語推薦の検討を行った。情報処理分野全般の論文書誌情報を集録したデータベースDBLP(Digital Bibliography & Library Project)で、料理や食に関連する英語のキーワード(cooking, recipe, eating, food, 等)を論文タイトルに含む論文を検索すると、過去10年くらいの論文数の増加が顕著であることが明らかとなった。近年、料理や食に関する情報処理の研究が重要性を増しており、多様な研究領域の研究者が分野横断的な研究テーマで検討を進めている。本研究課題では、研究期間の後半に、料理レシピ検索の手法を料理レシピ以外の検索(たとえば、科学技術情報の検索)に応用していくことを計画している。料理レシピの文書コレクションと、論文書誌情報のデータベースには、文書構造上の類似点があることから、料理レシピ検索と論文検索の両方からの検討を行うことにより、本研究で開発する技術の汎用性を高める効果が期待でき、また、研究を効率よく進められると考えている。2018年度の研究では、論文書誌情報のデータベースDBLPと競争的資金のデータベースKAKENのデータベース横断検索において、検索キーと値の連想関係を利用した情報検索を行うフレームワークを検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究実施計画の通り、2018年度の研究を進めることができており、研究期間の後半で取り組む技術課題の予備的検討を進めていることから、本研究課題はおおむね順調に進展していると言える。
|
Strategy for Future Research Activity |
Web検索APIを利用したデータ収集では、Web全体で出現頻度の低い検索キーワードが検索されにくいという問題があり、これまでに収集したURLの中には多数の重複があることが明らかとなった。そこで、今後の研究では、Web検索とWebクローリングの手法を改良し、研究用の大規模な料理情報資源でカバーする情報の網羅性を高めていくことが必要であると考えている。料理レシピ検索の手法を料理レシピ以外の検索に応用するために、大学における研究力評価という観点から文献調査を支援する応用情報処理を検討しているが、大学における教育という観点も社会的に重要な課題であることから、大学IR(Institutional Research)における研究IRと教育IRの両方を視野に入れて今後の検討を進めていく予定である。
|
Research Products
(3 results)