2020 Fiscal Year Research-status Report
自己相関関数に基づく文書主題と文書構造を考慮した文書検索手法の開発
Project/Area Number |
16K00160
|
Research Institution | Showa University |
Principal Investigator |
小倉 浩 昭和大学, 教養部, 教授 (40214100)
|
Project Period (FY) |
2016-04-01 – 2022-03-31
|
Keywords | 自己相関関数 / 拡張指数型自己相関関数 / Poisson過程 / Weiestrassランダムウォーク / 待ち時間分布 / 階層構造 / フラクタル時間 |
Outline of Annual Research Achievements |
2020年度はこれまでの研究成果をまとめた論文を執筆,学術専門誌に投稿して受理された.ここでまとめた主な研究成果としては,(a)文書主題に関わるような重要な語の文書中での出現パターンが長期記憶をともなって現れること,(b)この長期記憶は拡張子数型の自己相関関数で特徴づけられること,(c)これらの長期記憶は,文書に記述すべき概念を有向非巡回グラフで表現し,それらを具体的な文書表現としての1次元の文節の連続列に変換する過程で必然的に表れること,(d)1度出現した語が以降の文節に確率的に引き継がれることを考慮すると,実際の重要語の出現パターンがより精密にシミュレートできること,などが挙げられる. 論文投稿後,重要語の出現パターンについてさらに検討を進めた結果,巻,章,節,副節,文節,文などで構成される文書の階層構造が,重要語の出現パターンに大きな影響を及ぼしていることが明らかとなった.この知見に基づいて,文書の階層構造を語の出現の待ち時間分布が1次元Weiestrass random walkで与えられると仮定すると,重要語の出現パターンが記述できることを導いた.これらの結論を得るために,待ち時間分布を1次元Weiestrass random walkから確率的に生成し,生成された待ち時間分布を用いて語が文書中で出現するという仮定に基づいて,重要語の出現パターンをモンテカルロ法によりシミュレーションした.重要語の出現パターンを確率過程によって生成された時系列データであるととらえ,さらにその確率過程を明らかにできたという点でこの成果は大きな意味を持つと考える.このように,文書中の語の出現パターンの究明という意味では,理論的に大きな進展があったと言える.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究実績の概要で述べたように,重要語の出現パターンを理論的に説明するという観点では大きな進展があったが,その結果を多くの文書に適用してその確度を高めるという点においては大きな進展が見られなかった.その理由としては,新型コロナウィルス感染症の影響により遠隔授業の準備等に時間を取られたためで文書集合をデータベース化する作業を進めることができなかったためである.文書集合のデータベース化のためには,ある程度まとまった時間をとり集中して取り組む必要があるため,その時間が確保できなかったことが原因である.
|
Strategy for Future Research Activity |
重要語の出現パターンについて,巻,章,節,副節,文節,文などで構成される文書の階層構造が,重要語の出現パターンに大きな影響を及ぼしていること,文書の階層構造を語の出現の待ち時間分布が1次元Weiestrass random walkで与えられると仮定すると,重要語の出現パターンが記述できること,などの2020年度に得られた研究成果について,論文の執筆をすすめ,しかるべく学術雑誌に投稿を行う. さらには,文書のデータベース化を進め,上記結果の確度を高めることを目標としたい.具体的には,Weiestrass random walkのパラメータと実際の語の出現パターンの関連について定量的な探索を行い,対象語の文書中での働きとパラメータ値との関係を明らかにしたいと考える.
|
Causes of Carryover |
すでに研究進捗状況評価の箇所で述べたように,新型コロナウィルス感染症の対応,特に遠隔授業準備に忙殺され,文書集合データベースの構築が進展しなかったことが大きな要因である.データベース構築のためのワークステーションを購入し,集中してデータベースの構築に取り組むためのまとまった時間を捻出することが困難であった.
|
Research Products
(5 results)
-
-
[Journal Article] 包接体を用いたフリーラジカル含有カプセルのTG-DTA測定2020
Author(s)
小林 広和, 本多 英彦, 山本 雅人, 萩原 康夫, 松永 雅美, 長谷川 真紀子, 剣持 幸代, 猪俣 瞳子, 小倉 浩, 倉田 知光, 平井 康昭, 大幡 久之, 稲垣 昌博
-
Journal Title
昭和学士会雑誌
Volume: 80(2)
Pages: 121-131
DOI
Peer Reviewed / Open Access
-
-
-