Project/Area Number |
17K00429
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Web informatics, Service informatics
|
Research Institution | University of Hyogo |
Principal Investigator |
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Project Status |
Completed (Fiscal Year 2019)
|
Budget Amount *help |
¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2019: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2018: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2017: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
|
Keywords | 情報信頼性 / Webマイニング / 典型性 / 文体分類 / ウェブインテリジェンス / 情報システム |
Outline of Final Research Achievements |
We proposed methods to estimate the typicality and writing style of sentences. They are used as criteria to judge the reliability of Web pages. The sentence typicality for a given keyword is estimated based on the co-occurrence relationship between words. In the writing style classification, four writing style classes are defined, distal style, direct style, conversational style, and slang style. We focus on sentence-final expression for the writing style classification, and we use sentence-final dictionaries automatically constructed from information source different for each style.
|
Academic Significance and Societal Importance of the Research Achievements |
本研究では,文の典型性の推定手法と文体分類手法を開発した.文の典型性推定では,語の共起確率だけでなく,その予測値を併用することで推定精度を向上させた.文の典型性の推定結果をユーザに提示することにより,ユーザは典型性の低い文章については世間一般に認知されていない情報として警戒して閲覧することができるようになる.また,文体分類においては,定義した4つの文体に対して高い精度での分類を実現した.さらに,文体分類の応用として,文体による注目トピックの違いや文体と文章の難易度の関係についての分析を行った.
|