Project/Area Number |
20H00595
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 61:Human informatics and related fields
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 北海道大学, 情報科学研究院, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
平田 耕一 九州工業大学, 大学院情報工学研究院, 教授 (20274558)
山本 章博 京都大学, 情報学研究科, 教授 (30230535)
ジョーダン チャールズハロルド 小樽商科大学, 商学部, 准教授 (60647577)
小林 靖明 北海道大学, 情報科学研究院, 准教授 (60735083)
喜田 拓也 北海学園大学, 工学部, 教授 (70343316)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥44,200,000 (Direct Cost: ¥34,000,000、Indirect Cost: ¥10,200,000)
Fiscal Year 2024: ¥7,670,000 (Direct Cost: ¥5,900,000、Indirect Cost: ¥1,770,000)
Fiscal Year 2023: ¥7,670,000 (Direct Cost: ¥5,900,000、Indirect Cost: ¥1,770,000)
Fiscal Year 2022: ¥7,670,000 (Direct Cost: ¥5,900,000、Indirect Cost: ¥1,770,000)
Fiscal Year 2021: ¥10,790,000 (Direct Cost: ¥8,300,000、Indirect Cost: ¥2,490,000)
Fiscal Year 2020: ¥10,400,000 (Direct Cost: ¥8,000,000、Indirect Cost: ¥2,400,000)
|
Keywords | 離散構造学習 / 大規模半構造データ / 次世代機械学習技術 / データマイニング / 知識基盤形成 |
Outline of Research at the Start |
本研究では,実世界知識基盤形成の中核技術として,実世界と情報世界の大規模半構造データに内在する知識をパターンや規則として取り出せる超高速マイニング技術を理論と実装の両面から研究開発する.とくに申請者等がこれまでに開発した高速最適化半構造データマイニングの枠組みを一般化し,最新の機械学習理論と離散最適化技術に基づいて拡張し,解釈性の高い離散的な予測モデル族に対して,分類精度に加え,公平性や安定性等の多様な機械学習問題を効率よく解くことができる超高速な離散構造学習技術を開発する.さらに,現実の多様な半構造データに適用するための周辺技術を開発し,知識基盤形成支援のアーキテクチャと実装技術を確立する.
|
Outline of Annual Research Achievements |
本年度は、以下の研究成果を得た。 (a) 半構造データからの知識獲得に関して、小林は、グラフ上の最適化問題の解空間を扱う複数のアプローチを研究し、解空間の組合せ遷移問題(連結性)、列挙問題、解の多様性最大化問題に取り組み、国際会議MFCS、AAAI, WALCOM等で発表を行い、国際会議 WALCOM 2024 で Best Paper Award を受賞した.山本は、大規模言語モデル (LLM) を用いたプログラム自動修正の高信頼性検証においてモデル推論システムに基づく学習法、有限状態機械を用いた強化学習法、Graph NNのための反実仮想説明手法を提案した。Jordanは、論理を用いて各種の関係構造とクエリを実現可能な汎用ソフトウェアライブラリ"de"の改訂版を構築し、公開した。 (b)周辺技術に関して、有村と宇野は、最長共通部分列 の多様解問題を考察し、計算困難性と各種の厳密解法と近似解法を与えた(CPM2024に採択済)。宇野は、DAGを用いて極大共有文字列を効率的にデータベース化・検索するアルゴリズムとデータ構造を開発し、圧縮アルゴリズムの最適圧縮の計算困難性を証明し、成果を国際学会ISAAC、CPMで発表した。喜田は、整数符号化の調査・評価を行い、展開速度の観点からフィボナッチ符号の各種イライアス符号に対する優位性を示した。 (c) 知識基盤形成技術の実証に関して、全員が実装と評価に取り組んだ。とくに平田は、感染症分野におけるグラム染色画像からの菌画像検出に取り組み、1000倍視野相当の画像品質を100倍視野の白血球と扁平上皮細胞の数で判定する分類方式を画像分類と物体検出に適用し、十分な性能をもつ注釈不要の画像分類を実現し、国際会議ESKM2023のHonorable Mention Awardと第一著者の学生が国内集会の学会奨励賞を受賞した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,各研究項目のグループごとに,担当の研究分担者によって研究打ち合わせを実施しながら,研究推進を行なった.その際に,必要に応じてグループ間の研究打ち合わせ等をオンラインまたは対面で実施した.国内・国外研究集会での成果発表については,コロナ感染対応以降広まってきた,オンライン参加と対面参加を事情に合わせて選択して実施した.全体として,離散構造を中心として,大規模版構造データからの新しい知識獲得問題に取り組み,成果を得ることができた.
|
Strategy for Future Research Activity |
最終年度となる次年度は,知識基盤形成にむけた大規模半構造データからの効率良い知識獲得手法について,研究成果をとりまとめる.そのために,従来通り,研究打ち合わせ等をオンラインと対面の両方で実施し,国内・国外研究集会での成果発表を行いつつ,横断的な議論のための研究集会の開催等もまじえて,研究を進める.各研究項目における研究推進は,従前通り実施する.以上により,研究まとめに向けた研究推進を行う予定である.
|