• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

建築論壇史研究におけるビッグデータ解析アプリケーションの実装

研究課題

研究課題/領域番号 22K14415
研究種目

若手研究

配分区分基金
審査区分 小区分23040:建築史および意匠関連
研究機関京都美術工芸大学

研究代表者

江本 弘  京都美術工芸大学, 建築学部, 講師 (10831422)

研究期間 (年度) 2022-04-01 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2025年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード近現代建築史 / ビッグデータ / 自然言語処理 / グローバル・ヒストリー / 近代建築史
研究開始時の研究の概要

歴史書は、それを書く人びとによる事物の取捨選択によってなりたっています。この研究で発展させる「固有名の探索・登録」アプリケーションはまず、さまざまな歴史書のなかで取り上げられた建築作品や建築家、論考などを、情報技術によって可能なかぎり「すべて」取り出しデータベース化します。この探索・登録の精度向上と簡便化が第一段階です。さらに、それらのデータの比較分析の仕方を検討し実装することで、それぞれの歴史書が書かれたさいの、取捨選択の内容を明確化できるようにします。さらには歴史書同士の「横のつながり」までを視覚化できるようにし、これまで人力では難しかった、歴史記述研究の発展に資することを目指します。

研究実績の概要

2023年度の研究においては、EQstoraのプログラムを見直し、自然言語処理に生成系AIを実装するための実験および、それらを踏まえた初等的な実装を行った。具体的にはOpenAI API(GPT-3.5TurboおよびGPT-4)を用い、①長文の文書データから一括で固有名を抽出し、②その区分(地名、人名等)を振り分け、③該当する固有名(特に人名)の付帯情報を自動で探索する、という2022年度研究までは人力であった部分の作業フローを改善した。
生成系AIに委ねられたこれら一連の作業のエラー頻度をGPT-3.5(高速・中精度・廉価)とGPT-4(低速・高精度・高価)で比較し、作業ごとの適性を検討した。
なお、EQstoraは中精度OCRの文書ファイルを対象としたアプリケーションである。固有名の抽出制度には固有名自体がOCRに正しく読みとられていることが重要だが、2022年度までの研究ではこの点の保証が困難であった。軽微な読取ミスであったとしても、同一の固有名とみなされないのが難点であった。
そこで2023年度研究では、そうした中精度のOCR文書の読み取りエラーや文字化けなどを、生成系AIを活用し次善的に修復するプログラムを開発した。高精度のアウトプットが得られるプロンプトを検討したほか、トークン数の制限を超えて長い文書ファイルに対応するプログラムを検討した。パラグラフ末尾で切れるチャンクに分割し、復元後に再統合するプロセスを組み込んだプログラムを開発した。
このOCRデータ整理を含む一連の作業を、EQstroraのGUIに実装する。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

2023年3月15日のGPT-4のリリースにより、本研究のアプローチには抜本的な変更が迫られた。自然言語処理にかんするこれまでのプログラミング作業は打止めとし、生成系AIに対する指示(プロンプト)の検討をベースに開発を再開した。生成系AIの利用を検討するなかで、①「OCR文書の生成系AIによる補完」と②「補完された文書の解析」という大きな2段階を設定することで解析の精度向上が見込めると判断した。アプリケーション開発の進捗は芳しく、①、②ともにGUIに実装すれば即応用可能な状態である。GUI自体は2022年度までに開発したものをほぼそのまま使える。

今後の研究の推進方策

2023年度に開発を進めたOpenAI API実装プログラムは、すでに個別研究に利用可能な水準に達している。すでに開発したGUIと統合することで、計数やグラフ表示などの基本的機能もすぐに利用可能である。まず、この作業を早急に進めて実用可能な状態にする。ここから、S. ギーディオン『空間 時間 建築』全5版の増補経緯に関する個別研究をまとめ、査読論文として投稿する(『日本建築学会計画系論文集』等)。また、EQstoraの技術を共有するため、その開発経緯や仕様、パフォーマンス(効率・精度)や問題点などについてまとめ、『日本建築学会技術報告集』に投稿する。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (7件)

すべて 2023 その他

すべて 雑誌論文 (2件) 学会発表 (4件) (うち招待講演 2件) 備考 (1件)

  • [雑誌論文] 邦国建築士試験問題の歴史学的試論:国内近現代建築の出題傾向に関して2023

    • 著者名/発表者名
      江本弘
    • 雑誌名

      京都美術工芸大学研究紀要

      巻: 3 ページ: 6-31

    • 関連する報告書
      2022 実施状況報告書
  • [雑誌論文] Shibui Katsura: The Emergence of a Japanese Global Icon, 1921-702023

    • 著者名/発表者名
      Emoto Hiroshi
    • 雑誌名

      Journal of the Society of Architectural Historians

      巻: 82 号: 1 ページ: 63-82

    • DOI

      10.1525/jsah.2023.82.1.63

    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 邦国建築士試験問題の歴史学的試論:国外近現代建築の出題傾向に関して2023

    • 著者名/発表者名
      江本弘
    • 学会等名
      日本建築学会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 固有名詞と世界史:ラスキン、カツラ、エクストラ2023

    • 著者名/発表者名
      江本弘
    • 学会等名
      世界建築史15講連続セミナー
    • 関連する報告書
      2023 実施状況報告書
    • 招待講演
  • [学会発表] SSA:しつこくスタイル(様式)問題を論じつづけたアメリカ論壇2023

    • 著者名/発表者名
      江本弘
    • 学会等名
      日本建築学会近畿支部建築論部会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] ラスキン、カツラ、エクストラ2023

    • 著者名/発表者名
      江本弘
    • 学会等名
      世界建築史15講 連続セミナー
    • 関連する報告書
      2022 実施状況報告書
    • 招待講演
  • [備考] Hiroshi Emoto Website

    • URL

      https://emo-arch.com/

    • 関連する報告書
      2023 実施状況報告書 2022 実施状況報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi