• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Development of genetic and demographic database and an estimation of population size using AI technology

Research Project

Project/Area Number 19H04358
Research InstitutionMiyagi University

Principal Investigator

萩原 潤  宮城大学, 看護学群, 准教授 (90347203)

Project Period (FY) 2019-04-01 – 2023-03-31
Keywords家系図データベース / データベースシステム / 複婚
Outline of Annual Research Achievements

パプアニューギニア・ギデラ社会における親族関係を記述するデータベース開発を行った。前年度までに開発したデータベースシステムを(1)対応レコード数増加に伴うデーターチェック機能の追加(2)インターフェイスの改良(3)家系図描画の精度改善などを行い,これまでに得られた家系図データを組み込んだうえでテストを行った。(1)は紙ベースの家系図データから電子データに変換する過程において村単位で電子化を行ったため,移動した村人は二重に現れるなど,データ量が増加することとなった。また,これまでは配偶者欄のIDがないけれど,名,父名,母名がある場合,名,父名,母名の3つが同じ村人を村人リストから探し,同一人物認定して,配偶者リストに追加するという仕様だったが,これが正しい保証はないこと,ロジックが複雑であることからこの同一人物判定は他のIDなどによって判定することとした。(2)はメニューの配置の改善等である。(3)については家系図の描画がこれまでのものでは複婚などの状態の時にうまく表示されないとった問題があったため,修正を行った。
データを読み込んであった,配偶者欄から逆算して求めた配偶者を含めて,配偶者数が2人以上の村人IDと性別,配偶者のIDを出力することで,複婚者の情報をデータベースから抜き出すことができるようになった。また,読み込んだデータの不備と思われるケースはエラーメッセージを示した。最終的にデーターファイルのID欄に登録されていたIDの数(重複を含まず),配偶者欄に記載されていたがデーターファイルのID欄に未登録のIDの数,そして配偶者欄に名,父名,母名等の記載はあるが,ID不明のため内部生成されたIDの数をまとめ,全登録者数として出力した。その結果,データベースシステムによるデータのエラーチェックが機能するようになり,データをより効率的に修正できるようになった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

データベースシステムは前年度までに作成したものの機能を向上させ,人口学的な指標作成に必要なものの出力が可能になったため,予定通り作成することができたものを思われるが,予期しないプログラムの不具合などが発生する恐れがあるため,データベースシステムを活用しつつ,さまざまな用途において出力を行うことで,プログラムの不具合を見つける必要がある。しかしながら,必要な電子データ化などはすすんだものの,エラーチェックや,データベースシステムの仕様に適合しないデータがあるなど,データ整理においてまだ進んでいない部分がある。例えば,本データベースはデータを読み込む際に「カンマ区切り」として読み込んでいるが,1つのデータの中にカンマを含む場合,プログラムがデータの区切りとして読み込み,結果としてデータベースシステムに意図しないデータが組み込まれてしまうこととなる。他にも,男なのに2つレコード(多重登録)があるケースがあり,検討が必要である。女は複数配偶者を持たないために,結婚離婚の繰り返しにより複数レコードを持つが,男の多重登録レコードの内容が異なる場合がみられる。このような事例は少ないものの,データベースシステム全体に関わる問題であるため,全体を見直し,読み込むデータを洗練させる必要がある。
このようなデータベースシステムに組み込むデータにいくつかの不具合はあるものの,概ねデータベースシステムの機能向上などは果たされているものと思われる。

Strategy for Future Research Activity

今後データベースシステムにおいて検討する必要があるのは多重登録レコードについてである。現状のシステムでは,レコードの優劣は判断できないので、最初のレコードは村人リストに登録するが,2回目以降は村人リストへの登録していない。配偶者欄の情報は,複婚の関係をみるために利用するがそれ以外の情報は無視される。これらは修正が必要な項目であり,今後の検討課題である。
また,男については多重登録チェックの結果を出力する一方で,女については出力していないが,女は結婚や離婚ごとに情報が追加登録されいてる可能性があり,男よりもたくさんの多重登録が存在する。紙のデータは家系図のかたちで世帯単位で記録されているため,「ある世帯で生まれた子(女)が,結婚し他の世帯の男の配偶者となる場合,もとの世帯にも結婚後の世帯にも現れることとなる。これはどちらも正しいことが多いため,対応が必要である。ただ,かなりの多重登録例があることと,内容の吟味が難しい場合も多々あることが予測されるため,成果発表などにおいては,用いる箇所だけデーターファイルのレコードとその関連するレコードを優先的に修正することも検討する必要がある。多重登録とは異なり,本人が配偶者,あるいは親,あるいは親の親などになっている,本人と配偶者の性別が同じ,などのエラーも存在し,これらは、データの見直しが必要である。例えば,男の配偶者数の最大は6人だが,その配偶者の1人が男になっているケースがあるため,確認と修正が必要である。

  • Research Products

    (1 results)

All 2023

All Presentation (1 results)

  • [Presentation] 家系図データを用いた中長期の人口変動:パプアニューギニアギデラ社会の例2023

    • Author(s)
      萩原 潤
    • Organizer
      日本人口学会第75回大会

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi