乃木坂や豊田市、羽柴秀吉町などの人名と地名を関連させたデータベースを作ってみたいのですが、日本郵政から住所のexcel file、人名は歴史上の人名のデータベースから引っ張ってこようと思うのですが。その後どれだけの人数がいるのかを調べたいのですがどうしたら良いでしょうか?機械学習はkaggleでtitanicの問題は一応解いたことがある程度です。ここまでの内容でも、このフォーラムの趣旨とかけはなれていてたらすみません。

Edit1:

コメントで御指摘頂き、関連の定義が不明確という事。歴史上の人物、とりあえず国会図書館に人名が登録されている人を語源とする地名ー人名を関連させるデータを出してみたいです。