生成AIは「住所の正規化」の救世主になりうるか

Geolonia代表の宮内が語る「日本の住所」問題(その3)

SNSで話題になった「日本の住所」問題について、Geolonia代表の宮内が語る第3回は、住所の正規化に対するオープンソースや生成AIのアプローチについて語りました。

第1回:日本の住所は“うまく整備されているほう”!? 大事なのは「地域の多様性」
第2回:“鼻血が出た”あの日から早3年、大きく進歩した「日本の住所の正規化」
第3回:生成AIは「住所の正規化」の救世主になりうるか

住所正規化の精度を飛躍的に向上するオープンソースのアプローチ

Geoloniaで住所の正規化に取り組むときに大事しているのは、オープンソースのアプローチです。Geoloniaの住所正規化エンジンでは、正規化できない住所がある場合はストックして、その後 CI/CD と呼ばれる手法で永続的に正規化できるようにテストケースを増やすことで正規化に取り組んでいます。

当初のうちはこのテストケースを自分で作成していたのですが、その頃の件数は数百件程度でした。しかし、このテストケースをオープン化することで、当社のエンジニアだけでなく、地図や位置情報に関するコミュニティの皆さんにも手伝っていただくことができ、現在テストケースの総数は7,000件に達しています。

Geoloniaが公開しているオープンソースの住所正規化ライブラリ

オープンソース化することのメリットは、このように多くの人によってテスト作業が行われることで「どんどん精度が上がっていくかしかない」という状況を作れることなんですね。このオープンソースのアプローチこそがGeoloniaのエンジンの強みだと思います。

生成AIによる住所正規化は「インフラの負担」が課題

最近は生成AIが話題ですが、将来的にはAIを使って住所を正規化するという方向もあるとは思います。住所の正規化ライブラリは、ゼロの状態から開発を始めてノウハウを積み上げながら完成させるというやり方だと、おそらく1~2年はかかると思いますが、AIを使えば数日で正規化ライブラリを作ることも可能でしょう。

Geolonia代表の宮内隆行

ただしAIは無料で考えてくれるわけではありません。ChatGPTも本格的に使おうとすると月額料金がかかります。つまり、住所を正規化するためのAIの料金を誰が負担するのかというインフラの課題があり、この料金を誰が負担するのかということを考えると、政府がITインフラを提供できない限り、実用は難しいかもしれません。

一方、住所マスターを作る過程でAIを使うという活用方法はあるとは思います。Geoliniaで提供している住所の正規化エンジンなら町丁目・町字までは無料で利用できますし、正規化のアルゴリズムも公開しているので、住所マスターをAIで作り、うまく行かない場合はGeoloniaが公開しているデータを使って自分で修正する、という組み合わせもできます。

生成AIは本人確認での活用に期待

この他にAIが役立つ場合があるとしたら、「集合住宅の何号室か」といったラストワンマイルを特定する用途には良いかもしれません。

マイナンバーカードでも、保険証に登録している住所とマイナンバーカードに記載されている住所は違うことがありますし、そもそも保険証には住所が記載されていません。それに保険証だけでなく、免許証に記載されている住所もフォーマットが異なります。そのため、登録した住所に間違いがあった場合は、異なる住所の2人をどうやって同一人物と判断するかという問題が生じます。

マイナンバーカード

これは住所を使う目的が物流とは違い、「異なる住所だけど2つは同じである」ということを判断させる使い方で、このようなケースではAIのほうが確実である可能性が高いです。どうせ人間でもAIでもミスは起こるのだから、将来的には「確率で考えればAIを使うほうがマシである」ということに落ち着くかもしれません。

AIの進化がもたらす変革だけでなく、今後は相続登記の義務化とか、戸籍の氏名や住所にふりがなを付けることが義務化されるなど、様々な制度変更が行われる予定なので、このような変化が住所や氏名の“正規化”にどのような影響をもたらすか興味深いです。

URL

Geolonia 住所データ | japanese-addresses
https://geolonia.github.io/japanese-addresses/

関連記事RELATED ARTICLE