ランダムな文字列を組み合わせてダミーデータを生成するというようなものをよく見かけるが、郵便番号とそれに紐づく住所までは現実世界のとおりで、その先は実在の人物に照合しないようにランダムで、ということをやりたい。

郵便番号は実在の番号(たとえば郵便番号から住所を補完するライブラリなりサービスを使う場合は実在の郵便番号であってほしい)を使うことになりがちなので、郵便番号に対応する住所がよい(たとえば郵便番号から住所を補完するライブラリなりサービスを使う場合に、対応しない郵便番号と住所のデータがあると誤入力なのかバグなのか区別しづらくなる)。

実際に誰かが住んでいる建物のある住所はなにか起きるとなにか起きる。

そのようなニーズがある。

たとえば公園のような公共の場所だとどうだろう。なにかが起きたとしても公園なので影響は小さそうだ。

公園、小さなものはそれこそ無数にあり、列挙するだけで一生涯を終える可能性がある。それなりに大きな公園でも全国にはたくさんあるのでこれで充分と思われる。そしてそのような公園の一覧はなにかしらのサービスによって公開されている。

たとえばこういうサイトがある。

東京都の大規模公園一覧

過度に負荷をかけない程度にデータを収集するぶんには利用規約の禁止事項に抵触しない範囲内での利用にあたると思われる。さっとスクレイピングして手元にデータを落とすくらいは、まあ大丈夫じゃないかと思う。

住所しかないので郵便番号は自前で取ってくる必要がある。まあうまいことやりましょう。

テストデータなので郵便番号に対応する住所以下が実在する必要はないので、架空の番地や建物であっても構わない。公演名を架空の建物名などにするとそれっぽくなる。

とはいえうっかり「東京都千代田区千代田1-1」みたいなデータで遊んだりするとイシューがありそうな気がしないでもない。

というようなことを参考にしつつ各々よきにはからってほしい。どっとはらい。