森高千里データベースの復元

私が森高千里さんのデータベースを公開し始めたのは、mosaic というブラウザが使われていた頃(平成5年頃)でした。新し物好きの私は、HTML を直書きして当時はまっていた森高千里さんのデータをまとめていました。最初は森高 MLで流れてきた情報をひたすら手で追加し、ある程度まとまったところで、アーカイブして ML に投げるという形でブラッシュアップしていきました。当時はほとんどの人がインターネットリーチャブルではなかったですし、今では考えられない社外アクセス規制などもあったため、配布したものをローカルに保存して見たり、社内のサーバに設置して見たりという形だったようです。

流石に大学に私的なコンテンツを置くわけにもいかず、当時プロバイダの草分けだったリムネットと個人的に契約してコンテンツを管理するようになりました。当時はモデムでの接続であり、電話代を節約するためにメールやニュースを uucp で取得していた時代です。そのため、通信データ量(料金)を削減するために、HTMLを転送するのではなく、基礎となるデータから自動的にページを生成するようにしました。リムネットは当時でも珍しくサーバ上のシェルを使わせてくれるプロバイダであったため、Berkeley DB を使った簡易な Perl スクリプトでコンテンツを自動作成していました。十数個の基本データから、日本語・英語版の 1000ページ弱のページを作成したいたと思います。

その後、OCN エコノミーの契約をして自宅サーバに移りましたが、2001年頃には新しいデータは補充しなくなり、静的コンテンツのみ細々と公開していました。また、数年前の引越しと共にデータも MobileMe のサーバに引っ越したものの、MobileMe の終了と共にコンテンツが消えてしまいました。

しかし、デビュー25周年を迎え本人の活動が活発になったこともあり、これを機会にデータの再構築をしようと思い立ちました。独学で学んだこととは言え、仮にも職場で運用されているデータベースシステムを構築してきました。当時に比べればシステム設計についても、かなり成長してるんではないかということで、設計から含めて再構築してみようかと思い立った次第です。当時に比べたらマシンパワーも格段に上がっていますし、データベースシステム自体もかなり使いやすくなっているので、今回は動的な生成ページを作成する予定です。

以下の基本機能は当時のものを変えずに保持する予定です。

  • 日本語と英語の両対応とします。
  • アルバム、シングル、ビデオ、コンサート、コンサート会場、関係者、曲などの情報を網羅的に提供し、それらの間を相互リンクします。
  • データベースの元となっているテキストデータはかなり大きく手を付けるのは大変なので、このテキストデータを生データとして、データベースに流し込む元データを作成します。今後もこのテキストデータをメンテすることで、データベースに差分を流し込んでいきます。

最新の環境に合わせ、以下の機能は変更します。

  • 当時はブラウザ依存を考えテーブルは使っていませんでしたが、今回はテーブルを使って見やすい表示を目指します。
  • 静的なコンテンツではなく、Rails による動的なコンテンツにします。
  • 日本語、英語のコンテンツは同一とし、locale を判断し、対応した言語のページを表示します。
  • 当時のデータベースは正規化が完全に行われてなかった(当時はそんな知識はなかった)ので、今回はテーブルの一部見直しを行います。
  • アルバム、シングル、ビデオなどのテーブルはかなり似通った構造になるので、Rails の単一テーブル継承(STI)を使って記述を簡略化します。
  • 物理メディアの情報だけでなく、iTunes Store へのリンクも追加します。
  • YouTube に公式コンテンツが上がるようになったので、そこへのリンクを追加します。

肝心のサーバですが、規模が小さければ Heroku が使えます。アクセスが多くなると有料になってしまいますが、とりあえず無料でどこまで使えるかをみてみたいと思います。