森高千里データベースの再構築(39) : hkob の雑記録 (308)

はじめに

hkob の雑記録の第308回目は、Years のリストを作成するとともに、Year ページのコンテンツを年ごとに Official page から吸い出してみます。

Years 一覧の作成

Years の一覧もこれまで通り Year Lists の feed view を用意しました。1ページ目には Table view を用意しています。これ以外に Chart view を追加予定ですが、ある程度データが揃ってからにします。

feed view を用意

Biography からのデータ取得

現在、オフィシャルの Biography にはかなり細かくデータが揃えられています。

www.moritaka-chisato.com

2000年代前半くらいまでは Mailing List も活発でデータが揃っていましたが、その後のデータはほとんど入っていません。そこで、Biography に含まれているデータを Year のコンテンツとして抽出する作業を Notion AI で実施して見たいと思います。ここでは以下のようなプロンプトを実行してみることにします。

https://www.moritaka-chisato.com/biography に森高千里さんの BIOGRAPHY, LIVE・EVENT, CM の情報がまとめられています。そこで、以下の手順で Years のデータソース内の年ごとのページに情報を抜き出してください。
1. Years のデータベースに「BIOGRAPHY取得完了」、「LIVE・EVENT取得完了」「CM取得完了」の三つのチェックボックスプロパティを作成します。
2. 1986 のページから 2025 のページまで以下の 3 から 5 の作業を繰り返してください。以下の説明では年の部分を XXXX として表記します。
3. 見出し1ブロックで「BIOGRAPHY」と書いた後に、BIOGRAPHY の部分に書かれているXXXX年のイベントを XXXX のページのコンテンツに箇条書きで書き出してください。その年度の書き出しが終わったら、BIOGRAPHY取得完了にチェックしてください。
4. 見出し1ブロックで「LIVE・EVENT」と書いた後に、LIVE・EVENT に対しても BIOGRAPHY と同じ処理をしてください。
5. 見出し1ブロックで「CM」と書いた後に、同様に CM に対しても CM と同じ処理をしてください。
6. もし処理が途中で終わってしまった場合には、チェックボックスの状況を確認して、完了していない部分から続きを実行してください。

実行してみました。

最初の実行

プロパティは作成したようです。

プロパティ作成は完了

残念ながらページが大きすぎて、タイムアウトしてしまったそうです。

失敗結果

テキストをページ化して再挑戦

URL アクセスではタイムアウトしてしまったようなので、Notion にテキストで3つのページを作成しました。このページ自体も copy & paste ではうまくいかず、テキストファイルからインポートすることでようやく準備できました。これはかなり時間がかかりそうです。

ページを準備

この 3 つのファイルを使って、再度実行してもらうようにお願いします。

URL アクセスではタイムアウトしてしまったようなので、以下の3つのページにテキストで内容を準備しました。これで作業してください。
1. BIOGRAPHY
2. LIVE・EVENT
3. CM

実行してみました。

ページ情報で再実行

うまく動いているようです。

実行中画面

とりあえず、1986年から1990年まで作成してくれたようです。

1986年から1990年まで作成

試しに 1990 年を確認してみます。3つの完了チェックは正しくチェックされているようです。

1990年ページのプロパティ

BIOGRAPHY の部分も入っているようです。

BIOGRAPHY の部分

LIVE・EVENT の部分も問題なさそうです。

LIVE・EVENT の部分

CM も正しく入っているようです。

CM の部分

最後まで一括更新

特に問題なさそうなので、このまま続けてもらうことにします。

最後まで一括更新

あとは終了まで待つだけです。

実行中画面

途中停止からの再開

2002年まで実行したところで止まってしまいました。

途中停止?

途中で止まらないようにチェックボックスをつけていたのですが、そのことを忘れてしまったのかもしれません。再度それを追加で依頼してみます。

再度依頼

まだ前の作業が実行中に処理を依頼してしまったようで、処理が分割してしまったようです。

再依頼の結果

再度、依頼して見ました。

再度依頼

2025年までは完了しました。

2025年まで完了

ただ、4年ほど処理抜けしているようです。

処理抜けあり

追加で依頼してみます。

抜けている年を再依頼

すべての年にチェックは付きましたが、2005 年以外は空のままでした。

チェックボックスは設定された

再度ちゃんと作業をやるように依頼します。

再依頼

今度はちゃんと作業したようです。

すべてのページが完了

おわりに

オフィシャルに書かれている情報を Year のページに抜粋することができました。ここに書かれた内容と Notion と比較することで、情報が抜けている部分を抽出していきたいと思います。

hkob.notion.site