FIDの変更するひとって結構いるっぽくて、人というかFIDの数でいうと全体の1%くらいがFID変更をしている。
正直ナメてた。よっぽどのことじゃない限りID変更なんてしないもんだろと思っていた。
だって、IDなんだよ?
ってとこでびっくりしている時点で、わたしはまだ人間がわかってなかった。伸びしろ。

見てると、文字列を見た印象からの変更理由は様々。
加入したチーム名つけるとか、Typoはもちろん、単純に飽き性、荒らしプレイヤーで証拠隠滅のつもりだとか、配信サイト変わったとかVtuberになったとか、PCとかPS4って文字をつけたり外したり。
事情があまりにもそれぞれなんで十把一絡げにやれない。
かといって、FID変えて過去歴が見られないなーってのも惜しい。
個人的な話で言えば、わたしはFIDを変えるって思考がそもそもないんで、追跡の必要ないんじゃねと思ってはいる。
なので、最も単純な対応方法としては「変更されたもとのIDは取得をやめる」が手堅いし、あんまり工夫がいらない。

いまのとこ集計は変更前後のどちらでも数字取ってるんで、1%くらいの無駄な取得を別人扱いでやってることになる。
ちなみにシャド研はこの辺すげーまじめにやってて、なんぼFID変更しても、すべて追従して表示できる。FIDとは別に通し番号持ってるからできる芸当なんだけど。
わたしから見るシャド研のWebサイトは、仕掛け的にはかなり堅牢だなと見えてて、アプローチも実直な感じ。そのぶん重いけど、その裏にはけっこうけっこうなインフラ料金が乗っかってるはず。デザイン面とかUXは話題に含めてないです。
うちはリアルタイムな情報なんて扱わずに、1日数回の更新済データを見せてるだけだから、彼らの扱ってるインフラと比べると実質無料くらいのコストしかかけてない。
APIサーバ公開してくれたらなー。すげー仕事できるエンジニアが気の利いたやつ作ってくれて、うちのページ閉鎖できるんだけど。

シャド研と同じこと(FIDの追跡と紐づけ)をやろうとすると、それを溜めこむテーブルが必要になる。RDBMSは料金が高いから趣味では絶対に使いたくない。KVSでもなんとかなるにはなるが、更新頻度が高いと料金に影響が出る。
そろそろ10万のオーダーになろうかというボリュームを一日なんどか更新すると割とお金かかっちゃう気がする。
バッチ処理の1%が事実上の無駄撃ちであることは無視できない。

もしくは名寄せまとめ帳みたいなデータだけもっておいて、MyRankとかは従来どおり表示、別に全件集計するぞとかのときに、変更前FIDは集計から外すとかかな。
いまのとこバッチで最もコストが高いのは取得だから、取得の工数が1%増えたままなのを無視するなら、だけれども。
もう少し考える。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です