MyRankとかを支えるバッチ処理は、

  1. 頼まれてもいないのに収集するやつ 3時間
  2. 登録された人を収集するやつ 30分
  3. それらを集計して表形式のデータにするやつ 30分

のざっくり3つでできている。
(1)のデータの母数は10万人を超えとるのだが、いまは5等分にして一日の処理数を抑えてる。
(2)はMyRank登録済のみなさんで、毎日収集してる。ボリュームはまだ4桁で収まってるせいもあって、一日2回くらい動いてるかも。
(1)は誰も見に来ないデータだけど、プレイヤーの全体的な傾向とかを取りたくてこの遊びをやってるからめちゃ大事。どっちかというと、ついでにやってるのが(2)。
MyRank見てる人で「何故か最初からグラフがある程度描かれていた」なら、たまたま(1)の収集対象に含まれてたから。

今月の利用料4400円

GCPというGoogleのクラウドを使って作ってるんだけど、利用者割引込みでも今月だと4000円ちょい。
コストの大半をバッチ処理で借りるコンピュータリソース(Cloud Run)が占めてて、漸増している。
今年の6月の利用料金みたら1000円くらいだから、ずいぶん増えた。
いまは使うときだけお金かかるやつにしてるんだけど、あんま増えすぎるようだったらサーバ借りっぱなし(たぶん5~6000円)のほうが安く付きそうだから、要検討だなあ。

FIDを収集するスピードを考えたら、(1)の処理を頻繁に回したい。(1)の処理を日で分散せずに全量回すだけでもコストが5倍になるから、そうもいかない。
個人で遊ぶにしてはディスク代もかかってる方だとは思うんだけど、まだ数百円の規模。
一方、みんながみてるWebページとかは無料枠で収まってて、お金かかってない。今はね。

カネかかってんだぞ的なことを言いたいわけでないです。カネかけてんのはわたしの都合。
そもそも通勤がなくなってランチ代とか電車賃が消滅しとるから、浮いたお金で遊んでるだけ。
この辺の肌感とか、ノウハウが後で仕事に生きたりしちゃうから、トータルではプラスだと思っている。
これは日記なんで、単純に記録として書いてます。

金額もさることながら処理時間もそれなりになってきている。
一日あたりの実行時間が2時間かかるようになったのが8/10、10/16には3時間を超えるようになった。
年内には4時間を超えるかもわからん。
少し上で5等分してますの話があったけども、全量やると3時間x5で毎日15時間のバッチ処理をやることになる。流石に無理がある。

スト6になればアクティブなプレイヤーもシャド観の利用も激減するし、スト6用の仕掛けを(カプコンが気の利いた何かを用意しなければ)わたしも作るであろうから、最終シーズンにMyRankとかの公開をしたのはちょうどよかったかもしれない。

一方でスト6は壮絶な初速を記録するだろうから、シャド観と同じノリで集計回したら即死しかねない。とくに最初の数カ月はアクティブ数百万のオーダーになるだろうから、余裕で毎月10万円コースよ。
なんぼなんでも無理よね。仕掛けの最初をどう作っておくかは今から考えておきたいけれども、そもそも収集が可能な状態で公開されるのかとか、今から気にしても仕方ない部分もけっこうある。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です