機械学習系の「待ち」時間が90年代の音声や動画作成の「待ち」に感じる

画像の生成や機械学習を行っていると、とにもかくにも「待ち」時間が発生する。数千枚の画像をアップスケールするのに10時間、など。

これは90年代の音声や動画のエンコード待ち時間を彷彿とさせる。当時はアルバム一枚をエンコードするのに寝る前に「漬けて」おいたりした。動画に至っては専用のエンコードマシンを24時間走らせていたりした。

2023年になってそういう「待ち」が発生する作業がまたやってきた。

こういう作業で困るのは、トライアンドエラーが高速で回せないことで、これは高速で回せることがほとんど、かつ前提とした作業をしているととてつもなくつらい。

GPU にお金を注ぐが、クラウド資源にお金を払うか。いずれにしろまさにタイムイズマネーな現実がある*1

*1:さらに言えば、従量課金の Vision API などにもタイムイズマネー感がある

Powered by はてなブログ