本当は怖いHPC

HPC屋の趣味&実益ブログ

2013-11-16から1日間の記事一覧

大量のデータから一定個数のデータをランダムに採取するReservoirサンプリング

大量の実験データがあるが、馬鹿正直に全部プロット等すると時間がかかりすぎる。実験の初期段階とかで試行錯誤しながら素早く作業をしたい時には、一定個数のデータをランダムに抜き出してプロット等したい事が多い。そのとき、全体の個数の見当がついてい…

【広告】