本当は怖いHPC

HPC屋の趣味&実益ブログ

2014-02-17から1日間の記事一覧

StreamSamplerを書きなおした

以前にPythonで書いたStreamSampler(Reservoirアルゴリズムによってデータからランダムに要素を取り出すプログラム)なのだが、C++で書きなおした。実際に使ってみて、かなりCPU負荷が高くて困っていたからだ。例えば、 $ bzcat data.bz2 | python streamsa…

【広告】