[AMD勉強会] AMDブロガー勉強会に行ってきた
AMDの「APU新製品」に関するブロガー勉強会 に申し込んだところ、幸い選考(抽選?)に通ったので、参加してきました。Twitterのハッシュタグは #AMD勉強会 です。とりあえずは、「参加の率直な感想をブログにアップする」ことが求められているので、まずはその記事を書きたいと思います。それと、今後の評価の方針など。
残念ながら、あまり写真は撮っておらず、また情報解禁日までに書いて良い情報と駄目な情報の区分を覚えていません(ぉぃ)。詳しい内容や、一般向けの用途での印象などは、他のもっと詳しい方の記事を参考にしてください。
2012年9月13日(木)の新宿某所のビルの一室での勉強会でした。20名ほどのブロガーの方々とAMDのスタッフの方々が数名。内容は三部構成。
全体として非常に面白いお話を聞かせていただきました。ご存じのように(?)、僕の興味はHPCとGPGPUなので、後半になるにつれてテンションが上がりまくるという状態でした。たぶん、他の方々は逆で、最後のGPGPUとOpenCL話はあんまり興味なかったんだろうなぁとおもうのですが(笑)。終了後にGPGPU担当の方と濃い話もさせていただいたので大変良かったです。
すいません、勉強会そのものについては、とりあえずこれだけです。
これからの評価方針
で、これから新APUの評価版とマザーボードを送っていただけると言うことなので、私の専門であるHPCとGPGPUの文脈から性能を徹底的に評価してみたいと思います。
APUのポイントは、やはりCPUとGPUが同じダイに載っているという点でしょうね。全体のメモリバンド幅はメインメモリのバンド幅になってしまうのでGDDR5には敵わない一方、PCI-Expressバスを通すよりは小回りが利くわけです。そのトレードオフを生かしてどのように適材適所で計算を行っていけば良いのか、というのが面白い課題ですね。ですから、力業でメモリバンド幅律速の計算を行う場合はdiscrete(外付け)のRadeonで行い、メインメモリ上の細かいデータ構造を触る場合はオンダイのGPUで計算を行う、などの使い分けができそうです。内蔵GPUからメインメモリにアクセスする場合のペナルティがどの程度なのかわかりませんがそれも評価対象ですね。
まだ書けませんが、発表された性能(GFlops)と値段(¥)のバランスもすばらしいと思います。ですから、例えば行列積で評価するとして、GFLops/¥ と GFlops/W がどの程度出るか。このあたりがポイントですね。既存のベンチマークがどの程度このような用途に適しているのかわかりませんが、とりあえず思いつくのはSHOCベンチマークです。
場合によっては、自分で行列積ルーチンを書く必要があるかもしれません。Radeon7970もあるので、内蔵GPU&外付けGPUの両方を使う場合や、Sandy Bridge+C2050/GTX580との比較もしてみたいですね(もちろん、実売価格の差を割り引いての話ですが)。
ここまでの評価が前座となる予定です。本番評価は・・・もう少し過激なことをしてみたいですね。デュフフ。