TeamNIPPON 掲示板


過去ログ(〜2005/2/19)
 AOLアドレスやフリーメールアドレスを含む場合は投稿できません。

7 / 72 ツリー ←次へ | 前へ→


GPUによる解析 kurihara9028 08/12/12(金) 21:28

CUDA版テスト中です kurihara9028 09/2/15(日) 9:49
Re:CUDA版テスト中です kurihara9028 09/2/16(月) 1:54
Re:CUDA版テスト中です kurihara9028 09/2/18(水) 18:41
Re:CUDA版テスト中です pishi@TYD 09/2/20(金) 1:17
Re:CUDA版テスト中です kurihara9028 09/2/20(金) 21:50
Re:CUDA版テスト中です kurihara9028 09/2/22(日) 14:47
Re:CUDA版テスト中です kurihara9028 09/2/27(金) 22:21
Re:CUDA版テスト中です pishi@TYD 09/2/20(金) 1:27
Re:CUDA版テスト中です kurihara9028 09/2/20(金) 22:05
Re:CUDA版テスト中です kurihara9028 09/3/21(土) 14:50
astropulse_V5 kurihara9028 09/3/6(金) 19:19
ふと思ったのですが… ボケお 09/4/14(火) 23:03
Re:ふと思ったのですが… kurihara9028 09/4/17(金) 1:18
Re:ふと思ったのですが… ボケお 09/4/19(日) 22:33

CUDA版テスト中です
 kurihara9028  - 09/2/15(日) 9:49 -

引用なし
パスワード
   消費電力の増大が気にかかるところですが、GPU解析に挑戦中です。
http://setiathome.berkeley.edu/show_host_detail.php?hostid=3381996

思い切ってGTX295を投入してみましたが、最初はBOINCがGPUを1つしか認識してくれず、少々困りました。
途中で、複数のGPUを同時に利用するNVIDIAのマルチGPU機能が有効になっているのが原因と気がつき、機能をOFFにして個々のGPUが独立して動くようにしたら、2個同時解析するようになりました。
カードが1枚でも、載っている2個のGPUで擬似SLI?のような状態になっていたことに改めて気がつきました。

これでGPU2個とCPU4個の合計6個同時解析ができるようになりましたが、WUがCUDA版ばかり来てCPUが遊んでしまうような状態になりがちです。バークレイのサーバーはまだまだ安定していないようです。

消費電力を見てみると、GTX295の部分だけで約190〜220W消費電力が増大しています。CPUだけで解析していたときと比較してそれ以上に効率が上がっていれば良いのですが・・・。

ちなみに、GPUでの解析時間が1WUあたり90〜160秒で終わったような結果が出ていますが、実際には10分以上かかっています。
BOINC上のCPU時間はCUDA版に限っては全然あてになりません。

まだ標準状態での解析なので、CUDA版以外のWU解析の部分で最適化ができるか試そうかと思っています。
早くサーバー復活して、WUを十分に配布して欲しいです。
<Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; WOW64; SLCC1; .NET CLR 2.0....@FL1-119-240-184-115.chb.mesh.ad.jp>

Re:CUDA版テスト中です
 kurihara9028  - 09/2/16(月) 1:54 -

引用なし
パスワード
   >まだ標準状態での解析なので、CUDA版以外のWU解析の部分で最適化ができるか試そうかと思っています。

lunatics.kwsn.netのフォーラムを参考に最適化を試みています。
今のところ2つの方法で最適化していますが、どちらも万全ではなさそうです。

(1)CUDA版とastropulse版(SSE3最適化)を同時実行
 *思うようにap用のWUが来ないので、CPUが空いてしまいがちです。
(2)AKv8版(SSSE3最適化版)を4つ起動して、うち1つにCUDA版での解析を割り当てる(BOINC上はAKv8が4つ動いているように見えますが、タスクマネージャー上ではCPU使用率25%のAKv8が3つと0%のが1つ、そして数%のCUDA版が1つ動いています)
 *CPUコアがどうしても1つ空いてしまう。
 *複数のGPUに対応していない。

興味のある方はlunatics.kwsn.netのGPU crunching板を参考に試してみては如何でしょうか。私は下記を参考にしました。(注:アプリのダウンロードは要ユーザー登録)

http://lunatics.kwsn.net/gpu-crunching/modified-seti-mb-cuda-opt-ap-package-for-full-gpu-utilize.0.html
http://lunatics.kwsn.net/gpu-crunching/ak-v8-cuda-mb-team-work-mod.0.html

何か別の方法などが分かりましたら、是非ともご報告下さいませ。
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.6) Gecko/2009011913 Fire...@FL1-119-240-184-115.chb.mesh.ad.jp>

Re:CUDA版テスト中です
 kurihara9028  - 09/2/18(水) 18:41 -

引用なし
パスワード
   >(1)CUDA版とastropulse版(SSE3最適化)を同時実行
> *思うようにap用のWUが来ないので、CPUが空いてしまいがちです。

astropulse用のWUは慢性的に枯渇してるようですね。
Server statusを見ても、送出準備の項目はいつも0ですし、SETIのプレファレンスで、astropulse用のWUのみ受け取る設定にしても、BOINC上で

Message from server: No work sent
Message from server: No work is available for Astropulse
Message from server: No work available for the applications you have selected. Please check your settings on the web site.

と言われてしまいます。
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.6) Gecko/2009011913 Fire...@FL1-119-240-184-115.chb.mesh.ad.jp>

Re:CUDA版テスト中です
 pishi@TYD  - 09/2/20(金) 1:17 -

引用なし
パスワード
   > *CPUコアがどうしても1つ空いてしまう。
> *複数のGPUに対応していない。

cc_config.xml で同時に解析させたいユニット数を
設定していない場合には、
CPUコアのうち1つは、CUDAに餌をやることに徹するようです。
CPUコアを全部使いきるように設定すると、
CPUコアは片手間に、CUDAに餌をやらなければならないので、
若干効率が落ちるようです。
<Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR...@KD125052241117.ppp-bb.dion.ne.jp>

Re:CUDA版テスト中です
 pishi@TYD  - 09/2/20(金) 1:27 -

引用なし
パスワード
   >ちなみに、GPUでの解析時間が1WUあたり90〜160秒で終わったような結果が出ていますが、実際には10分以上かかっています。
>BOINC上のCPU時間はCUDA版に限っては全然あてになりません。

これは、CUDA版GPUの解析時間ではなく、
CPUがGPUに餌をあげたり世話をした時間ではないでしょうか?

90〜160秒はCPUが介入していたが、残りの10分はGPUが動いていたので、
CPU時間は、90〜160秒だけという?
<Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR...@KD125052241117.ppp-bb.dion.ne.jp>

Re:CUDA版テスト中です
 kurihara9028  - 09/2/20(金) 21:50 -

引用なし
パスワード
   pishi@TYDさん:
>cc_config.xml で同時に解析させたいユニット数を
>設定していない場合には、
>CPUコアのうち1つは、CUDAに餌をやることに徹するようです。
>CPUコアを全部使いきるように設定すると、
>CPUコアは片手間に、CUDAに餌をやらなければならないので、
>若干効率が落ちるようです。

cc_configを編集して、CPUコア数4+GPU1=5に設定はしておりましたが、上手く反映しないのでそのままにしておりました。しかし、よくよく見たらcc_config.xmlを\ProgramData\BOINCでなく、他のファイルと一緒に\ProgramData\BOINC\projects\setiathome.berkeley.eduに入れてしまうという初歩的なミスをしておりました。
ご指摘いただいて、改めて設定しなおしたらCPU4+GPU1=5個同解析するようになりました、ありがとうございます。
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.6) Gecko/2009011913 Fire...@FL1-119-240-184-115.chb.mesh.ad.jp>

Re:CUDA版テスト中です
 kurihara9028  - 09/2/20(金) 22:05 -

引用なし
パスワード
   pishi@TYDさん:
>これは、CUDA版GPUの解析時間ではなく、
>CPUがGPUに餌をあげたり世話をした時間ではないでしょうか?
>
>90〜160秒はCPUが介入していたが、残りの10分はGPUが動いていたので、
>CPU時間は、90〜160秒だけという?

ご指摘の通りですね、この場合CPUは解析でなくGPUが解析しているお世話しかしていません。

ちなみに10分少々で解析しているGTX295はBOINC上では(896MB,est.106GFLOPS)となっています。
これがGeForce 9600GTですと(512MB,est.37GFLOPS)となっていて、同等のWUでの実解析時間が約25〜30分といったところです。
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.6) Gecko/2009011913 Fire...@FL1-119-240-184-115.chb.mesh.ad.jp>

Re:CUDA版テスト中です
 kurihara9028  - 09/2/22(日) 14:47 -

引用なし
パスワード
   >興味のある方はlunatics.kwsn.netのGPU crunching板を参考に試してみては如何でしょうか。私は下記を参考にしました。(注:アプリのダウンロードは要ユーザー登録)
>
>http://lunatics.kwsn.net/gpu-crunching/modified-seti-mb-cuda-opt-ap-package-for-full-gpu-utilize.0.html
>http://lunatics.kwsn.net/gpu-crunching/ak-v8-cuda-mb-team-work-mod.0.html

V7、V8に次ぐV9の公開が始まったようですね。
http://lunatics.kwsn.net/gpu-crunching/v9-of-modified-seti-mb-cuda-opt-ap-package-for-full-gpucpu-utilization.0.html

複数GPUに対応(CUDA+astropulse)するものと、シングルGPU版(CUDA+setiathome_enhanced)と両方公開されてます。

ただ肝心のバークレイのサーバーが調子悪いので、なかなか思うようにWUの供給が無いのが残念です。
週明けの復旧を期待したいところです。
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.6) Gecko/2009011913 Fire...@FL1-119-240-184-115.chb.mesh.ad.jp>

Re:CUDA版テスト中です
 kurihara9028  - 09/2/27(金) 22:21 -

引用なし
パスワード
   ▼kurihara9028さん:
>V7、V8に次ぐV9の公開が始まったようですね。
>http://lunatics.kwsn.net/gpu-crunching/v9-of-modified-seti-mb-cuda-opt-ap-package-for-full-gpucpu-utilization.0.html
>
>複数GPUに対応(CUDA+astropulse)するものと、シングルGPU版(CUDA+setiathome_enhanced)と両方公開されてます。
>
早くもV10登場です。
取り急ぎテストしてみようかと思います。
http://lunatics.kwsn.net/gpu-crunching/v10-of-modified-seti-mb-cuda-opt-ap-package-for-full-multi-gpucpu-use.0.html
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.6) Gecko/2009011913 Fire...@FL1-119-240-184-115.chb.mesh.ad.jp>

astropulse_V5
 kurihara9028  - 09/3/6(金) 19:19 -

引用なし
パスワード
   最近配布されるようになった新しいverのAP用WUですが、解析にかなり時間かかるせいか、殆ど検証待ちでクレジットが付与されていません。
一つ解析するだけでクレジットが1200ぐらい付きますが、なかなか検証が終わりません。相手方のキャンセルや期限切れによる再配布も考えると、相当かかりそうですね。

当方では、Q9550(2.83GHz)でSSE3最適化した状態で12〜13時間位かかっています。
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.6) Gecko/2009011913 Fire...@FL1-119-240-176-96.chb.mesh.ad.jp>

Re:CUDA版テスト中です
 kurihara9028  - 09/3/21(土) 14:50 -

引用なし
パスワード
   >>これは、CUDA版GPUの解析時間ではなく、
>>CPUがGPUに餌をあげたり世話をした時間ではないでしょうか?

boinc manager ver6.6.17を入れてみたところ「経過時間」として表示されるようになり、GPU解析中も経過時間がカウントされるようになりました。
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.7) Gecko/2009021910 Fire...@FL1-119-240-176-96.chb.mesh.ad.jp>

ふと思ったのですが…
 ボケお  - 09/4/14(火) 23:03 -

引用なし
パスワード
   >WUがCUDA版ばかり来て…

CUDA版のWUって、普通のCPUで解析するWUとどう違うのですか?
なんでこう言う質問をするのかというと、自分の解析しているWUに、別のCUDA機能を使って解析していると見えるパソコンが絡んできてるケースが多数見られるためです。

要するにWUにCUDA版とかCPU版とかの違いはないと思っています。
有るとすれば(CPU解析速度により?)、WUの大きさを変えているものがあるだけではないかと…。
↑のような発言をみて、何か特別な違いがあるのか気になっているのです^^;
認識を深めたいと思っているので、是非ご教授願いたいと思っています。

それと、関係ないですが、GPUを使うとめちゃくちゃ早くなるんですね。
なんでですか?
自分のパソコンと似た環境の方でも、GPU使ってる方は数十秒から数百秒って…。
単純に「餌やり時間」だという記述もあるけど、別の部分では10〜30分程度とも書いてありますね。それでも短いと思っています。
ちなみに自分の環境だと、「小さな」WUで3000〜4000秒台、いつも解析している「普通」のWUでその倍です。
<Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; GTB5; SLCC1; .NET CLR 2.0.5...@cad456-231.dynamic.tiki.ne.jp>

Re:ふと思ったのですが…
 kurihara9028  - 09/4/17(金) 1:18 -

引用なし
パスワード
   >要するにWUにCUDA版とかCPU版とかの違いはないと思っています。
確かに違いはないと思います。
CUDA用にダウンロードしたWUをapp_info.xlmを書き換えて、CPUで解析するようにした時も普通に解析できていました。
解析時間で見れば、CPU(Q9450@2.66GHz)でSSE4.1最適化したものが約2700秒、CUDAでGT9600が約1500秒、GTX295で900-950秒といったところで、差が出ています。
また、同じWUを同等のCPUで解析している他のPCを見ると、最適化していないと倍以上の時間がかかっていますし、PenD,Pen4といった古いCPUですと、更にその数倍の時間がかかっています。かなり古めのモバイルCPUですと信じられないような時間がかかる場合があります。
演算能力やCPUの実行できる拡張命令によって解析時間にはかなりの差が出ます。

ただ、それほど大きな差が無い自分の環境(最適化は全てのPCで実施済み、CPUの性能はクロック以外は同じ)で、「消費電力」という点から見てみると、それほど差はありません。

・最小構成、オンボードVGAのQ9450マシン → 120W RAC 6000〜6500
・上記マシン+GT9600          → 185W RAC 9000〜
・最小構成+(GTX295×2)のQ9550マシン → 580W RAC 22000〜

1ワット当たり、大体38〜55クレジットでそれほど大きな差はありません。
ハイパワーマシンほど電力消費に無駄があるようにも思います。
早く解析できても、コスト面からはそれほど差は無いと言えるかもしれません。


正直なところ、かなり暖かくなってきたので、現在のペースでの解析はかなり厳しいです。
ホームユーザーなので、消費電力の増大が我が家の財務大臣の許容限度をとうに超えてしまっていて、そろそろ規模縮小せざるを得ない状況です…。
<Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.8) Gecko/2009032609 Fire...@FL1-118-111-59-121.chb.mesh.ad.jp>

Re:ふと思ったのですが…
 ボケお  - 09/4/19(日) 22:33 -

引用なし
パスワード
   >確かに違いはないと思います。
>CUDA用にダウンロードしたWUをapp_info.xlmを書き換えて、CPUで解析するようにした時も普通に解析できていました。

なるほど、app_info.xlmにWUをCPUで解析させるかGPUで解析させるか書いてあるわけですね。でもWU自体はどっちでも解析できると。


>解析時間で見れば、CPU(Q9450@2.66GHz)でSSE4.1最適化したものが約2700秒、CUDAでGT9600が約1500秒、GTX295で900-950秒といったところで、差が出ています。
>1ワット当たり、大体38〜55クレジットでそれほど大きな差はありません。
>ハイパワーマシンほど電力消費に無駄があるようにも思います。
>早く解析できても、コスト面からはそれほど差は無いと言えるかもしれません。


なるほど、おおよその解析時間が分かりました。CUDA版で解析してるパソコンは「餌やり時間」を記録しちゃうようだから誤解を招きやすいですよね。にしても早いです。
ところで、本日パソコンショップに行き、店員にCUDAのことで聞いたら、GF7800時代にはすでに提唱されていた技術だからその頃のグラボでもCUDA使えない事もないですよと言っていました。
あと雑誌にも出てたけど、ソフトで強制的にグラボにCUDAみたいな事をさせるものもあるようですね。
それだとGFのグラボじゃなくてもオンボードGPUでも可能なものもあるようです。
でもsetiでGF7800のグラボにCUDA機能持たせるって…果たして出来たのかな?
それが出来たら、たった3000円程度の投資で電力消費も100W行くか行かないかの増加でCUDAやれるんですがね^^;


>正直なところ、かなり暖かくなってきたので、現在のペースでの解析はかなり厳しいです。
>ホームユーザーなので、消費電力の増大が我が家の財務大臣の許容限度をとうに超えてしまっていて、そろそろ規模縮小せざるを得ない状況です…。


私はケースの横面を取っ払い風通しを良くしていますが、ちょっとこの夏が心配です^^;
setiのせいでパソコンがフリーズとかするようになれば私もちょっと考えないといけなくなるやもしれません。
<Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; GTB5; SLCC1; .NET CLR 2.0.5...@cad456-231.dynamic.tiki.ne.jp>

7 / 72 ツリー ←次へ | 前へ→
ページ:  ┃  記事番号:
109,574
(SS)C-BOARD vv3.8 is Free.





SETI@home TeamNIPPON OFFICAL BBS