2014年3月2日日曜日

いつまで経っても不安定。。Mining Rigを自作する その7 GPUがDEADする



未解決ですが、現状発生している不安定な事象を並べておきます。

  • 起動
3回に1回ぐらいは起動に失敗します。

まず、OSが正常に起動しないケースがあります。
ターミナル画面でなにやらエラーが出ていたり、X起動のタイミングあたりでフリーズしたり。

また、GUI画面が起動しても色々と問題が発生します。
まず、カーネルエラーみたいのが出ていて何も出来なかったり、エラーは出ないものの何も出来なかったり。
そしてOSがきっちり立ち上がった場合も、GPUを認識していないことがあります。

このあたりはBAMTの問題の可能性もありますので、Ubuntuでやってみるなど切り分けが必要です。


  • シャットダウン

シャットダウンやリブートがうまくいかないケースがあります。

まぁシャットダウンしたい時は、大体何か問題が起きているので、そもそも既にフリーズ気味なのかもしれません。

ここだけでもクリアしないと、遠隔で操作するのが面倒なので、我が家のリビングはRigに占拠されたままです。
(暖房代わりにもなるんでいいんですけど)


  • GPU2の問題
一番外側(CPUから一番遠い)のPCI Express xx16スロットがGPU2になっています。
(反対側の端のPCI Express x1スロットがGPU3になっているようで、ルールがよく分かりません。)

そしてかなりの高確率でこうなります。
cgminer上で該当GPUが「SICK」や「DEAD」の状態のようです。

もう少し長生きするケースもあります。

ただ、一旦うまく動き出すと、数日動いたままのこともあるので、何がトリガーになっているのか良く分かりません。

切り分けをするのに厄介なのが、確実に起きるわけではないという点と、前述した起動時の不具合です。

配線を変更したあと起動しなくなっても、それがいつもの起動時の不具合なのか、配線変更によるものなのか、すぐには判断出来ません。


まずは、PCI Express延長ケーブルのせいかと思い、別のケーブルに交換してみましたが、かわらず発生します。

また、該当GPUが瀕死なのかと思い、GPUの配置を変更してみましたが、同じくGPU2がDEADします。

ケーブルでもGPUでもないなら、マザボのスロットが疑われますが、該当のスロットを使わずに5枚挿ししたところ以下です。

海外のフォーラムなどを検索すると、同じように1枚だけDEADする的な質問が投げかけられていますが、cgminer.confの設定に関するアドバイスがされるなど、決定的な解決には至っていないように見えます。

この件が解決しない限り、フリーズしている時間などロスが発生して、本来の効率でマイニング出来ません。

どうしたものか。。


0 件のコメント:

コメントを投稿