職場で使っていたBUFFALOのNAS「TeraStation WS5400DR2」が故障したときの調査/復旧方法をメモしておきます。
故障発生
(担当者A談)
ビルメンテナンス(停電)がありNASを停止した。
翌日、NASを起動しようとしたがERRORランプ(赤)が点灯、警告音が鳴り起動できなかった。
うろ覚えだが、液晶には「E30」(HDx Broken E30 Replace the DISK)が表示されていたと思われる。
NASの構成確認
NASの機種は以下の通り
- メーカー:BUFFALO(バッファロー)
- 機種:WS5400DN2
- OS:Windows Storage Server
- ディスク数:4
- RAID構成:RAID1(ミラーボリューム)
RAID1(ミラーボリューム)ということで、システム領域、データ領域が以下のように構成されています。
原因調査
よくある故障原因
単純に「NASの故障」という観点で調べたところ、故障個所として以下のようなものが考えられるようです。
- ディスクの物理的な故障
- NASのシステム領域(HDD認識・RAID構築を司る部分)の故障
- NASの箱(制御基板、電源回路等)の故障
- ネットワークの故障
今回は、「ディスクを交換してください」とエラー表示されているので、1.または2.が疑われました。
サポートの見解
BUFFALOサポートに問い合わせたところ、以下のような回答を得ました。
NASのOSが起動しないようなので、システム領域が破損している可能性が高い。
原因はディスクの物理的な故障と判断した
システム領域が含まれるディスクである「ディスク1」を引き抜き、「SATA-USB変換ケーブル」でLinux端末に接続しましたが認識できませんでした。
そのため、この時点で直接原因は「システム領域を含むディスクの物理故障」と判断しました。
ただし、ディスク2~3についても同様に「SATA-USB変換ケーブル」で認識できませんでしが、あとで中身を復旧させることは出来ました。
なので、「SATA-USB変換ケーブルで認識できない」=「ディスクが物理的に故障している」ではないので、諦めないことが重要かと思いました。
データサルベージ
サポートの提案
試しに、新しくHDDを購入しディスク1と差し替え、付属のリカバリー用USBメモリーでリカバリーした後NASを再起動すれば自動的にRAID再構築が走り元に戻る可能性がある。
上記の通り実施してみましたが、RAID再構築は走らず復旧せず・・・。
とは言え、この時点でリモデでNASのWindowsStorageServerに繋がったので、3.NASの箱や4.ネットワークは問題なく、ディスクの物理的な故障だったのは確かなようです。ありがとうサポートさん。
どのディスクが故障??
ディスク1は故障だとして、ディスク2~3の状態はどうか??
上記手順によりWindowsStorageServerを新規構築した状態になったので、そこからディスク2~3の状態を確認すると「異形式のダイナミックディスク」となっており、アクセスすることはできず・・・。
OSを再インストールしたのだからディスクを認識していないのはあたりまえかと、「異形式のダイナミックディスク」について調べると以下のような記事が。
ディスクの管理で「形式の異なるディスクのインポート」を実施することで、ディスク2~3の中身が無事確認できるようになりました。
結果、ディスク2~3は故障していなかったと言えます。
とりあえずアクセスできたのでデータ退避
ディスク2~3にアクセスできるようになったので、いまのうちにデータを全て別端末にコピーして退避しました。
この後、RAIDを再構築していきます。
NAS復旧
Raid復旧でOSの復元を試みる
上記「ディスクの状態」の通りディスク2にoldシステム領域(OS)が存在するので、ディスク2からディスク1にシステム領域を復元できれば、各データ領域をもう1度oldシステム領域に対し「形式の異なるディスクのインポート」をすることで復旧できると考えました。
そこで、マニュアルを参考にBUFFALOのRaid管理ソフト「Raid Builder」を使用してディスク2からディスク1にシステム領域を復元させようとしました。
結果、「Raid Builder」でディクス2からディスク1への復元操作はできませんでした。
- 操作:「スタート」-「Raid Builder」をクリックし、プルダウン「システム領域のミラーボリュームを作成/修復する」を選択した。
- 結果:ディスク1のチェックが外せず、ディスク1を他のディスクにコピーすることしか選択できなかった。
NASを初期化することに
この時点で以下の理由からRaid復旧を諦め、NASを初期化し退避データを戻すこととしました。
- データ領域は全て退避できた
- Raid管理ソフト「Raid Builder」を使用した復旧は困難であることが分かった
- そろそろ時間切れ(早くNASを使ったファイル共有を行いたい)
あとは、マニュアルに沿って淡々と作業を進めていきました。
- ディスクフォーマット
- Raid1構築
- 退避ファイルを各ディスクに戻す
まとめ
ここまでが、NASの故障発覚~解析~復旧までの流れでした。
NASは良好
復旧作業の結果NASの状態は良好です。ファイル欠損など見られず、またディスクアクセスも特に問題ないようです。
振り返り
結果的にファイル欠損などなく元に戻せたので問題はありませんでしたが、今回の復旧手順は決して最適解ではなかったと思います。
解析の初期段階ではわかりませんでしたが、結果としてはディスク1のみの単独故障だったので、Raid1の片側ディスクの故障であれば逆側ディスクで復旧するのがあるべき姿かと。
「初めて」、「分からない」、「急ぎ復旧」などの要因でディスク交換の方法は何か「悪手」を踏んだかもなと思います。
また、NASでRaidを組んだとして、ディスク故障には耐えられますが「箱」の故障を想定してNAS外へのバックアップも検討が必要であると認識させられました。
参考
以下のサイトを参考にさせていただきました。
コメント