[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[plamo:25036] RAID DISK ERROR



御世話様です。石黒と申します。
相談というか、報告という感じです。

工場電気設備の年1回の定期点検後のサーバー起動後、dmesgに以下のログが
出されるようになりました。当初、アンチウィルスのフルスキャン時の10回ほ
ど。原因は、どうも私が停電中にSCSIコネクタの増す締めを行ってそれが原因で
RAID装置との通信が不良となり、/dev/sda3 がおかしくなったようです。
再度、接続し直したら、RAID側のエラーはなくなりました。
一応、別のパーティションにバックアップエリアがあったので、そこに
データを移動してしのいでいます。

-------------------- dmesg の内容 ---------------------------
scsi1: ERROR on channel 0, id 0, lun 0, CDB: Read (10) 00 35 b8 1b 6e 00
00 08 00
Info fld=0x0, Current sd08:03: sense key Medium Error
Additional sense indicates Unrecovered read error
 I/O error: dev 08:03, sector *******
-------------------------------------------------------------

《サーバーの構成》
plamolinux 2.2.6 改 kernel(2.4.27)
OSのデータ領域 /dev/hda (RAID1)
ユーザーデータの領域 /dev/sda (RAID5)
サービス: samba,http,dnsなど

あとショックだったのは、切り離した/dev/sda3 を 
# fsck /dev/sda3             <== 異常なし。
# mkfs -t ext3 -j /dev/sda3 <== 異常なし。 
# fsck -cfv /dev/sda3
したら、fsck中に大量のエラーログ(最後は、1秒間に、25回ほど)
がでて、且つ[error]というキーワードで、携帯にメールを送るように
していたため、大量のメールも飛んで、サーバーと携帯が固まって
しまいました。RAIDメーカーは、一度RAIDの再構成を行ってから使うように指示
されました。

一応、googleやここで検索して調査してみましたが、あまり同じ例や対策とかな
いような感じですね。
http://www.linet.gr.jp/~kojima/Plamo/ML/plamo-index/namazu.cgi?key=disk+error&max=20&format=long&whence=0


[検索ページ] [メール一覧]
Plamo ML 公開システム