mdadm kickt hd immer mal wieder aus raid1

07/01/2015 - 03:05 von Kay Martinen | Report spam
Hallo.

ich habe hier ein Software-Raid1 auf einem Server mit Promise
Fasttrak/Ultra100 Controller, bestehend aus zwei fast gleich großen 20GB
IDE Platten.

Der làuft nun schon ca. ein Jahr (nicht uptime) und hat in der zeit nun
zum zweiten male eine der platten ohne mir ersichtlichen Grund aus dem
raid gekickt. Ich kann sie dann zwar wieder aufnehmen (aktuell mit
'mdadm /dev/md0 --add /dev/sdb1'), und nach dem rebuild làuft es dann
wieder. Aber es steht zu erwarten das es irgendwann wieder passiert.

Beim letzten mal hatte ich; vielleicht aufgrund eines eigenen Fehlers;
eine dritte Platte die mir zum Raid angezeigt wurde. Wieso weiß ich
nicht mehr und auch nicht wie ich das behob. Ist auch wieder monate her.

Wann wird eine platte aus dem raid raus geworfen? Und wenn, wo kann man
die schwellenwerte dazu eigentlich modifizieren? Ich vermute das es
evtl. daran liegt.

Ansonsten, vielleicht fàllt jemandem noch etwas dazu ein oder auf.

Darum hier mal ein paar Daten zum System:

root@gate:~# mdadm --detail /dev/md0
/dev/md0:
Version : 1.2
Creation Time : Fri Jan 31 04:20:04 2014
Raid Level : raid1
Array Size : 19532672 (18.63 GiB 20.00 GB)
Used Dev Size : 19532672 (18.63 GiB 20.00 GB)
Raid Devices : 2
Total Devices : 2
Persistence : Superblock is persistent

Update Time : Wed Jan 7 02:48:12 2015
State : clean
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0

Name : gate:0 (local to host gate)
UUID : 51ccb5f2:115ff38d:83b14aeb:a963f1ac
Events : 2397799

Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
2 8 17 1 active sync /dev/sdb1

Wie kommt eigentlich der unterschied in der minor-nummer? Ich dachte die
müsste bei gleichen platten an gleichem interface auch gleich sein.

root@gate:~# uptime
02:50:40 up 40 days, 6:35, 1 user, load average: 0,79, 1,01, 1,26
root@gate:~# uname -a
Linux gate 3.8.0-38-generic #56~precise1-Ubuntu SMP Thu Mar 13 16:23:47
UTC 2014 i686 i686 i686 GNU/Linux

root@gate:~# lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 19,1G 0 disk
└─sda1 8:1 0 19,1G 0 part
└─md0 9:0 0 18,6G 0 raid1 /
sdb 8:16 0 18,7G 0 disk
└─sdb1 8:17 0 18,7G 0 part
└─md0 9:0 0 18,6G 0 raid1 /
sr0 11:0 1 1024M 0 rom


ein paar lshw-auszüge

*-cpu
description: CPU
product: Intel(R) Pentium(R) III CPU - S 1400MHz
vendor: Intel Corp.
physical id: 400
bus info: cpu@0
version: 6.11.4
slot: CPU
size: 1400MHz
capacity: 1400MHz
width: 32 bits
clock: 133MHz
capabilities: boot fpu fpu_exception wp vme de pse tsc msr pae
mce cx8 apic sep mtrr pge mca cmov pse36 mmx fxsr sse


// hat 1.5GB RAM //

*-ide
description: IDE interface
product: VT82C586A/B/VT82C686/A/B/VT823x/A/C PIPC Bus
Master IDE
vendor: VIA Technologies, Inc.
physical id: 7.1
bus info: pci@0000:00:07.1
version: 06
width: 32 bits
clock: 33MHz
capabilities: ide pm bus_master cap_list
configuration: driver=pata_via latency2
resources: irq:0 ioport:1f0(size=8) ioport:3f6
ioport:170(size=8) ioport:376 ioport:90c0(size)

*-storage
description: Mass storage controller
product: PDC20265 (FastTrak100 Lite/Ultra100)
vendor: Promise Technology, Inc.
physical id: f
bus info: pci@0000:00:0f.0
version: 02
width: 32 bits
clock: 33MHz
capabilities: storage pm bus_master cap_list rom
configuration: driver=pata_pdc202xx_old latency2
resources: irq:19 ioport:7040(size=8) ioport:7080(size=4)
ioport:70c0(size=8) ioport:7400(size=4) ioport:7440(sized)
memory:80300000-8031ffff memory:80100000-8010ffff

Der Controller ist NICHT im Raid-Modus weil der dann nur FakeRaid kann
und linux nicht installierbar ist. D.H. der ist per Jumper auf IDE
umgestellt und meldet sich als Ultra 100.

Die beiden Platten hàngen allein an separaten Kanàlen, das CD-Lw. ebenso
am extra IDE-Port.

Kay
 

Lesen sie die antworten

#1 Tim Ritberg
07/01/2015 - 08:47 | Warnen spam
Am 07.01.2015 um 03:05 schrieb Kay Martinen:
Hallo.

ich habe hier ein Software-Raid1 auf einem Server mit Promise
Fasttrak/Ultra100 Controller, bestehend aus zwei fast gleich großen 20GB
IDE Platten.

Der làuft nun schon ca. ein Jahr (nicht uptime) und hat in der zeit nun
zum zweiten male eine der platten ohne mir ersichtlichen Grund aus dem
raid gekickt. Ich kann sie dann zwar wieder aufnehmen (aktuell mit
'mdadm /dev/md0 --add /dev/sdb1'), und nach dem rebuild làuft es dann
wieder. Aber es steht zu erwarten das es irgendwann wieder passiert.

Beim letzten mal hatte ich; vielleicht aufgrund eines eigenen Fehlers;
eine dritte Platte die mir zum Raid angezeigt wurde. Wieso weiß ich
nicht mehr und auch nicht wie ich das behob. Ist auch wieder monate her.

Wann wird eine platte aus dem raid raus geworfen? Und wenn, wo kann man
die schwellenwerte dazu eigentlich modifizieren? Ich vermute das es
evtl. daran liegt.

Ansonsten, vielleicht fàllt jemandem noch etwas dazu ein oder auf.

Darum hier mal ein paar Daten zum System:

:~# mdadm --detail /dev/md0


...


Das Kernellog fehlt...

Ähnliche fragen