SATA-Fehler

04/04/2012 - 21:20 von Jan Schmidt | Report spam
Hallo Leute,

nach langem störungsfreiem Betrieb konnte ich plötzlich nicht mehr
auf eine Platte zugreifen. Nach Reboot meldet dmesg:

[ 0.263458] SCSI subsystem initialized
[ 0.263475] libata version 3.00 loaded.
[ 0.844236] ahci 0000:00:11.0: version 3.0
[ 0.844260] ahci 0000:00:11.0: PCI INT A -> GSI 22 (level, low) -> IRQ 22
[ 0.844461] ahci 0000:00:11.0: AHCI 0001.0100 32 slots 6 ports 3 Gbps
0x3f impl SATA mode
[ 0.844498] ahci 0000:00:11.0: flags: 64bit ncq sntf ilck pm led clo
pmp pio slum part ccc
[ 0.845759] scsi0 : ahci
[ 0.845915] scsi1 : ahci
[ 0.846024] scsi2 : ahci
[ 0.846131] scsi3 : ahci
[ 0.846245] scsi4 : ahci
[ 0.846351] scsi5 : ahci
[ 0.846568] ata1: SATA max UDMA/133 abar m1024@0xfe02f000 port
0xfe02f100 irq 22
[ 0.846603] ata2: SATA max UDMA/133 abar m1024@0xfe02f000 port
0xfe02f180 irq 22
[ 0.846637] ata3: SATA max UDMA/133 abar m1024@0xfe02f000 port
0xfe02f200 irq 22
[ 0.846671] ata4: SATA max UDMA/133 abar m1024@0xfe02f000 port
0xfe02f280 irq 22
[ 0.846705] ata5: SATA max UDMA/133 abar m1024@0xfe02f000 port
0xfe02f300 irq 22
[ 0.846739] ata6: SATA max UDMA/133 abar m1024@0xfe02f000 port
0xfe02f380 irq 22
[ 1.164041] ata2: SATA link down (SStatus 0 SControl 300)
[ 1.164129] ata4: SATA link down (SStatus 0 SControl 300)
[ 1.164230] ata5: SATA link down (SStatus 0 SControl 300)
[ 1.336023] ata6: softreset failed (device not ready)
[ 1.336057] ata6: applying SB600 PMP SRST workaround and retrying
[ 1.336104] ata3: softreset failed (device not ready)
[ 1.336144] ata3: applying SB600 PMP SRST workaround and retrying
[ 1.336190] ata1: softreset failed (device not ready)
[ 1.336229] ata1: applying SB600 PMP SRST workaround and retrying
[ 1.508034] ata6: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1.508088] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
[ 1.508149] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1.511979] ata1.00: HPA unlocked: 234490943 -> 234493056, native
234493056
[ 1.512024] ata1.00: ATA-7: SAMSUNG SP1213C, SV100-27, max UDMA7
[ 1.512057] ata1.00: 234493056 sectors, multi 0: LBA48
[ 1.513550] ata3.00: ATA-7: SAMSUNG HD200HJ, KF100-06, max UDMA7
[ 1.513583] ata3.00: 390721968 sectors, multi 0: LBA48 NCQ (depth
31/32), AA
[ 1.514062] ata1.00: configured for UDMA/133
[ 1.514244] scsi 0:0:0:0: Direct-Access ATA SAMSUNG SP1213C
SV10 PQ: 0 ANSI: 5
[ 1.514496] sd 0:0:0:0: [sda] 234493056 512-byte logical blocks: (120
GB/111 GiB)
[ 1.514625] sd 0:0:0:0: [sda] Write Protect is off
[ 1.514665] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
[ 1.514703] sd 0:0:0:0: [sda] Write cache: enabled, read cache:
enabled, doesn't support DPO or FUA
[ 1.518077] ata6.00: ATA-8: WDC WD10EACS-00ZJB0, 01.01B01, max UDMA/133
[ 1.518118] ata6.00: 1953525168 sectors, multi 0: LBA48 NCQ (depth
31/32), AA
[ 1.519009] ata6.00: configured for UDMA/133
[ 1.519066] ata3.00: configured for UDMA/133
[ 1.519209] scsi 2:0:0:0: Direct-Access ATA SAMSUNG HD200HJ
KF10 PQ: 0 ANSI: 5
[ 1.519363] sd 2:0:0:0: [sdb] 390721968 512-byte logical blocks: (200
GB/186 GiB)
[ 1.519484] scsi 5:0:0:0: Direct-Access ATA WDC WD10EACS-00Z
01.0 PQ: 0 ANSI: 5
[ 1.519503] sd 2:0:0:0: [sdb] Write Protect is off
[ 1.519506] sd 2:0:0:0: [sdb] Mode Sense: 00 3a 00 00
[ 1.519523] sd 2:0:0:0: [sdb] Write cache: enabled, read cache:
enabled, doesn't support DPO or FUA
[ 1.519734] sd 5:0:0:0: [sdc] 1953525168 512-byte logical blocks:
(1.00 TB/931 GiB)
[ 1.519872] sd 5:0:0:0: [sdc] Write Protect is off
[ 1.519915] sd 5:0:0:0: [sdc] Mode Sense: 00 3a 00 00
[ 1.519955] sd 5:0:0:0: [sdc] Write cache: enabled, read cache:
enabled, doesn't support DPO or FUA
[ 1.523383] sdc: sdc1 sdc2
[ 1.523681] sd 5:0:0:0: [sdc] Attached SCSI disk
[ 1.525838] sda: sda1 sda2 sda3
[ 1.526151] sd 0:0:0:0: [sda] Attached SCSI disk
[ 1.530621] sdb: sdb1 sdb2 sdb3
[ 1.530930] sd 2:0:0:0: [sdb] Attached SCSI disk
[ 1.871058] pata_atiixp 0000:00:14.1: PCI INT A -> GSI 16 (level,
low) -> IRQ 16
[ 1.871502] scsi6 : pata_atiixp
[ 1.871611] scsi7 : pata_atiixp
[ 1.872486] ata7: PATA max UDMA/100 cmd 0x1f0 ctl 0x3f6 bmdma 0xfa00
irq 14
[ 1.872527] ata8: PATA max UDMA/100 cmd 0x170 ctl 0x376 bmdma 0xfa08
irq 15
[ 2.044539] ata7.00: ATAPI: _NEC DVD_RW ND-2500A, 1.06, max UDMA/33
[ 2.044590] ata7.01: ATAPI: TSSTcorpCD/DVDW TS-H552B, TS03, max UDMA/33
[ 2.060485] ata7.00: configured for UDMA/33
[ 2.076417] ata7.01: configured for UDMA/33
[ 2.077913] scsi 6:0:0:0: CD-ROM _NEC DVD_RW ND-2500A
1.06 PQ: 0 ANSI: 5
[ 2.078614] scsi 6:0:1:0: CD-ROM TSSTcorp CD/DVDW TS-H552B
TS03 PQ: 0 ANSI: 5
[ 2.245419] ata3.00: exception Emask 0x50 SAct 0x1 SErr 0x280900
action 0x6 frozen
[ 2.245468] ata3.00: irq_stat 0x08000000, interface fatal error
[ 2.245506] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 2.245543] ata3.00: failed command: READ FPDMA QUEUED
[ 2.245583] ata3.00: cmd 60/08:00:08:00:00/00:00:00:00:00/40 tag 0
ncq 4096 in
[ 2.245584] res 40/00:04:08:00:00/00:00:00:00:00/40 Emask
0x50 (ATA bus error)
[ 2.245654] ata3.00: status: { DRDY }
[ 2.245691] ata3: hard resetting link
[ 2.736029] ata3: softreset failed (device not ready)
[ 2.736073] ata3: applying SB600 PMP SRST workaround and retrying
[ 2.908032] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 2.918855] ata3.00: configured for UDMA/133
[ 2.918895] ata3: EH complete
[ 2.976811] ata3.00: exception Emask 0x50 SAct 0x1 SErr 0x280900
action 0x6 frozen
[ 2.976849] ata3.00: irq_stat 0x08000000, interface fatal error
[ 2.976884] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 2.976918] ata3.00: failed command: READ FPDMA QUEUED
[ 2.976955] ata3.00: cmd 60/08:00:70:01:00/00:00:00:00:00/40 tag 0
ncq 4096 in
[ 2.976956] res 40/00:04:70:01:00/00:00:00:00:00/40 Emask
0x50 (ATA bus error)
[ 2.977023] ata3.00: status: { DRDY }
[ 2.977057] ata3: hard resetting link
[ 3.468015] ata3: softreset failed (device not ready)
[ 3.468050] ata3: applying SB600 PMP SRST workaround and retrying
[ 3.640030] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 3.650832] ata3.00: configured for UDMA/133
[ 3.650869] ata3: EH complete
[ 3.655263] ata3.00: exception Emask 0x50 SAct 0x1 SErr 0x280900
action 0x6 frozen
[ 3.655299] ata3.00: irq_stat 0x08000000, interface fatal error
[ 3.655334] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 3.655369] ata3.00: failed command: READ FPDMA QUEUED
[ 3.655406] ata3.00: cmd 60/08:00:70:01:00/00:00:00:00:00/40 tag 0
ncq 4096 in
[ 3.655407] res 40/00:00:70:01:00/00:00:00:00:00/40 Emask
0x50 (ATA bus error)
[ 3.655474] ata3.00: status: { DRDY }
[ 3.655508] ata3: hard resetting link
[ 4.144019] ata3: softreset failed (device not ready)
[ 4.144055] ata3: applying SB600 PMP SRST workaround and retrying
[ 4.316024] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 4.326843] ata3.00: configured for UDMA/133
[ 4.326880] ata3: EH complete
[ 4.341135] ata3: limiting SATA link speed to 1.5 Gbps
[ 4.341172] ata3.00: exception Emask 0x50 SAct 0x1 SErr 0x280900
action 0x6 frozen
[ 4.341207] ata3.00: irq_stat 0x08000000, interface fatal error
[ 4.341243] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 4.341278] ata3.00: failed command: READ FPDMA QUEUED

Also nach Konfiguration auf UDMA hat er immer CRC-Fehler, vorher
konnte er die Patitionstabelle lesen. Danach geht gar nichts mehr.
Weder smartctl

Device: /2:0:0:0 Version:
scsiModePageOffset: response length too short, resp_lenG offsetP
bd_lenF


Terminate command early due to bad response to IEC mode page




A mandatory SMART command failed: exiting. To continue, add one or more
'-T permissive' options.

noch meldet fdisk irgend etwas.

Hat jemand schonmal sowas gehabt? Kann ich den DMA-Modus per
z.B. Kernel-Command-Line vorgeben? Ich werde jetzt mal die Platte
ausbauen und in einem anderen Rechner (mit anderem Kabel)
probieren.

Bei der anderen Platte meldet smartctl:
Num Test_Description Status Remaining
LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 00% 10726
238859374

aber der Kernel

[ 1.512057] ata1.00: 234493056 sectors, multi 0: LBA48

also hat der Kernel weniger Sektoren gefunden als die
Platte beim Selbstest kontrolliert. Wie kann das denn sein?

Bin gespannt auf Hinweise...

jan
 

Lesen sie die antworten

#1 Dirk Thierbach
04/04/2012 - 21:44 | Warnen spam
Jan Schmidt wrote:
[ 2.245506] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }

Also nach Konfiguration auf UDMA hat er immer CRC-Fehler,



Aber das ist doch ein SATA-Uebertragungsfehler, kein Plattenlesefehler,
oder?

Also erstmal die Platte an einen anderen SATA-Port anstoepseln,
moeglichst mit einem anderen Kabel, ob die Controller-Hardware,
das Kabel, oder die Platte selbst kaputt ist.

Hat jemand schonmal sowas gehabt? Kann ich den DMA-Modus per
z.B. Kernel-Command-Line vorgeben? Ich werde jetzt mal die Platte
ausbauen und in einem anderen Rechner (mit anderem Kabel)
probieren.


Bei der anderen Platte meldet smartctl:
Num Test_Description Status Remaining
LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 00% 10726
238859374



Das spricht doch sehr dafuer, dass es entweder das Kabel oder
der Controller ist. Ob die Platte selbst Lesefehler hat, ist eine
voellig andere Geschichte.

aber der Kernel

[ 1.512057] ata1.00: 234493056 sectors, multi 0: LBA48

also hat der Kernel weniger Sektoren gefunden als die
Platte beim Selbstest kontrolliert. Wie kann das denn sein?



Die Platte hat erstens Ersatz-Sektoren, die umgewidmet werden, wenn im
Laufe der Zeit benutzte Sektoren ausfallen, und zweitens speichert der
Plattenkontroller selbst oft auch irgendwelche Informationen (eben
z.B. den Smart-Status) auf der Platte.

- Dirk

Ähnliche fragen