SATA-Platte hat Schluckauf

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
luggi83
Beiträge: 8
Registriert: 30.01.2008 14:04:18

SATA-Platte hat Schluckauf

Beitrag von luggi83 » 21.04.2008 19:50:20

Hallo,

ich hatte mir neulich ein S-ATA-RAID gebastelt, und natürlich auch brav Platten verschiedener Hersteller verwendet. Bis eines Tages die Hitachi HDP725050GLA360 ständig aus dem SATA flog, was dem RAID natürlich etwas an die Nieren ging.
Da die Platte auch über SMART schon einige Lesefehler hatte, hab ich sie zurückgeschickt und eine neue bekommen. Um nicht ein ähnliches Spektakel nochmal zu erleben, hab ich diesmal badblocks einige Durchgänge auf die PLatte losgelassen. badblocks findet zwar keine defekten Blöcke, aber trotzdem kommt alle paar Stunden folgende Nachricht auf die Konsole:

Mar 14 23:26:38 metzger kernel: ata4.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2
Mar 14 23:26:38 metzger kernel: ata4.00: (BMDMA stat 0x0)
Mar 14 23:26:38 metzger kernel: ata4.00: tag 0 cmd 0xc8 Emask 0x10 stat 0x51 err 0x84 (ATA bus erro
Mar 14 23:26:38 metzger kernel: ata4: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
Mar 14 23:26:38 metzger kernel: ata4: soft resetting port
Mar 14 23:26:38 metzger kernel: ata4.00: configured for UDMA/133
Mar 14 23:26:38 metzger kernel: ata4: EH complete
Mar 14 23:26:38 metzger kernel: SCSI device sdb: 976773168 512-byte hdwr sectors (500108 MB)
Mar 14 23:26:38 metzger kernel: sdb: Write Protect is off
Mar 14 23:26:38 metzger kernel: sdb: Mode Sense: 00 3a 00 00
Mar 14 23:26:38 metzger kernel: SCSI device sdb: drive cache: write back

Danach scheint es munter weiterzugehen, die Platte hält sich nach ihrem SMART-Status auch für gesund.

Was will mir die Fehlermeldung denn genau sagen?

Interessant ist evtl. noch, dass ich die SATA-Platten (insgesamt drei) am MB und einer Controllerkarte einsetze, die jeweils nur SATA-I können, die Hitachi sich allerdings (im Ggs. zu den anderen Platten im Array) nicht irgendwie auf SATA-I jumpern lässt. Aber beim Booten halt trotzdem erkannt wird...

Grüße,

lukas

Benutzeravatar
cirrussc
Beiträge: 6582
Registriert: 26.04.2007 19:47:06
Lizenz eigener Beiträge: MIT Lizenz

Re: SATA-Platte hat Schluckauf

Beitrag von cirrussc » 21.04.2008 22:18:53

Hi,
luggi83 hat geschrieben:Danach scheint es munter weiterzugehen, die Platte hält sich nach ihrem SMART-Status auch für gesund.
Ehe der Health Indikator Alarm schlägt ist meist schon alles zu spät.

Code: Alles auswählen

smartctl -H /dev/sdb
Schau dir doch noch mal die anderen Smart Attribute an, ich tippe u.a. auf UDMA Fehler.
Was will mir die Fehlermeldung denn genau sagen?
So genau weis ich das auch nicht (müsste man schon Kernel Entwickler sein). Ein weiterer Hardwarefehler ist nicht ganz auszuschliessen. Vllt. das Kabel schlechten Kontakt?
luggi83 hat geschrieben:Interessant ist evtl. noch, dass ich die SATA-Platten (insgesamt drei) am MB und einer Controllerkarte einsetze, die jeweils nur SATA-I können, die Hitachi sich allerdings (im Ggs. zu den anderen Platten im Array) nicht irgendwie auf SATA-I jumpern lässt. Aber beim Booten halt trotzdem erkannt wird...
SATA II ist Abwärtskompatibel.
Diese Jumperoptionen sind nur für ältere oder sperrige Controller gedacht.
Gruß cirrussc
--------------------
„Der Mensch steigert zur Zeit die Nutzung dessen, was seiner Willkür unterliegt - und kommt sich sehr klug dabei vor.“ H. Gruhl

luggi83
Beiträge: 8
Registriert: 30.01.2008 14:04:18

Re: SATA-Platte hat Schluckauf

Beitrag von luggi83 » 22.04.2008 01:04:35

Hallo cirrussc,

ich hab mich etwas unklar ausgedrückt: smartctl hab ich gefragt:

Code: Alles auswählen

root@dustpuppy:~# smartctl -a -d ata /dev/sdb
smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     Hitachi HDP725050GLA360
Serial Number:    GEB530RE0WX5WB
Firmware Version: GM4OA52A
User Capacity:    500.107.862.016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Not recognized. Minor revision code: 0x29
Local Time is:    Tue Apr 22 01:00:15 2008 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                 (7890) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 131) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   132   132   054    Pre-fail  Offline      -       142
  3 Spin_Up_Time            0x0007   100   100   024    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       1
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   131   131   020    Pre-fail  Offline      -       29
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       197
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       9
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       9
194 Temperature_Celsius     0x0002   162   162   000    Old_age   Always       -       37 (Lifetime Min/Max 25/41)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%       194         -
# 2  Extended offline    Completed without error       00%       193         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Insbesondere die beiden Read-Tests und die Tatsache, dass keine errors geloggt worden, (im Ggs. zur ersten Platte, die eine monströse Raw-Read-Error-Zahl hatte und bei der das Error-Log scheinbar schon gewrapt war) lässt mich darauf tippen, dass es diesmal nicht die Platte ist (wäre ja auch ziemliches Pech..)
Kabel hab ich ebenfalls ausgetauscht bzw. frisch gekauft und ist jetzt das selbe wie bei allen anderen Platten..

Grüße,

lukas

Nobby_1985
Beiträge: 62
Registriert: 04.05.2005 14:29:54
Wohnort: Siegen

Re: SATA-Platte hat Schluckauf

Beitrag von Nobby_1985 » 22.04.2008 14:15:25

Ich habe hier das selbe Problem mit exakt den selben Fehlermeldungen, allerdings mit einer Samsung Platte. Die Platte habe ich schon 2 mal ohne Erfolg umgetauscht.Also gehe ich davon aus dass es nicht an der Platte liegt.

Im Internet habe ich auch keine zufriedenstellende Antwort auf das Problem gefunden und die Platte schon als Verlustkauf abgestempelt. Aber jetzt weiss ich wenigsatens das ich nicht allein bin ;-)
Falls es irgendeine Lösung gibt wäre ich auch sehr interessiert.

Benutzeravatar
cirrussc
Beiträge: 6582
Registriert: 26.04.2007 19:47:06
Lizenz eigener Beiträge: MIT Lizenz

Re: SATA-Platte hat Schluckauf

Beitrag von cirrussc » 22.04.2008 19:58:27

Hi,

dann kommen viele andere Faktoren in Betracht.
Was habt ihr denn für Chipsätze?
Schon verschiedene (besonders neuere) Kernel probiert?
Gruß cirrussc
--------------------
„Der Mensch steigert zur Zeit die Nutzung dessen, was seiner Willkür unterliegt - und kommt sich sehr klug dabei vor.“ H. Gruhl

luggi83
Beiträge: 8
Registriert: 30.01.2008 14:04:18

Re: SATA-Platte hat Schluckauf

Beitrag von luggi83 » 23.04.2008 20:04:37

Hallo,

bei mir ergibt sich nochmal ein ausdifferenzierteres Bild:
Die genannten Fehler scheinen ausschließlich bei badblocks aufzutreten: ich habe in den letzten paar Tagen manuell massiv Daten (cp /home, dd aus /dev/zero) auf die Platte geschaufelt, ohne dass nochmal was passiert wäre.
Momentan ist die Platte bei ihrem 13. shred-Durchlauf, ohne sich seither nochmal beschwert zu haben.. Nachdem shred völlig durchgelaufen ist, probier ich nochmal badblocks - vielleicht ist das Problem ja darin zu sehen (oder es beschränkt sich auf Leseoperationen, die ja weder bei cp noch shred relevant sind.)

grüße,

lukas

katzenfan
Beiträge: 584
Registriert: 19.04.2008 22:59:51

Re: SATA-Platte hat Schluckauf

Beitrag von katzenfan » 23.04.2008 21:25:30

Hallo,

ich kenne dieses Problemchen von meinen SATA-Platten auch und zwar unabhängig von der verwendeten Distribution, (also nicht nur bei Debian). Es scheint auch keine reine Kernelangelegenheit zu sein, sondern an einer nicht kontinuierlichen Strom- und Spannungszufuhr zu liegen.

Es ist bekannt, (?), daß die Stecker alles andere als stabil sind, (IDE ist hier um Längen besser, weil es da eben nicht auftritt). Bei mir habe ich dieses bisher nämlich immer so beobachtet, daß diese Fehlermeldungen verschwinden, wenn ich nach dem Auftreten dieser den PC ausschalte, die Kabel trenne und wieder neu zusammenstecke. Nach diesem neu Zusammenstecken der Kabel treten die Meldungen ca. 2 Tage nicht mehr auf, danach sind sie wieder da. Übrigens betrifft dieses nicht die Datenkabel, sondern die Stromkabel.

ciao
katzenfan

Benutzeravatar
cirrussc
Beiträge: 6582
Registriert: 26.04.2007 19:47:06
Lizenz eigener Beiträge: MIT Lizenz

Re: SATA-Platte hat Schluckauf

Beitrag von cirrussc » 24.04.2008 21:13:38

katzenfan hat geschrieben:Es scheint auch keine reine Kernelangelegenheit zu sein, sondern an einer nicht kontinuierlichen Strom- und Spannungszufuhr zu liegen.
Es muss kontinuierlich sein, sonst wäre eine Funktion undenkbar. Allerdings sind Signalstörungen jeglicher Art möglich.
katzenfan hat geschrieben:Es ist bekannt, (?), daß die Stecker alles andere als stabil sind, (IDE ist hier um Längen besser, weil es da eben nicht auftritt).
Ja das wird sich auch bei weiteren neun Standards fortsetzen (bei HDMI ist es auch schlecht gelöst)
katzenfan hat geschrieben:Übrigens betrifft dieses nicht die Datenkabel, sondern die Stromkabel.
Klingt unwahrscheinlich.
Bei elekt. SATA Problemen sind meist die Datenverbindungen Schuld, die Energieversorgung ist recht Akzeptabel gelöst.
Gruß cirrussc
--------------------
„Der Mensch steigert zur Zeit die Nutzung dessen, was seiner Willkür unterliegt - und kommt sich sehr klug dabei vor.“ H. Gruhl

katzenfan
Beiträge: 584
Registriert: 19.04.2008 22:59:51

Re: SATA-Platte hat Schluckauf

Beitrag von katzenfan » 24.04.2008 21:24:54

cirrussc hat geschrieben:
katzenfan hat geschrieben:Übrigens betrifft dieses nicht die Datenkabel, sondern die Stromkabel.
Klingt unwahrscheinlich.
Bei elekt. SATA Problemen sind meist die Datenverbindungen Schuld, die Energieversorgung ist recht Akzeptabel gelöst.
"recht akzeptabel" klingt aber nicht gerade überzeugend; mich überzeugen jedenfalls beide Steckverbindungen nicht, weder Strom- noch Datenstecker sind wirklich gebrauchsfähig.

Benutzeravatar
cirrussc
Beiträge: 6582
Registriert: 26.04.2007 19:47:06
Lizenz eigener Beiträge: MIT Lizenz

Re: SATA-Platte hat Schluckauf

Beitrag von cirrussc » 24.04.2008 23:04:23

katzenfan hat geschrieben:...weder Strom- noch Datenstecker sind wirklich gebrauchsfähig.
Es wurde offensichtlich mehr Wert auf Platzersparnis gelegt. Man hätte zu mindest eine vernünftige Arretierung anbringen können, die Stecker wackeln ja wie sie lustig sind. Auf eine Schirmung verzichtet man auch.
Gruß cirrussc
--------------------
„Der Mensch steigert zur Zeit die Nutzung dessen, was seiner Willkür unterliegt - und kommt sich sehr klug dabei vor.“ H. Gruhl

pluvo

Re: SATA-Platte hat Schluckauf

Beitrag von pluvo » 24.04.2008 23:17:58

cirrussc hat geschrieben:...die Stecker wackeln ja wie sie lustig sind...
Ich habe das Problem bisher nicht gehabt, und die SATA2-Kabal (mit Verriegelungsclip) sind bei mir wirklich bombenfest:
http://de.wikipedia.org/wiki/Bild:Sata_2_Stecker.jpg

Aber damit wir mal weiter kommen: Welchen Kernel und welchen Chipsatz habt ihr? Und sonstige Informationen, wie z.B. ob ihr AHCI aktiviert habt, wären auch sehr hilfreich :wink:

katzenfan
Beiträge: 584
Registriert: 19.04.2008 22:59:51

Re: SATA-Platte hat Schluckauf

Beitrag von katzenfan » 24.04.2008 23:25:21

Hallo Cirrussc,
cirrussc hat geschrieben:
katzenfan hat geschrieben:...weder Strom- noch Datenstecker sind wirklich gebrauchsfähig.
Es wurde offensichtlich mehr Wert auf Platzersparnis gelegt. Man hätte zu mindest eine vernünftige Arretierung anbringen können, die Stecker wackeln ja wie sie lustig sind. Auf eine Schirmung verzichtet man auch.
Ja, deshalb kaufe ich mir derzeit auch keine SATA-Geräte mehr, sondern sehe zu, daß ich mir meine IDE-Geräte noch möglichst lange erhalte.

Mit den SATA-Platten hatte ich von Beginn an immer etwas Schwierigkeiten, bis jetzt zu Debian. Was nützt der höchste Durchsatz, SATA-Platten mögen ja hier gegenüber IDE tatsächlich mehr leisten, wenn das Drumherum nicht stimmt. Zur qualitätsmäßigen Betrachtung gehört eben auch, (für mich), die Anbindung ans Mainboard dazu; solange die nicht stabiler ausgeführt wird, pfeife ich auf weitere SATA-Geräte.

ciao
katzenfan

luggi83
Beiträge: 8
Registriert: 30.01.2008 14:04:18

Re: SATA-Platte hat Schluckauf

Beitrag von luggi83 » 25.04.2008 08:46:58

Hallo,

kleines Update: ich hab den 2.6.18-4 auf einem ASRock P4V88+, also einem Via PT880-Chipsatz.

Das mit den Kabeln kann ich unabhängig davon bestätigen: als ich das Array eingerichtet hatte und die mit dem MB mitgelieferten Kabel benutzte, gab es nahezu reihenweise Soft resets an allen (!) Platten, was das RAID früher oder später jeweils auch zum Anlass genommen hat, sich zu degraden. Nach Kauf neuer Kabel ging es dann allerdings (bis auf die erwähnte Platte) problemlos.

grüße,

lukas

Nobby_1985
Beiträge: 62
Registriert: 04.05.2005 14:29:54
Wohnort: Siegen

Re: SATA-Platte hat Schluckauf

Beitrag von Nobby_1985 » 29.04.2008 10:02:05

Ich habe eine einen etwas betagten nForce2 Chipsatz auf einem ASUS A7N8X Deluxe Mainboard,
habe die Platte nach meinem letzten Beitrag nochmal ausgepackt. Nach einem low-level Format trat der Fehler erstmal nicht mehr auf, bis gestern da kam er wieder. Ich habe direkt eine LiveCD gebootet und fsck.ext3 -cf ausgeführt. Er hat 6 badblocks gefunden. Seitdem ist wieder ruhe, mal sehen wie lang :-(

luggi83
Beiträge: 8
Registriert: 30.01.2008 14:04:18

Re: SATA-Platte hat Schluckauf

Beitrag von luggi83 » 27.12.2008 19:09:41

Nochmal ein kleines Update: die Platte lief mit Schluckauf munter weiter (alle paar Tage kamen die obigen Kernelmeldungen) bis es gestern zum Supergau kam:

Code: Alles auswählen

Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998752 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998760 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998768 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998776 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998784 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998792 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998800 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998808 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998816 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998824 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998832 on sda1)
Dec 26 04:34:22 dustpuppy kernel: raid5:md0: read error corrected (8 sectors at 975998840 on sda1)
Dec 26 04:34:26 dustpuppy kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Dec 26 04:34:26 dustpuppy kernel: ata1.00: (BMDMA stat 0x0)
Dec 26 04:34:26 dustpuppy kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error)
Dec 26 04:34:26 dustpuppy kernel: ata1: EH complete
Dec 26 04:34:29 dustpuppy kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Dec 26 04:34:29 dustpuppy kernel: ata1.00: (BMDMA stat 0x0)
Dec 26 04:34:29 dustpuppy kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error)
Dec 26 04:34:29 dustpuppy kernel: ata1: EH complete
Dec 26 04:34:35 dustpuppy kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Dec 26 04:34:35 dustpuppy kernel: ata1.00: (BMDMA stat 0x0)
Dec 26 04:34:35 dustpuppy kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error)
Dec 26 04:34:35 dustpuppy kernel: ata1: EH complete
Dec 26 04:34:40 dustpuppy kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Dec 26 04:34:40 dustpuppy kernel: ata1.00: (BMDMA stat 0x0)
Dec 26 04:34:40 dustpuppy kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error)
Dec 26 04:34:40 dustpuppy kernel: ata1: EH complete
Dec 26 04:34:44 dustpuppy kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Dec 26 04:34:44 dustpuppy kernel: ata1.00: (BMDMA stat 0x0)
Dec 26 04:34:44 dustpuppy kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error)
Dec 26 04:34:44 dustpuppy kernel: ata1: EH complete
Dec 26 04:34:48 dustpuppy kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Dec 26 04:34:48 dustpuppy kernel: ata1.00: (BMDMA stat 0x0)
Dec 26 04:34:48 dustpuppy kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error)
Dec 26 04:34:48 dustpuppy kernel: sd 0:0:0:0: SCSI error: return code = 0x08000002
Dec 26 04:34:48 dustpuppy kernel: sda: Current: sense key: Medium Error
Dec 26 04:34:48 dustpuppy kernel:     Additional sense: Unrecovered read error - auto reallocate failed
Dec 26 04:34:48 dustpuppy kernel: end_request: I/O error, dev sda, sector 975999039
Dec 26 04:34:48 dustpuppy kernel: raid5:md0: read error NOT corrected!! (sector 975998976 on sda1).
Dec 26 04:34:48 dustpuppy kernel: raid5: Disk failure on sda1, disabling device. Operation continuing on 3 devices
Dec 26 04:34:48 dustpuppy kernel: raid5:md0: read error not correctable (sector 975998984 on sda1).
Dec 26 04:34:48 dustpuppy kernel: raid5:md0: read error not correctable (sector 975998992 on sda1).
Dec 26 04:34:48 dustpuppy kernel: raid5:md0: read error not correctable (sector 975999000 on sda1).
Dec 26 04:34:48 dustpuppy kernel: raid5:md0: read error not correctable (sector 975999008 on sda1).
Dec 26 04:34:48 dustpuppy kernel: raid5:md0: read error not correctable (sector 975999016 on sda1).
D.h. die Platte ist jetzt erstmal removed und das Array läuft degraded weiter. Gleichmal unmounted und gestoppt, bevor schlimmeres passiert.

Ich hab nochmal etwas nachgeforscht und herausgefunden: die Platte ist die einzige, die an der PCI-Controllerkarte läuft - irgendwas scheint damit also nicht zu stimmen.

Hat irgendeiner eine Idee wie man hier weiter vorgehen kann? Also, wie ich der Controllerkarte selber auf den Zahn fühlen kann.

Und nebenbei: wenn ich die Platte wieder ins Array hänge und der ganze Kram resyncht und *dann* nochmal sowas auftritt, heißt das, dass die "neue" Platte nicht korrekt gesyncht wurde oder dass das ganze Array nicht mehr zu gebrauchen ist?

Benutzeravatar
detix
Beiträge: 1711
Registriert: 07.02.2007 18:51:28
Wohnort: MK

Re: SATA-Platte hat Schluckauf

Beitrag von detix » 17.08.2013 12:32:14

Tschuldigt bitte das ich diesen alten Post nochmal vorkrame,
war aber eben der älteste hier und mit der scheinbar richtigen Lösung für mich.
Fehler:

Code: Alles auswählen

ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
ata1.00: failed command: READ DMA
ata1.00: cmd c8/00:08:ff:a9:a2/00:00:00:00:00/e0 tag 0 dma 4096 in
         res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
ata1.00: status: { DRDY }
ata1: link is slow to respond, please be patient (ready=0)
ata1: soft resetting link
ata1.00: configured for UDMA/133
ata1.00: device reported invalid CHS sector 0
ata1: EH complete
ata1: lost interrupt (Status 0x50)
Akkustisch klang das so:
man hörte einen Summton, dann verlangsamte sich die Drehzahl der Platte deutlich,
dann ein leiser Piepston und die Platte fuhr wieder hoch, danach blieb das System so für 10-20 Sek komplett stehen,
um danach wieder zu laufen als wäre nichts geschehen.

So fing es vor 2 Wochen damit an, gestern dann mal die Sata-Steckverbindungen ein- und ausgestöpselt
und tatsächlich, seit Stunden läuft der Rechner (ca 8 Jahre alt) wieder völlig problemlos.

An dieser Stelle also ein herzliches Dankeschön an @katzenfan für diesen Tipp,
hat er mir doch zunächst mal den Austausch der Festplatte oder Hauptplatine erspart.
Das musste ich einfach loswerden, manchmal ist die Lösung sooo einfach... :THX:
Gruß an alle Debianer, und immer daran denken:
Macht ohne Haftung funktioniert nicht!

Antworten