WinFuture-Forum.de: Paritätsfehler Id 5 Bei Nvstor64 Raid 1 - WinFuture-Forum.de

Zum Inhalt wechseln

Nachrichten zum Thema: Prozessoren & Speicher
Seite 1 von 1

Paritätsfehler Id 5 Bei Nvstor64 Raid 1


#1 Mitglied ist offline   tavoc 

  • Gruppe: aktive Mitglieder
  • Beiträge: 3.446
  • Beigetreten: 22. Juli 04
  • Reputation: 0

geschrieben 18. August 2009 - 14:47

Hi,

ich habe mich seit längerem mal wieder auf meinem Server per RemoteDesktop eingeloggt und wurde durch eine Fehlermeldung des Raids begrüßt.

Ein Paritätsfehler wurde auf \Device\RaidPort0 gefunden.

System 

  - Provider 

   [ Name]  nvstor64 
 
  - EventID 5 

   [ Qualifiers]  49156 
 
   Level 2 
 
   Task 0 
 
   Keywords 0x80000000000000 
 
  - TimeCreated 

   [ SystemTime]  2009-08-07T18:30:38.671Z 
 
   EventRecordID 41862 
 
   Channel System 
 
   Computer server2008.___________.local 
 
   Security 
 

- EventData 

   \Device\RaidPort0 
   0F0018000100000000000000050004C0070000000000000000
00000000000000000000000000000000000000000000000000
0
000050004C00000000000000000 


--------------------------------------------------------------------------------

Binäre Daten:


In Wörtern

0000: 0018000F 00000001 00000000 C0040005 
0008: 00000007 00000000 00000000 00000000 
0010: 00000000 00000000 00000000 00000000 
0018: 00000000 C0040005 00000000 00000000 


In Bytes

0000: 0F 00 18 00 01 00 00 00   ........
0008: 00 00 00 00 05 00 04 C0   .......À
0010: 07 00 00 00 00 00 00 00   ........
0018: 00 00 00 00 00 00 00 00   ........
0020: 00 00 00 00 00 00 00 00   ........
0028: 00 00 00 00 00 00 00 00   ........
0030: 00 00 00 00 05 00 04 C0   .......À
0038: 00 00 00 00 00 00 00 00   ........


Daraufhin habe ich ein SMART Selbsttest der beiden Platten über das Nvidia Tool gemacht. Bei beiden kommt dieser Fehler

Beim SMART Selbsttest in DatentrΣger SAMSUNG HD642JJ auf Port SATA 0.1 wurde ein Fehler ermittelt. Ein Lese-Testelement schlug fehl. Bitte sichern Sie Ihre Daten sichern und ersetzen Sie die Festplatte.

Ansonsten steht da aber "Gute Leistung" und "Smart Status OK" in der Übersicht, nur der Selbsttest bringt diesen Fehler.

System 

  - Provider 

   [ Name]  NVRAIDSERVICE 
 
  - EventID 1035 

   [ Qualifiers]  49152 
 
   Level 2 
 
   Task 0 
 
   Keywords 0x80000000000000 
 
  - TimeCreated 

   [ SystemTime]  2009-08-18T13:29:29.000Z 
 
   EventRecordID 74517 
 
   Channel Application 
 
   Computer server2008.___________.local 
 
   Security 
 

- EventData 

   entfällt 
   SAMSUNG HD642JJ 
   entfällt 
   SATA 0.1



und

Zugriffsfehler: Schwerer Fehler auf DatentrΣger SAMSUNG HD642JJ (Port: SATA 0.1).

- System 

  - Provider 

   [ Name]  NVRAIDSERVICE 
 
  - EventID 1006 

   [ Qualifiers]  49152 
 
   Level 2 
 
   Task 0 
 
   Keywords 0x80000000000000 
 
  - TimeCreated 

   [ SystemTime]  2009-08-18T13:16:19.000Z 
 
   EventRecordID 74509 
 
   Channel Application 
 
   Computer server2008.___________.local 
 
   Security 
 

- EventData 

   NVIDIA Spiegelung 596.17G 
   SAMSUNG HD642JJ 
   S1AFJ1BQ618884 
   SATA 0.1



Der Rechner hat folgende Hardware:

CPU AMD 4850e
Mainboard Asrock K10N78FullHD-hsli Rev3
Ram: 4x2GB TakeMS
HDD: 2x Samsung HD642JJ im Raid 1
2 120 mm Lüfter

Temperaturen:
CPU 37
Motherboard 32
MCP 50
Aux 37

Das ganze auf einem Windows Server 2008 Enterprise 64 bit.


Sollte ich mir jetzt 2 neue Festplatten bestellen? Ich kann nicht glauben das beide Platten zeitgleich den Geist aufgeben? Wenn ja, sollte man die 2 neuen Platten wieder als Raid1 neben den bestehenden einbauen und dann die Daten des einen Raids auf das andere kopieren und anschliessend das originale Samsung Raid löschen?

Kann man von Samsung verlangen neue Festplatten zu bekommen, der vermeintliche Fehler liegt schliesslich innerhalb der Garantie.

Gibt es eine Möglichkeit sich bei Nvidia Raids sich per Mail benachrichtigen zu lassen?

Dieser Beitrag wurde von tavoc bearbeitet: 18. August 2009 - 15:05

your IP is 127.0.0.1 or ::1
you are running an OS
you use a Browser
I know so much about you...
0

Anzeige



#2 Mitglied ist offline   bartii 

  • Gruppe: aktive Mitglieder
  • Beiträge: 5.428
  • Beigetreten: 02. August 05
  • Reputation: 1

geschrieben 18. August 2009 - 15:32

Ich denke nicht, dass beide Platten defekt sind. Nur die die am Port: SATA 0.1 hängt.
Software is like sex. It is better when it's free.. (Linus Torvalds)
0

#3 Mitglied ist offline   tavoc 

  • Gruppe: aktive Mitglieder
  • Beiträge: 3.446
  • Beigetreten: 22. Juli 04
  • Reputation: 0

geschrieben 18. August 2009 - 15:42

Hm ok, aber warum bringt dann der Smart Selftest:

Beim SMART Selbsttest in DatentrΣger SAMSUNG HD642JJ auf Port SATA 0.0 wurde ein Fehler ermittelt. Ein Lese-Testelement schlug fehl. Bitte sichern Sie Ihre Daten sichern und ersetzen Sie die Festplatte.

und

Beim SMART Selbsttest in DatentrΣger SAMSUNG HD642JJ auf Port SATA 0.1 wurde ein Fehler ermittelt. Ein Lese-Testelement schlug fehl. Bitte sichern Sie Ihre Daten sichern und ersetzen Sie die Festplatte.

die Meldung mit dem schweren Zugriffsfehler betrifft jedoch nur Port 0.1


Wie sehe ich welche Platte physikalisch 0.1 und welche 0.0 ist? Entspricht SATA Port 1 0.0 ?
Kann ich also einfach den Server herunter fahren, die Platte ausbauen und eine gleiche oder größere wieder einhängen und dann den Server starten? Danach müsste ja nur noch ein Raid Rebuild ausgeführt werden.

Ersetzt Samsung so einen Fehler? Die Platte ist ja kein Jahr alt.
your IP is 127.0.0.1 or ::1
you are running an OS
you use a Browser
I know so much about you...
0

#4 Mitglied ist offline   bartii 

  • Gruppe: aktive Mitglieder
  • Beiträge: 5.428
  • Beigetreten: 02. August 05
  • Reputation: 1

geschrieben 19. August 2009 - 08:16

Beitrag anzeigenZitat (tavoc: 18.08.2009, 16:42)

Beim SMART Selbsttest in DatentrΣger SAMSUNG HD642JJ auf Port SATA 0.0 wurde ein Fehler ermittelt. Ein Lese-Testelement schlug fehl. Bitte sichern Sie Ihre Daten sichern und ersetzen Sie die Festplatte.

Ersetzt Samsung so einen Fehler? Die Platte ist ja kein Jahr alt.

Bin ich blind oder steht von SATA 0.0 oben nichts.

Ja, Samsung ersetzt die Platten ohne weiteres.
Hatte auch einen RAID Fehler und die Platte wurde zweimal hintereinander erstetzt.

Mir fällt auf das es sich hierbei wieder um Samsungplatten handelt. Ich hatte insgesamt 3mal Raid Probleme mit Samsungplatten. Ein Freund von mir hat einen PC-Service und berichtete mir schon von insgesamt 7 zerstörten RAIDs mit Samsungplatten. Können natürlich Zufälle sein, aber meiner Erfahrung nach machen Samsungplatten in Verbindung mit RaidControllern Probleme

Wie lange lief das Raid ca.?
Ich hatte das Problem, dass bei mir die Sektoren ohne Fehlermeldung beschrieben wurden, allerdingss nicht mehr lesbar waren, was es beim kopieren / sichern /brennen auffiel.
Software is like sex. It is better when it's free.. (Linus Torvalds)
0

#5 Mitglied ist offline   Leshrac 

  • Gruppe: VIP Mitglieder
  • Beiträge: 1.412
  • Beigetreten: 14. November 05
  • Reputation: 126

geschrieben 19. August 2009 - 08:41

Da es wohl ein einfacher onboard und kein dedizierter RAID controller ist vermute ich, dass es sich um einen einfach CRC fehler handelt.
Hast du denn checkdisk einfach einmal laufen lassen? Das wird es vermutlich schon beheben. Selbst wenn es ein paar defekte sektoren sind, lassen sie sich in der regel einfach isolieren und das system arbeitet weiter.
0

#6 Mitglied ist offline   Wetter 

  • Gruppe: aktive Mitglieder
  • Beiträge: 603
  • Beigetreten: 29. Oktober 02
  • Reputation: 0

geschrieben 19. August 2009 - 09:06

Beitrag anzeigenZitat (tavoc: 18.08.2009, 16:42)

Hm ok, aber warum bringt dann der Smart Selftest:

Beim SMART Selbsttest in DatentrΣger SAMSUNG HD642JJ auf Port SATA 0.0 wurde ein Fehler ermittelt. Ein Lese-Testelement schlug fehl. Bitte sichern Sie Ihre Daten sichern und ersetzen Sie die Festplatte.

und

Beim SMART Selbsttest in DatentrΣger SAMSUNG HD642JJ auf Port SATA 0.1 wurde ein Fehler ermittelt. Ein Lese-Testelement schlug fehl. Bitte sichern Sie Ihre Daten sichern und ersetzen Sie die Festplatte.

die Meldung mit dem schweren Zugriffsfehler betrifft jedoch nur Port 0.1


Wie sehe ich welche Platte physikalisch 0.1 und welche 0.0 ist? Entspricht SATA Port 1 0.0 ?
Kann ich also einfach den Server herunter fahren, die Platte ausbauen und eine gleiche oder größere wieder einhängen und dann den Server starten? Danach müsste ja nur noch ein Raid Rebuild ausgeführt werden.

Ersetzt Samsung so einen Fehler? Die Platte ist ja kein Jahr alt.


Bedenke: SMART ist nicht automatisch schlecht/Bad, nur weil mal ein Fehler festgestellt wurde. Die SMART Werte müssen erst ein bestimmten Wert unterschreiten, bis entgültig alarm geschlagen wird - dennoch kann die Platte schon defekte Sektoren haben!

Daher sollte man die Lesefehlermeldung durchaus ernst nehmen. Auch Chkdsk wird da nicht unbedingt helfen, weil wir hier von ein Raid reden und nicht von einer einzelnen Platte.
0

#7 Mitglied ist offline   Leshrac 

  • Gruppe: VIP Mitglieder
  • Beiträge: 1.412
  • Beigetreten: 14. November 05
  • Reputation: 126

geschrieben 19. August 2009 - 09:10

Beitrag anzeigenZitat (Wetter: 19.08.2009, 12:06)

Daher sollte man die Lesefehlermeldung durchaus ernst nehmen. Auch Chkdsk wird da nicht unbedingt helfen, weil wir hier von ein Raid reden und nicht von einer einzelnen Platte.

Schon, aber ausser einem rebuild soweit wohl die einzige option. Dieser onboard controller wird vermutlich kein sonderlich luxurioeses BIOS mitsamt array verification und integrity check bieten.
0

#8 Mitglied ist offline   bartii 

  • Gruppe: aktive Mitglieder
  • Beiträge: 5.428
  • Beigetreten: 02. August 05
  • Reputation: 1

geschrieben 19. August 2009 - 09:31

Beitrag anzeigenZitat (bartii: 19.08.2009, 09:16)

Bin ich blind oder steht von SATA 0.0 oben nichts.

Ja, Samsung ersetzt die Platten ohne weiteres.
Hatte auch einen RAID Fehler und die Platte wurde zweimal hintereinander erstetzt.

Mir fällt auf das es sich hierbei wieder um Samsungplatten handelt. Ich hatte insgesamt 3mal Raid Probleme mit Samsungplatten. Ein Freund von mir hat einen PC-Service und berichtete mir schon von insgesamt 7 zerstörten RAIDs mit Samsungplatten. Können natürlich Zufälle sein, aber meiner Erfahrung nach machen Samsungplatten in Verbindung mit RaidControllern Probleme

Wie lange lief das Raid ca.?
Ich hatte das Problem, dass bei mir die Sektoren ohne Fehlermeldung beschrieben wurden, allerdingss nicht mehr lesbar waren, was es beim kopieren / sichern /brennen auffiel.


Jetzt habe ich die Kernaussage vergessen:
Nach dem 3ten Crash bei mir, kam ich ins grübeln und prüfte die Festplatten einzeln (!!! Nicht im RAID !!!).
Dort hatte ich plötzlich keine Probleme mehr. Es lag also die 3male nur am Raid-Controller in Verbindung mit den Platten.


Das solltest du vielleicht auch mal tun, um den blöden Fehler, den ich 3mal hatte gleich ausschliessen zu können.

Dieser Beitrag wurde von bartii bearbeitet: 19. August 2009 - 09:32

Software is like sex. It is better when it's free.. (Linus Torvalds)
0

#9 Mitglied ist offline   tavoc 

  • Gruppe: aktive Mitglieder
  • Beiträge: 3.446
  • Beigetreten: 22. Juli 04
  • Reputation: 0

geschrieben 19. August 2009 - 10:13

Danke für die Antworten. Das blöde ist: ich habe bis nächste Woche keinen physikalischen Zugriff auf die Hardware, kann mich also nur per Remotedesktop verbinden.

Ein reines Chkdsk sagt es ist alles ok.
chkdsk laufwerk /F habe ich nicht ausgeführt, weil ich momentan die Platten nicht mit einem Neustart belasten möchte.

Der verwendetet Controller ist der integrierte Nvidia Controller mit einer 8200 als IGP.
Sobald ich direkt am Rechner bin werde ich mir mal das Raid Bios Menü anschauen.


Kann ich einfach eine Platte aus dem Verbund nehmen diese in einen anderen Rechner stecken und dort testen ohne das Raid zu zerstören?
Ein Backup der wichtigsten Daten habe ich schon vorgenommen, ist ja hauptsächlich die Exchange DB. Der sonstige Rechner wird nur als Backupziel von anderen Rechnern genutzt.


Das RAID läuft seit ca. 200 Tagen ununterbrochen, bei insgesamt 30 Neustarts. Die gesamte Hardware ist ebenso alt.


Soweit ich weiß vertragen sich die Samsung Platten mit Dawicontrol Raid nicht, das hatte ein Bekannter von mir schonmal. Das war einer der Gründe warum ich mich für das NV Raid entschieden habe. RAID 1 sollte ja eigentlich nicht so schwierig sein..., dachte ich
your IP is 127.0.0.1 or ::1
you are running an OS
you use a Browser
I know so much about you...
0

#10 Mitglied ist offline   tavoc 

  • Gruppe: aktive Mitglieder
  • Beiträge: 3.446
  • Beigetreten: 22. Juli 04
  • Reputation: 0

geschrieben 25. September 2009 - 16:48

So nachdem ich endlich wieder Zeit gehabt hatte hab ich mich dem Problem nochmal gewidmet. Zwischenzeitlich habe ich vorsichtshalber schonmal 1 WD 1 TB green gekauft, und die hab ich auch gebraucht...

Server ausgemacht, eine Platte raus und diese getestet mit HD Tune, Ergebnis: 10 defekte Sektoren allein in den ersten 30 % der Platte, hab also nicht weitergesucht...

Also die WD in den Server, Server anmachen. Dort wird gemeckert das das Raid degraded ist und ob er es aufbauen soll. Klar, soll er. Problem ist: Windows startet nicht weil Dateien fehlen und bleibt sogar im abgesicherten bei Laden von chkdisk hängen.
Also hab ich die Platte auch getestet, ebenfalls defekte Sektoren. Zum Glück hab ich ein aktuelles Backup der Daten.

Ergebnis ist wohl: beide Samsung einschicken und zwischendurch noch einen WD kaufen. Eigentlich traurig das diese schon nach 9 Monaten kaputt gingen.


Achja: falls es jemand probieren will. Exchange 07 verträgt sich NICHT mit dem Win Server 2008R2...
your IP is 127.0.0.1 or ::1
you are running an OS
you use a Browser
I know so much about you...
0

#11 Mitglied ist offline   bartii 

  • Gruppe: aktive Mitglieder
  • Beiträge: 5.428
  • Beigetreten: 02. August 05
  • Reputation: 1

geschrieben 25. September 2009 - 20:11

Beitrag anzeigenZitat (tavoc: 25.09.2009, 17:48)

Achja: falls es jemand probieren will. Exchange 07 verträgt sic NICHT mit dem Win Server 2008R2...

In wie Fern? Lässt er sich nicht installieren?
Hatte es eigentlich am Wochenede vor, da ich nicht von Exchange 2010 Beta od. RC halte.

Ist eigentlich bekannt, ob bald ein SBS auf 2008 R2 Basis erscheint?

Dieser Beitrag wurde von bartii bearbeitet: 25. September 2009 - 20:12

Software is like sex. It is better when it's free.. (Linus Torvalds)
0

#12 Mitglied ist offline   tavoc 

  • Gruppe: aktive Mitglieder
  • Beiträge: 3.446
  • Beigetreten: 22. Juli 04
  • Reputation: 0

geschrieben 25. September 2009 - 20:58

er lässt sich nicht installieren, und es wird offiziel nicht supportet.

Man kann es zwar umgehen, aber es soll Probleme im Betrieb geben. Weil ex07 auf die Powershellv1 setzt und der Server08R2 die powershellv2 hat und diese nicht abwärtskompatibel ist.

Auf alle Fälle hab ich nun noch ne VM mit nem 08er Server und dadrin den Exchange.
Für den 2008 R2 gibt es nur Ex 2010. War mir vorher auch nicht bewusst.
your IP is 127.0.0.1 or ::1
you are running an OS
you use a Browser
I know so much about you...
0

Thema verteilen:


Seite 1 von 1

1 Besucher lesen dieses Thema
Mitglieder: 0, Gäste: 1, unsichtbare Mitglieder: 0