Security Professionals - ipfw add deny all from eindgebruikers to any

Valse S.M.A.R.T. melding dat HDD dreigt te crashen.

11-02-2015, 14:28 door Anoniem, 45 reacties
Geacht forum,

M'n lapsysteem geeft een S.M.A.R.T. failure bij het opstarten. Het gaat om harddisk type IC25N030ATCS-0.
Alleen ik vertrouw de melding niet. Namelijk de laatste keer zat-ie oneindig te reutelen ("retry"- geluiden) bij het afsluiten.
Ik vreesde toen het ergste. Dus dacht: laat maar even begaan, want als er een HDD-probleem is, dan probeert hij het waarschijnlijk nog te herstellen.
Na misschien wel een half uur was hij nog steeds bezig, en ontdekte ik opeens dat het netwerkkabeltje half los hing (vergrendelingsnokje van de netwerkkabel was namelijk ooit eens afgebroken). Netwerkconnector aangeduwd, en kijk: onmiddellijk was het merkwaardige regelmatige HDD-gereutel afgelopen. De laptop sloot daarna normaal en zonder foutmeldingen af.

Maar Crystal disk info geeft nu op grond van de S.M.A.R.T.-waarden een "seek" probleem aan, en klassificeert de HDD als "bad". Ook de DFT-tool van Hitachi geeft een S.M.A.R.T. failurecode: 0x72, technical resultcode 72003E6B.
Voor de zekerheid een backup gemaakt.
Echter praktisch uittesten daarna leerde dat de HDD eigenlijk nog prima functioneert:
alle normale testen doorstaat ie zonder enig probleem. Geen enkel ongewoon gereutel daarbij.
De HDD zélf is dus waarschijnlijk niet zozeer de oorzaak van de fout geweest, maar er is iets vreemds gebeurd door die half loshangende netwerkkabel. Het is té toevallig dat het gereutel precies ophielt bij het aandrukken daarvan!

Alleen nu geeft dus één van mijn dualboot O.S. (die bij opstarten zeker de S.M.A.R.T. -logs controleert) elke keer een waarschuwing dat de HDD aan het einde van zijn latijn is, zonder verdere details.
Die melding kan ik uiteraard wegklikken (of anders "S.M.A.R.T" uitzetten) maar is niet zo handig.
Het valt nu helaas op geen enkele manier meer op als er eens écht iets met de HDD mis dreigt te gaan.
Bijkomstigheid is, dat een nieuwe IDE HDD voor deze verder nog goed functionerende laptop vrijwel niet meer te krijgen is.
Anders had ik er voor de zekerheid en voor een paar tientjes nog wel een nieuwe HDD in gezet.

Wat ik nu dus wel erg graag zou willen, is die ene "seekerror rate" in de S.M.A.R.T.-tabel simpel weer terugzetten.
Maar hoe???
Reacties (45)
11-02-2015, 14:40 door gogonal
"Echter praktisch uittesten daarna leerde dat de HDD eigenlijk nog prima functioneert:

??

Praktisch uittesten, wat is dat? Aanzetten en kijken of het geoed gaat?

meten is weten. Maar heb je chkdsk al uitgevoerd en wellicht ff een test met HDTune gedaan?
11-02-2015, 14:54 door Mysterio
Tja, het kan gebeuren dat een S.M.A.R.T. melding door een externe factor zoals een falende voeding wordt veroorzaakt. Als het echter niet uit te sluiten is dat de schijf stervende is zou ik de gok niet wagen. Een nieuwe is wel verkrijgbaar bijvoorbeeld: http://www.centralpoint.nl/interne-harde-schijven/microstorage/40gb-2-5-ide-5400rpm-art-ahdd004-num-1634186/

Hoe je deze meldingen reset en of dat überhaupt mogelijk is weet ik niet.
11-02-2015, 16:01 door Anoniem
Door Anoniem: Geacht forum,

M'n lapsysteem geeft een S.M.A.R.T. failure bij het opstarten. Het gaat om harddisk type IC25N030ATCS-0.
[knip]
Bijkomstigheid is, dat een nieuwe IDE HDD voor deze verder nog goed functionerende laptop vrijwel niet meer te krijgen is.
Anders had ik er voor de zekerheid en voor een paar tientjes nog wel een nieuwe HDD in gezet.

Wat ik nu dus wel erg graag zou willen, is die ene "seekerror rate" in de S.M.A.R.T.-tabel simpel weer terugzetten.
Maar hoe???
Niet security-gerelateerd, want backup voorhanden.
Post de volgende keer, als je nog eens zo'n vraag hebt, een log!
Anyways...

Die 2.5" ATA-schijven zijn nog prima te verkrijgen, refurbished heb je die voor enkele tientjes in huis.

Seek Error Rate houdt in dat de kop niet boven de juiste track hangt.
Oorzaken kunnen o.a. een versleten servo (einde is nabij) of oververhitting (warmte = uitzetting = speling = maakt verder weinig uit bij normaal gebruik) zijn.
Gevolg is vooral dat Read-Write prestaties teruglopen, tot de servo het definitief begeeft natuurlijk, dan ben je nat.

Ik heb een oud DeepSpar setje liggen op de zaak (enige methode mij bekend om SMART-values aan te passen) maar daar schiet jij ook geen drol mee op natuurlijk. Mijn bruto uurloon ligt ook hoger dan een andere HDD trouwens.

Het korte antwoord op je vraag is dan ook: "Dat kan niet."

Hopelijk heb je wat aan de gegeven info, succes ermee.

NB: Dat ratelen bij het afsluiten is OS of applicatie-gerelateerd, dat zoekt waarschijnlijk nog even naar updates.
Met een slechte verbinding (packet-loss), kun je zo'n functie helemaal lijp maken inderdaad.
Weet je wel zeker dat het geen fan was, die begon te ratelen?
11-02-2015, 20:16 door Anoniem
Bedankt voor de eerste reacties.

Praktisch uittesten, wat is dat? Aanzetten en kijken of het geoed gaat?
meten is weten. Maar heb je chkdsk al uitgevoerd en wellicht ff een test met HDTune gedaan?
Uiteraard. In ieder geval diverse malen een chkdsk en een surface scan gedaan. En een reload van een schoon systeem.
Geen vuiltje aan de lucht. Daarna enkele uren intensief gebruik. Alles lijkt te werken zoals ik gewend ben. Geen probleem.
HDTune is vergelijkbaar met reeds gedraaide HGST DFT-tools. Leek het me weinig zin hebben om meer diags te draaien, want:

1 Bij diagnoseprogramma's is het lastig om te bepalen of de weergegeven resultaten op een "frisse" test slaan, of dat ie alleen mekkert omdat er wat in de (historische) S.M.A.R.T. log van de HDD werd gevonden. ("S.M.A.R.T.-ass diags")
Als het zin mocht hebben om nog meer soorten diags te draaien (k denk van niet), dan moet het wel zeker zijn dat op historie gebaseerde S.M.A.R.T.-gegevens hierbij buiten beschouwing wordt gelaten.
2. Het is natuurlijk moeilijk te geloven dat net op het moment dat ik de netwerkconnector aandruk, de HDD "toevallig"
het "seek"-probleem ook net had opgelost. De oorzaak lijkt me meer zoals Mysterio zegt: "een externe factor".
Het meest waarschijnlijk lijkt mij dat er één ader van een gezamelijk aderpaar in de netwerkkabel contact maakte, en de andere ader (die op ieder moment altijd precies de tegenovergestelde spanning draagt o.a. om EMI te helpen voorkomen) niet. De aangesloten ader zou dan een hoogfrequent signaal op de laptop kunnen induceren (netwerksignaal loopt in vele MHz!) dat wegens gebrek aan zijn "tegenhanger" (namelijk de ader die geen contact meer maakte) dan dieper in de laptop doordringt. Het zou misschien sterk genoeg kunnen zijn om op de gevoelige ingangsversterker van de koppen van de HDD een dusdanig groot stoorsignaal op te wekken dat de HDD het spoor bijster raakte. (=seek errors en/of data read errors)
Eén en ander afhankelijk van electronisch ontwerp/constructie van laptop en HDD, en kan al of niet gecombineerd zijn geweest met ruis uit geschakelde voedingen e.d. (IC25N030ATCS-0 heeft wel allerlei soorten verdenkingen gehad:
http://datacent.com/datarecovery/hdd/ibm/IC25N030ATCS04-0, maar ik meen mij te herinneren dat de meeste van die
problemen waren opgelost toen ik het ding aanschafte. Heeft zich ook wel bewezen: is lange tijd goed gegaan)

Er zijn hier en daar (vooral dáár) inderdaad nog wel IDE HDD's te krijgen, maar dit zijn vrijwel allemaal zgn. "refurbished" HDD, en niet volledig nieuw. In theorie zou het "als nieuw" moeten zijn, maar de ene drive is de andere niet. Er zit toch wat meer risico aan zulke drives, terwijl ze relatief nog wel aan de prijs zijn. (zet zo'n ouderwets IDE-ding maar eens af tegen een SATA SSD 120GB voor minder dan 60 euro).
Dus ik weet nog niet zo goed wat hier wijsheid is. Maar welbedankt voor de info hierover.

Niet security-gerelateerd, want backup voorhanden.
Post de volgende keer, als je nog eens zo'n vraag hebt, een log!
Wél security gerelateerd: S.M.A.R.T. geeft mij nu geen opvallende waarschuwing meer als het écht fout dreigt te gaan!
Ik zie de waarschuwingsmelding bij opstarten nu ALTIJD, en denk iedere keer: och ja, is alleen maar een valse melding vanwege die keer met die netwerkkabel. Maar in de toekomst kunnen er zich échte HDD-problemen ontwikkelen, en die zijn nu niet meer zo snel en makkelijk te detecteren. Want de opstartwaarschuwing geeft alleen simpel aan dát er volgens S.M.A.R.T. iets mis is, maar niet wát er precies met de HDD mis is.

Welke logs je bedoelt weet ik niet zeker, maar systeemlogs waren niet mee gebackupt (alleen data backup) en zijn overschreven door partitie reload. Maar ik verwacht in dit geval niet dat er veel bijzonders in die logs heeft gestaan.

Het korte antwoord op je vraag is dan ook: "Dat kan niet."
Je bedoelt waarschijnlijk: dat wordt te duur? ;(

Weet je wel zeker dat het geen fan was, die begon te ratelen?
Bijna een half uur lang met een hangend scherm, en anders nooit? Ik weet uit ervaring precies hoe retries klinken die door seek-errors en read-errors worden gegenereerd op HDD's die het spoor bijster zijn. Dus geen twijfel mogelijk.

Okee, ik wil er ook niet teveel van verwachten, maar het zou geweldig zijn als er toch nog iemand gaat uitleggen hoe ik de
"retry" S.M.A.R.T. waarde zou kunnen herstellen. (Crystal disk info geeft als drempel de waarde 67, en hij is nu 58)
Zo niet, dan is het forum in ieder geval weer wat wijzer geworden over wat er wegens hoogst waarschijnlijk een
stom brak netwerkkabeltje met je HDD zou kunnen gebeuren.

T.S.
11-02-2015, 21:54 door Anoniem
Joh als jij wilt denken dat je disk nog goed is, ga dan vooral je gang! Dat ding waarschuwt, en als je die waarschuwing
in de wind wilt slaan dan is er verder niks aan de hand, daar hoef je hier geen goedkeuring voor te vragen.

Als je smart tools zo gebruikersvriendelijk zijn dat het niet duidelijk is wat ze bedoelen, boot dan Linux en gebruik
smartctl en hdparam. Kan niet directer, en je kunt een LONG test opstarten en kijken wat die voor resultaat geeft.

Als het ophield bij aandrukken van een connector kan dat ook het gevolg van een mechanisch schokje zijn.
12-02-2015, 00:01 door Erik van Straten
Het is niet in het belang van de fabrikant dat mensen zelf waarden in S.M.A.R.T. tabellen kunnen wijzigen, ik verwacht niet dat je daar tools voor gaat vinden.

Naast Centralpoint (genoemd door Mysterio) lijken ze bij http://www.reichelt.nl/Internal-HDD-2-5-6-4cm-ATA/2/index.html?&ACTION=2&LA=2&GROUPID=6137 ook nog PATA schijfjes te verkopen.

Wat is de waarde van Reallocated Sector Count?
12-02-2015, 00:12 door Anoniem
@TS:

Ik vind het geweldig dat je op zoek gaat naar oorzaken en gevolgen, maar neem van me aan dat ik (beter) weet (dan jij) waar ik het over heb, no offense. Je stelt toch niet voor niets een vraag?

Een UTP-kabel kan onmogelijk een HDD te storen door (breedband-)EMI, op de wijze waarop jij dat omschrijft.
Ik heb er nog nooit van gehoord in ieder geval en draai toch al een tijdje mee inmiddels. Langer dan de meeste HDD's in ieder geval, hahahaha (sorry).
Bovendien zou dat eerder invloed moeten hebben op het RAM (bijvoorbeeld), dat is daar erg gevoelig voor en zou gelijk zijn gefrituurd, in tegenstelling tot de uitermate goed geïsoleerde en geaarde HDD.
Maar voor je gemoedsrust; het zou kunnen hoor, ik kijk inmiddels nergens meer van op.
Daarom vraag ik ook om 'n logje, daar is veel meer uit af te leiden, dan uit een verhaal of hypothese.

Refurbished is als nieuw, omdat er garantie op zit.
Net als bij chips, processoren en andere gevoelige elektronica, wil "nieuw" niets anders zeggen dan "getest en naar vereiste standaarden OK bevonden."
Denk even aan de wafels die door de machines van ASML gejast worden, daar komen normaal gesproken minimaal 3 verschillende kloksnelheden uit, vaak meer.
Dan kun jij stellen dat refurbished per definitie minder goed is dan nieuw, de praktijk wijst toch echt anders uit.

Qua security ben ik het toch echt niet met je eens, want backup.
Het risico is dus nihil, en aangezien mijn / de definitie van security risico-management is..
Met een technische vraag is overigens helemaal niets mis, maar daar zijn andere fora voor.
Dat alles gezegd hebbende, deel ik graag mijn kennis en ervaring met je, ook op dit forum.

Ik had het over een SMART-log, dat leek me duidelijk.
Maar dat was wellicht niet zo, bij deze dus.

"Dat wordt te duur" is geen antwoord dat ik ooit geven zou, ik zou namelijk niet weten hoe vermogend je bent.
Ik zou het willen brengen als "niet kosten-effectief in genoemde situatie."
Mocht je een HDD hebben, die je niet meer kan benaderen, met een Bitcoin-wallet die de moeite waard is, zonder dat je een backup zou hebben, kunnen we altijd verder praten ;)
Desnoods huur ik een clean-room en hang ik de platters in een andere behuizing!
Dat is ook geen grootspraak, ik heb dat jaren geleden al eens moeten doen, zonder cleanroom wel te verstaan. En met succes, >99.9% v/d 'verloren' data heb ik daarmee terug kunnen halen destijds.
Eerlijkheid gebied me wel te zeggen dat dat om een schijf van 28 MB (ipv GB) ging, vergelijk het met een oude LP ipv BlueRay schijf.

M.b.t. die fan, OK helemaal duidelijk.
Neem het me niet kwalijk, maar je moest eens weten hoe vaak iemand me benaderd heeft, met een systeem dat het niet meer deed, louter omdat de stekker (van de stekkerdoos) niet in het stopcontact zat. Snap je?

Niemand hier gaat je kunnen uitleggen, hoe je zonder gespecialiseerde apparatuur, een SMART-waarde kan wijzigen, dat is simpelweg niet mogelijk.
Daar zijn wel mogelijkheden voor, ik noemde eerder al een DeepSpar-setje. Maar die zijn vrij prijzig, en dus is dat wederom "niet kosten-effectief in genoemde situatie."
We hebben het hier over hex-editing, firmware & low-level acces tegelijk.
Niet iets wat je met een standaard ICH voor elkaar gaat krijgen dus.
Er zijn ongetwijfeld hobbyisten die daar een sport van willen maken, maar, ik val in herhaling nu, die ga je eerder op een hardwareforum vinden dan op een security-forum.

Persoonlijk vermoed ik dat je HDD gewoon erg warm is geworden.
Een constante belasting door een softwarematige glitch als gevolg van packet-loss in je UTP-kabel is niet uniek namelijk. In tegenstelling tot jouw hypothese, ben ik dat al meerdere malen in de praktijk tegengekomen.
Het resultaat is er echter niet minder om, dat vind ik dan ook spijtig voor je.
Dat gezegd hebbende, warmte is echt een slijtageslag voor elektronica, en ik zou die SMART-waarschuwing niet zonder meer negeren. Zeker niet zolang ik er niet 100% van overtuigd ben dat er geen degradatie is opgetreden op andere vlakken.
Niet dat ik je niet geloof hoor, maar als ik een advies geef, voel ik me daar ook verantwoordelijk voor.

Ik zou je dan ook willen adviseren om toch maar een refurbished HDD aan te schaffen, en je huidige HDD als externe HDD te gaan gebruiken waar je nooit meer van boot. Dat laatste scheelt ook al een slok op een borrel, wie weet kun je er op die manier nog jaren plezier van hebben.

En wees zelf ook bereid iets van een ander te leren, anders heeft het helemaal geen zin om hier een vraag te posten.

Gr, & succes, anon 16:01


NB: Laat nog even weten wat je nu precies gaat doen als oplossing voor je probleem, wil je?
12-02-2015, 00:24 door Anoniem
Helemaal vergeten, kleine aanvulling op mijn vorige post:

Voor een SMART-test waarbij je de historie niet mee wil laten wegen, is een zgn. "extended test" nodig.
Speedfan is daar een prima middel voor, dat is sowieso een geinig programma als het om hardware gaat.
http://www.almico.com/speedfan.php

Het nadeel van SpeedFan is dat je geen logs kunt exporteren (zodat je die zou kunnen posten), het voordeel is dat je je HDD kunt vergelijken met andere gebruikers die dezelfde HDD gebruiken.


Gr anon 16:01

NB: Een extended test kan lang (!!!) duren, ik zeg het maar even.
12-02-2015, 05:36 door Euro10000
Ik zou de hd leeg maken.
Dan alle sectoren beschrijven, meerdere malen, met
of spinrite
of met ubuntu cd met software badblocks,
dus de instelling kiezen die schrijft en kontroleerd.
Je test de sectoren nu uitgebeid.

Dan formatteren, misschien heb je nu minder fouten in smart.
Dan windows er opnieuw opzetten.
12-02-2015, 12:21 door Anoniem
Door Anoniem: NB: Een extended test kan lang (!!!) duren, ik zeg het maar even.

Eerder: AlibenAli ~ # smartctl --test=long /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-23-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 154 minutes for test to complete.
Test will complete after Thu Feb 12 14:42:44 2015

Use smartctl -X to abort test.

Dank. :) Die waarschuwing zie ik nu pas... Er staat gelukkig ook een jaartal bij, ha ha ha.
12-02-2015, 13:05 door Anoniem
Ik druk me netwerkkabel aan en de S.M.A.R.T. errors verdwijnen. Net als het is geel en als ik het tegen de muur gooi gaat bij de buren de telefoon... PUUR TOEVAL. Koop een verse schijf al dan niet een refurbished en kopieer de zooi over. Ik weet dat als een HDD deze fout gaat geven, je snel moet handelen. Uit ervaring... Als je data veilig is kan je altijd nog gaan zooien op die schijf. Ik gebruik zelf Microscope om te testen.
12-02-2015, 14:20 door Anoniem
Yep. Bestel maaf vast een nieuwe schijf.
Want net als bij de buren de telefoon gaat dan gaat bij jou de disk alsnog stuk :-)
12-02-2015, 14:57 door Anoniem
Door Anoniem:
Door Anoniem: NB: Een extended test kan lang (!!!) duren, ik zeg het maar even.
...Dank. :) Die waarschuwing zie ik nu pas... Er staat gelukkig ook een jaartal bij, ha ha ha.
Dat valt me nog mee, het is ook maar 30GB natuurlijk.
Graag gedaan en:

Door Anoniem: @TS:...
Laat nog even weten wat je nu precies gaat doen als oplossing voor je probleem, wil je?
Ik steek ook vaak wat op van de ervaringen van andere (ervaren!) gebruikers namelijk.
12-02-2015, 15:51 door Anoniem
Door Anoniem: Ik druk me netwerkkabel aan en de S.M.A.R.T. errors verdwijnen. Net als het is geel en als ik het tegen de muur gooi gaat bij de buren de telefoon... PUUR TOEVAL. Koop een verse schijf al dan niet een refurbished en kopieer de zooi over. Ik weet dat als een HDD deze fout gaat geven, je snel moet handelen. Uit ervaring... Als je data veilig is kan je altijd nog gaan zooien op die schijf. Ik gebruik zelf Microscope om te testen.
+
Door Anoniem: Yep. Bestel maaf vast een nieuwe schijf.
Want net als bij de buren de telefoon gaat dan gaat bij jou de disk alsnog stuk :-)
Beetje jammer mensen, iets met een pot en ketel ook.

Gr 16:01
12-02-2015, 17:15 door Anoniem
Vandaag, 00:01 door Erik van Straten:
Wat is de waarde van Reallocated Sector Count?
Volgens Crystal disk info: huidig:100 ; slechtste:100 ; drempel:5
Aangezien veel parameters nog de waarde 100 hebben, zou ik denken dat er nog geen één bad sector op de disk is geconstateerd? Het is me niet altijd even duidelijk hoe ik die waarden van Crystal Disk info moet interpreteren.
Alle waarden hebben nog een ruime marge tussen huidige waarde en drempel. Behalve dan de 07 seek error rate.
Die staat (nog steeds) op 58, en drempel is 67.
Er is dus blijkbaar een groot probleem geweest met het vinden van (een) track(s). Precies wat ik heb kunnen horen.
Alleen schijnbaar is dit even abrupt verdwenen als dat het gekomen is na zachtjes aandrukken van de netwerkkabel,
waarbij deze nog een paar millimeter naar binnen schoof. Daarbij ging de netwerkLED in de laptop weer aan.
En bedankt voor de link van Reichelt. Alleen "mijn prijsje" past daar helaas ook alleen bij refurbished drives.

Vandaag, 00:12 door Anoniem: etc. etc...
Dank voor je uitvoerige reactie. Het is niet zozeer eigenwijsheid hoor, maar "ervarings"-wijsheid.
Altijd een goede zaak om dat met elkaar te delen om wat van elkaar te kunnen leren. (als je naar elkaar luisteren wil)
Verder hield mijn vraag eigenlijk alleen maar in: hoe herstel ik de S.M.A.R.T.-waarde voor seek error rate?
Maar dacht er goed aan te doen in de topic wel eerst even te vertellen hoe ik eigenlijk tot die vraag gekomen ben, zodat het duidelijk is waarom ik die vraag nou eigenlijk stelde.

Trouwens veel van je woorden neem ik ter harte hoor, dus het heeft absoluut zin. En ook ik heb nog nooit van dichtbij meegemaakt dat een HDD ging falen door een EMI-probleem. Maar het "schokje" zoals anoniem 31:54 suggereerde, is geen alternatief. Dan zou ook met andere "schokjes" het probleem weer moeten komen en verdwijnen. Terwijl er nauwelijks een "schokje" is geweest: ik deed het erg voorzichtig, en het vergrendelingslipje van de connector was afgebroken. Dus dat "klikte" niet eens met een licht schokje op zijn plaats.
De retries van de HDD zélf zullen meer "mechanisch schokeffect" hebben gehad dan aandrukken van die kabel...

Jouw alternatieve verklaring van hoge temperatuur is in dit geval trouwens ook dubieus. Het is waar dat hoge temperatuur of grote temperatuurverschillen problemen kunnen veroorzaken, dus ja: wel beslist altijd goed in de gaten houden.
Maar temperatuur verandert niet als je de netwerkkabel een paar millimeter aandrukt. En toch hielden de retry-geluiden onmiddelijk op. Het ging onmiddelijk over naar "normale" HDD-geluiden die horen bij het afsluiten van de PC.
En aangezien software/netwerkverkeer vrijwel geen invloed uitoefent op "seek"-errors (de hele afhandeling van een seek-error gebeurt immers puur in de HDD) bleef voor mij EMI dus als meest waarschijnlijke oorzaak over, of anders een bijzondere combinatie van factoren. En net zoals je zelf zegt: ik kijk nergens meer van op. Het zou kunnen.

Voor wat betreft refurbished drives: hoeft niet altijd slechter te zijn, maar is wel risicovoller.
Ze komen met garantie, maar hebben niet altijd dezelfde garantieperiode als spiksplinternieuwe drives.
Maar ook als ze dat wel hebben, dan blijft het een product met verhoogd risico, dat ik toch maar liever niet wil aangaan
bij een kritische component als een HDD wanneer ik daar ook nog eens voor moet gaan betalen.
Lees bijv. eens: http://windowssecrets.com/forums/showthread.php/146404-Refurbished-hard-drive

Security management is ook: maak zo mogelijk gebruik van voorspellende securityvoorzieningen zoals S.M.A.R.T.
En helaas kan ik hier op dit syteem nu niet meer handig en effectief gebruik van maken, zoals eerder uitgelegd...

De SMART-log wordt volgens mij bijgehouden in een non-volatile memory op je HDD.
Volgens mij leest Crystal DIsk info dit uit, met als resultaat een "fail" op seek error rate.
Voor zover ik kan afleiden verder geen bijzonderheden in die log, en daarom niet genoemd.

"Te duur" was inderdaad wat triviaal uitgedrukt van mij. "Kosten-effectief" duidt beter aan wat ik bedoelde.
Daar heb je helemaal gelijk in. Thanks!
Wel jammer dat er niemand is die eenvoudig kan helpen met hoe een S.M.A.R.T.-waarde aan te passen.
Maar alleen het uitwisselen van informatie en ervaringen is ook wat waard.

Wat ga ik doen? Ik draai eerst nog een poosje door met mijn huidige schijf.
Op een geschikt moment zal ik proberen voor alle zekerheid zo'n extended test proberen te draaien die zich niets van de huidige S.M.A.R.T. waarden aantrekt, maar die domweg een volledige, lange test draait. (vooral seektest)
Geen bericht goed bericht. Als hij gaat falen hoor je het hier van me.
Zal vanaf nu echter wel van ieder nieuw belangrijk databestand onmiddellijk een backup-kopie maken.
Wat mij betreft staat mijn HDD nog bijna op hetzelfde nivo als een "refurbished" HDD.
Met dit verschil dat de mijne een langere "burn-in"-test heeft ondergaan. ; )
Mocht deze storing binnen de garantieperiode zijn gebeurd, dan waren dit nou net van die schijven geweest die retour zouden zijn gegaan naar de fabrikant. Daar herstellen ze de S.M.A.R.T.-waarden en ondergaan ze een extended test.
Eventueel controleren en vervangen ze ook nog een paar slijtagegevoelige onderdelen.
Bij geslaagde test worden ze vervolgens weer op de markt gezet als "refurbished drive".

Dus ik geloof niet zo dat ik met aankoop van een "refurbished drive" bijzonder veel beter af ben.
Maar dus wel vier tientjes armer... (lijkt me niet kosteneffectief... ;-)
Noem mij maar een sufferd, maar de praktijk zal het uitwijzen. Overtuigd als ik ben dat de kans groot is dat er vast niet zoveel met deze HDD aan de hand kan zijn. Dan zullen we zien wat de waarheid is, en hoe lang hij nog mee gaat.
Uiteraard zal ik aan dit forum laten weten wanneer hij sneuvelt.
(d.w.z.: als security.nl en ikzelf nog lang genoeg mee gaan. Altijd positief blijven!... ;)

13:05 door Anoniem: Ik druk me netwerkkabel aan en de S.M.A.R.T. errors verdwijnen. Net als het is geel en als ik het tegen de muur gooi gaat bij de buren de telefoon... PUUR TOEVAL.
Maar waar ligt bij jou dan de grens van "toeval" en "oorzaak -> gevolg"? Duik eens in de materie van EMC (Electro-Magnetische Compatibiliteit) en EMI (Electro-Magnetische Interferentie). Dan begrijp je dat wegens gebrek aan betere verklaringen het niet onmogelijk is wat ik denk. En dat mijn verklaring toch een stukje waarschijnlijker is dan "puur toeval". (hoewel een zeer kleine kans dat het tóch toeval was natuurlijk altijd aanwezig blijft...)

Cheers en dank voor je bijdragen anoniem 00:12 & 00:24!
(en ook dank aan alle anderen die hebben gereageerd)
Mocht er verder nog wat relevants te zeggen zijn m.b.t. dit onderwerp, dan blijft dat natuurlijk welkom.

T.S.
12-02-2015, 20:12 door Anoniem
S.M.A.R.T. = Self-Monitoring, Analysis and Reporting Technology

De reageerders lijken dat allemaal wel te weten, maar het is nergens expliciet gezegd geloof ik: het is de harde schijf (met ingebouwde electronica) zelf die de waarschuwingen geeft. Als er al iets ten onrechte meldingen geeft is het niet een OS maar de schijfelectronica zelf die in de war is. En dat lijkt me ook niet goed. Ik zou ernstig rekening houden met de mogelijkheid dat de meldingen volkomen terecht zijn.

Dat de schijf wel door schijfcontroles heenkomt wil niet zeggen dat er niets mis is. Een schijf heeft reserveblokken die worden gebruikt om defecte blokken te vervangen, en daarbij kan een defect betekenen dat de oude inhoud nog goed gelezen kan worden maar de nieuwe niet meer betrouwbaar geschreven. Omdat het door een reserveblok wordt vervangen gaat er nog geen data verloren. Dit regelt die schijf zelf, het adres van een vervangen blok verandert niet. Bij schijfcontroles en andere acties gaan dus gewoon alles goed, maar S.M.A.R.T. geeft ondertussen wel signalen af dat het een aflopende zaak is. Neem dat serieus, de verdienste van S.M.A.R.T. is dat je die signalen vaak al krijgt voordat je data kwijt begint te raken. Zoek naar de specifieke meldingen die je krijgt op zoekmachines en je krijgt vermoedelijk een indruk van hoe serieus je die moet nemen. En als je twijfelt: je kan die schijf beter vervangen hebben voordat je echt in de problemen komt dan daarna, en als bij een oude computer vervanging een probleem is dan kan je misschien beter die hele pc vervangen, je krijgt dezelfde verwerkingscapaciteit tegen heel wat minder energieverbruik dan bij dat oude ding.
12-02-2015, 22:00 door Anoniem
Vandaag, 17:15, door Anoniem: Aangezien veel parameters nog de waarde 100 hebben, zou ik denken dat er nog geen één bad sector op de disk is geconstateerd? Het is me niet altijd even duidelijk hoe ik die waarden van Crystal Disk info moet interpreteren.
...
Voor zover ik kan afleiden verder geen bijzonderheden in die log, en daarom niet genoemd.
...
Mocht er verder nog wat relevants te zeggen zijn m.b.t. dit onderwerp, dan blijft dat natuurlijk welkom.

T.S.
Bedankt voor je uitvoerige reactie + update + uitleg nav mijn vragen / opmerkingen.
Alles is me ook helemaal duidelijk nu, behalve de zaken die ik hierboven quote.
Ik zou toch echt héél snel een extended test uitvoeren. Als je hulp nodig hebt met interpreteren moet je je logje maar op pastebin knallen, en hier een linkje plaatsten.


Succes er mee, hopelijk leeft je HDD nog lang en gelukkig.

Gr. 16:01

NB: Je zou naar iemand op zoek kunnen gaan, die geschikte apparatuur in huis heeft en waar je langs zou mogen komen. Maar daar moet je niet op security.nl voor zijn ;)
12-02-2015, 22:34 door Anoniem
Door Anoniem: S.M.A.R.T. = Self-Monitoring, Analysis and Reporting Technology

De reageerders lijken dat allemaal wel te weten, maar het is nergens expliciet gezegd geloof ik: het is de harde schijf (met ingebouwde electronica) zelf die de waarschuwingen geeft. Als er al iets ten onrechte meldingen geeft is het niet een OS maar de schijfelectronica zelf die in de war is. En dat lijkt me ook niet goed. Ik zou ernstig rekening houden met de mogelijkheid dat de meldingen volkomen terecht zijn.

Dat de schijf wel door schijfcontroles heenkomt wil niet zeggen dat er niets mis is. Een schijf heeft reserveblokken die worden gebruikt om defecte blokken te vervangen, en daarbij kan een defect betekenen dat de oude inhoud nog goed gelezen kan worden maar de nieuwe niet meer betrouwbaar geschreven. Omdat het door een reserveblok wordt vervangen gaat er nog geen data verloren. Dit regelt die schijf zelf, het adres van een vervangen blok verandert niet. Bij schijfcontroles en andere acties gaan dus gewoon alles goed, maar S.M.A.R.T. geeft ondertussen wel signalen af dat het een aflopende zaak is. Neem dat serieus, de verdienste van S.M.A.R.T. is dat je die signalen vaak al krijgt voordat je data kwijt begint te raken. Zoek naar de specifieke meldingen die je krijgt op zoekmachines en je krijgt vermoedelijk een indruk van hoe serieus je die moet nemen. En als je twijfelt: je kan die schijf beter vervangen hebben voordat je echt in de problemen komt dan daarna, en als bij een oude computer vervanging een probleem is dan kan je misschien beter die hele pc vervangen, je krijgt dezelfde verwerkingscapaciteit tegen heel wat minder energieverbruik dan bij dat oude ding.
Normaalgesproken helemaal mee eens, maar je negeert de bijzondere omstandigheden waardoor het bij mij ontstaan is,
en dat het even abrupt kwam als dat het met aandrukken van slechte netwerkconnector weer verdween en tot nu toe niet is teruggekomen. Verder betrof het volgens Crystal disk info zo te zien alleen maar seek errors. Geen enkele bad sector.
(tenzij ik heel verkeerd interpreteer wat ik daarin zie, maar ik denk dat die kans klein is)

T.S.
12-02-2015, 23:16 door Anoniem
Vandaag, 22:00 door Anoniem: Alles is me ook helemaal duidelijk nu, behalve de zaken die ik hierboven quote. Ik zou toch echt héél snel een extended test uitvoeren. Als je hulp nodig hebt met interpreteren moet je je logje maar op pastebin knallen, en hier een linkje plaatsten.
In Crystal disk info staat bij "ID 07, seek error rate" bij mij een rode stip in plaats van een blauwe, en de huidige waarde, 58, ligt onder de drempel, 67. Dus dat stuk is duidelijk en relevant. Voor alle andere parameters staat een blauwe stip.
Die zijn dus kennelijk nog binnen de marges. Als je een keer Crystal Disk Info draait, ervaar je denk ik de bedoelde interpretatieproblematiek wel: wat moet je met al die cijfers. Staat het getal "100" in de meeste gevallen voor zoiets als "100% in orde"? Ik denk van wel, maar zekerheid is wat anders. Het kan zijn dat die cijfers drive-gerelateerd zijn, en bij iedere drive weer anders zijn gedefinieerd, en daarom dus ook iets anders moeten worden geinterpreteerd. Verder nogmaals bedankt voor het meedenken/advies/bijstand.

T.S.
12-02-2015, 23:17 door Anoniem
Mijn ervaring met HDD's en S.M.A.R.T. systemen: Het werken met harde schijven is een kwestie van probabilities (Net zoals het hele leven eigenlijk)
Een hardeschijf met S.M.A.R.T. kan spontaan de geest geven zonder S.M.A.R.T. voor-waarschuwing. De kans daarop is niet zo groot, maar zeker niet nul.
Een hardeschijf met S.M.A.R.T. , die een waarschuwing geeft, kan sneller de geest geven dan een hardschijf met S.M.A.R.T. die die waarschuwing niet geeft. Daar is het systeem voor bedoeld. Maar er bestaat een kans dat hij nog jaren prima werkt, alsof er niets aan de hand is.

De aard van de S.M.A.R.T. melding kan een aanwijzing zijn. In het geval van één van mijn hardeschijven is de Seek_Error_Rate in de buurt van een zekere threshold. De S.M.A.R.T. melding gaat niet meer weg. Maar deze meetwaarden zijn en blijven al jaren hetzelfde. Ik gebruik deze schijf als backup van een backupschijf voor niet al te belangrijke data. Het kan zijn dat de thresholds een beetje te krap zijn ingesteld (maar daar is niets aan te doen).
Het door jou beschreven geval, "een netwerkkabeltje hing los, vandaar het harddisk gereutel"; Er is een grote kans dat het hardeschijf probleem geheel los staat van dit netwerkkabeltjes probleem. Toeval dus. Het zou misschien kunnen dat het losse netwerkkabeltje onbedoeld langsduring een extra last heeft betekend voor je hardeschijf, waardoor één van de S.M.A.R.T. thresholds is getriggerd. Die extra belasting is een situatie waar een goed ontworpen hardeschijf gewoon tegen moet kunnen trouwens.

Better safe than sorry: Zorg voor een degeijke backupstrategie. Neem bij S.M.A.R.T. meldingen het zekere voor onzekere. Maar houd er rekening mee dat S.M.A.R.T. ook maar gewoon een afkorting is. En dat het niet persé een slim systeem hoeft te zijn.
12-02-2015, 23:54 door Anoniem
Ik vraag me slechts even af of tweakers.net of een computerhelp-website niet een meer toepasselijke plek was geweest voor deze vraag. Het heeft toch niet veel met security te doen. Al ben ik blij om te zien dat er toch wel erg kundige antwoorden komen.
13-02-2015, 00:16 door Erik van Straten - Bijgewerkt: 13-02-2015, 00:18
12-02-2015, 17:15 door Anoniem:
12-02-2015, 00:01 door Erik van Straten:
Wat is de waarde van Reallocated Sector Count?
Volgens Crystal disk info: huidig:100 ; slechtste:100 ; drempel:5
Wat staat er onder Raw Values achter de volgende velden (voor zover ze getoond worden):
- Current Pending Sector Count
- Reallocated Sector Count
- Uncorrectable Sector Count
- Reported Uncorrectable Errors

12-02-2015, 17:15 door Anoniem: Aangezien veel parameters nog de waarde 100 hebben, zou ik denken dat er nog geen één bad sector op de disk is geconstateerd? Het is me niet altijd even duidelijk hoe ik die waarden van Crystal Disk info moet interpreteren.
Mij ook niet, probleem is dat de specificatie een zootje is en bij veel waarden diverse "vendor specific bits" heeft, waardoor de raw value niets zegt en het ook de vraag is of Crystal Disk Info ze goed interpreteert.

Het zou mij totaal niet verbazen als er een SMART error gesignaleerd wordt om een heel andere reden dan de "seek count" waar jij steeds vanuit gaat. Als de drive een half uur heeft lopen rammelen verwacht ik geen getallen onder de honderd, maar veel hoger.

12-02-2015, 17:15 door Anoniem: Alle waarden hebben nog een ruime marge tussen huidige waarde en drempel. Behalve dan de 07 seek error rate.
Die staat (nog steeds) op 58, en drempel is 67.
Voor de HDD in mijn notebook geldt: Current=76, Worst=60, Threshold=30; raw=000002B28B10. Deze drive is echter prima.

In https://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology staat een tabel waarin je kunt zien welke raw values "echte tellers" zijn (hexadecimaal) en die je dus kunt interpreteren.

12-02-2015, 17:15 door Anoniem: Er is dus blijkbaar een groot probleem geweest met het vinden van (een) track(s).
Dat lijkt mij onwaarschijnlijk. Ik vermoed eerder dat je virusscanner de schijf aan het scannen was, of Windows een search-index aan het opbouwen was. Dat zijn vaak processen met lage prioriteit.

Na het goed aansluiten van een netwerkkabel gebeurt er vanalles in een computer, dat ook ongetwijfeld tot harddisk lees- en schrijfacties leidt. Dat zijn processen met hoge prioriteit, die voorrang krijgen. Daardoor kan het bovengenoemde geluid snel stoppen.

Gebruikelijk is dat als een HDD een sector niet (ECC correctie lukt geheel niet meer) of moeilijk (na een aantal retries) kan lezen, de sector als "Pending" wordt aangemerkt. Dat wil zeggen dat de HDD de sector nu niet kan lezen, maar er nog geen beslissing over neemt. Immers, mogelijk kan de data er in nog gered worden.

Echter, iets heeft ertoe geleid dat je eerst geen SMART error had, en nu wel.

Wat zou kunnen is dat een achtergrondproces bezig was (virusscan bijv.) en bij herhaling een "onleerbare" sector probeerde te lezen, en geen goede foutafhandeling heeft (Windows maar ook de meesteb programma's houden geen rekening met bad blocks, een lus met "retry until succes" is denkbaar). Het proberen te lezen van een bad sector kan het bekende klikkende geluid opleveren (de schijf reset de positie van de koppen en probeert het opnieuw). Als de software de foutmelding (en/of timeout) negeert en blijft proberen, blijf het klikkende geluid herhalen.

Met een "Pending" sector kunnen twee dingen gebeuren:
1) de schijf krijgt de opdracht de betreffende sector te lezen en het lukt ineens wel;
2) de betreffende sector wordt overschreven (de software is kennelijk niet geïnteresseerd in de oude data).
Gebruikelijk is dat in beide gevallen de plaats op de schijf voor de betreffende sector niet meer wordt gebruikt; deze wordt geremapped. Daarmee gaat de teller "Pending Sector Count" omlaag en "Reallocated Sector Count" omhoog.

Denkbaar is dat door het aansluiten van de netwerkkabel een bad sector is "overschreven" (remapped). Het kan ook zijn dat de koppen vanuit een andere uitgangspositie kwamen na het aansluiten van de netwerkkabel (en, na DHCP etc, terugkeren naar wat de computer daarvoor aan het doen was), en dit er toevallig toe leidde dat de "bad sector" wel gelezen kon worden.

Hoe dan ook, met mijn theorie hierboven zou er sprake moeten zijn van "Reallocated Sector Count" en/of "Pending Sector Count" groter dan nul. Ik ben benieuwd...
13-02-2015, 15:05 door Anoniem
Wat staat er onder Raw Values achter de volgende velden (voor zover ze getoond worden): etc.etc...
- Current Pending Sector Count: 000000000000
- Reallocated Sector Count: niet aanwezig; wel:
- Reallocated Sectors Count: 000000000000
- Uncorrectable Sector Count: 000000000000
- Reported Uncorrectable Errors: staat bij mij niet in de lijst

Mogelijk nog interessant(?):
- Reallocation Event Count: 000000000048
- UltraDMA CRC Error Count: 000000000001
- Read Error Rate: 000000000000
- Seek Error Rate: 0000014B0000

Het valt mij nu op dat er op het eerste gezicht geen eenvoudige vaste relatie lijkt te zijn tussen de "raw" waarden en de "huidige/slechtste/drempel" -getallen die er voor staan.
Virusscanner was niet aanwezig op het op dat moment geladen OS. Ook updates is uitgesloten. Gebleken voordeel in
deze situatie: deze hebben dus geen roet in het eten kunnen gooien. ;-) (ook al had ik er andere redenen voor)
Wel verdenk ik de HDD -driver ervan dat deze extra activiteit op de HDD kan veroorzaken. (onderhoudswerk?)
Ik herinner me dit uit een ver verleden toen die driver werd geupdate. Mogelijk mede in verband met opkrikken van
performance en misschien ook nog wel met problemen die vroege HDD's van dit type hadden. Zeggen ze er niet bij.

Maar blijft dus wel opvallend dat ook in die "raw"-waarden de "Seek Error Rate" er zo uitspringt.
Mijn idee hierover is dat afhandeling van een seek error geheel in de HDD zélf gebeurt, en los staat van het O.S.
Daarom vind ik jouw suggestie over de oorzaak ook niet al te waarschijnlijk.
Tenzij we dus op het verkeerde been worden gezet door Crystal Disk Info, en het helemaal niet om seek errors zou gaan.
Maar er is niet concreet iets wat daar op wijst: seek errors gaan gepaard met retries, en dat is exact wat ik heb gehoord!
Wat denk jij?
13-02-2015, 15:41 door Anoniem
Verdraaid! Nog even een snel aanvulling op het vorige bericht:
Zojuist vond ik een random seektest die zich niets aantrekt van S.M.A.R.T. failures, en die gaat draaien als je met
de officiële HGST DFT tool de temperatuurtest runt. Dat is precies wat nodig is voor meer zekerheid in dit soort situaties.
(misschien ook handig voor anderen op dit forum dat die temperatuurtest dus ook een random seektest is).
Die test laat ik eens een flinke tijd lopen. Kijken wat er gebeurt. U hoort nog van mij.
De DFT tool is te downloaden van de website van de HDD fabrikant: https://www.hgst.com/support/downloads
Officieel spul van de fabrikant. Daar houd ik wel van.

T.S.
13-02-2015, 21:41 door Anoniem
Na ruim 1,1 miljoen seek-operaties zijn er geen waarneembare problemen uit de bus gekomen.
Temperatuur staat al uren op een acceptabele 44 graden celsius.
Het koppensysteem van mijn HDD kan dus kennelijk nog prima "spoorzoekertje" spelen.
En ik heb besloten voorlopig de drive niet verder te "verseeken" en heb de test onderbroken.

[hier onderbrak ik mijn schrijven, want ik wilde nog even iets controleren]

Namelijk dit:
hierna Crystal Disk Info nogmaals gedraaid om de status van de Seek Error Rate te bekijken.
Zou er misschien nog wat bijgekomen zijn? Wat denk je?
De nieuwe Seek Error Rate is... 000000000000 !!!!! En drivestatus is nu weer "Goed". Geweldig! :-))))
Dit had ik echt niet verwacht. Zo zie je maar weer: met vallen en opstaan samen een beetje verder nadenken kan meestal geen kwaad.

Superbedankt iedereen,
misschien komt jullie deze ervaring ooit ook nog eens van pas, en een goed weekend!
13-02-2015, 23:07 door Spiff has left the building
Door Anoniem, vr.13-02, 15:05 uur:
- Current Pending Sector Count: 000000000000
- Reallocated Sector Count: niet aanwezig; wel:
- Reallocated Sectors Count: 000000000000
- Uncorrectable Sector Count: 000000000000
- Reported Uncorrectable Errors: staat bij mij niet in de lijst

Mogelijk nog interessant(?):
- Reallocation Event Count: 000000000048
- UltraDMA CRC Error Count: 000000000001
- Read Error Rate: 000000000000
- Seek Error Rate: 0000014B0000
Door Anoniem, vr.13-02, 21:41 uur:
De nieuwe Seek Error Rate is... 000000000000 !!!!! En drivestatus is nu weer "Goed". Geweldig! :-))))
Dat de Reallocation Event Count = 000000000048,
dat is 72 in decimale notering,
dat lijkt me echter nog wel een punt van aandacht.
https://en.wikipedia.org/wiki/S.M.A.R.T.
https://kb.acronis.com/content/9132
Misschien is een dergelijke waarde als normaal te beschouwen voor een oude HDD, en geen werkelijk probleem, maar het laat wellicht wel zien dat de HDD niet meer blaakt van jeugdige gezondheid.
14-02-2015, 00:02 door Erik van Straten
Ik vernoed dat het Hitachi tooltje inderdaad de waarde voor seek errors in de S.M.A.R.T. tabel gereset heeft, maar ik ben het eens met Spiff, die "Reallocation Event Count" is niet OK. Als je de schijf blijft gebruiken en er gegevens op staan die je niet wilt missen: ga niet pas backuppen bij de eerstvolgende S.M.A.R.T. melding!

Crystal Disk Info toont die "Reallocation Event Count" bij mijn Seagate 750GB HDD overigens niet, maar wel de eeder door mij genoemde waarden.

Zoals ik al eerder schreef (en Wikipedia vermeldt), zo'n raw S.M.A.R.T. tabel entry (12 bytes lang) bevat ofwel een teller, ofwel fabrikant-specifieke info. Uit de eerder door jou genoemde Seek Error Rate van "0000014B0000" kun je, als je niet over gedetallieerde gegevens van de fabrikant beschikt, niks zeggen.
14-02-2015, 00:31 door Eric-Jan H te D
Misschien een advies. Noteer de waarden en vergelijk van tijd tot tijd.

-Wanneer de waarden constant blijven kan dit wijzen op een aanvaardbare initiële productieafwijking.
-Wanneer de waarden verslechteren zou ik mij meer zorgen maken.
14-02-2015, 13:25 door Anoniem
@TS:

Werkelijk bizar; als een diagnose-tool SMART.-waardes kan resetten, zou ik me pas écht zorgen gaan maken.
- Waarom zou je zo'n test voortijdig afbreken?
- Zijn andere waarden nu ook aangepast? (Cycli, hours of operation, etc?)
- Besef je je, dat de fabrikant hiermee ernstig faalt?


Een dringend verzoek:
Zou je aub (!!!) een volledig log willen posten, om mijn vertrouwen in IBM (= Hitatchi) niet tot een absoluut dieptepunt te laten dalen?

16:01


NB: Ik vraag JOU dus nu om hulp!
15-02-2015, 14:49 door Anoniem
Dit is wat ik denk: als S.M.A.R.T.-diagnosesysteem kun je moeilijk vol blijven houden dat het seeksysteem van je HDD op instorten staat na maar liefst meer dan 1,1 miljoen foutloze seeks op een rij...
Mijn indruk is dat S.M.A.R.T. slimmer is dan wij dachten, en het met mij eens is geworden dat er een "glitch" in het systeem moet zijn geweest die niets met een relevante degradatie van de HDD te maken had.

Het is imho nu niet de tijd om nog heel erg sceptisch en ongerust te zijn: andere kritische parameters zijn niet gereset, maar gelijk gebleven. En ze liggen volgens Crystal Disk Info (CDI) nog ruim binnen de gestelde marges.
Het aantal reservesectoren zal vast aanzienlijk hoger zijn dan 4x16+8=72.
Op grond van informatie over oude 512 bytes/sector HDD's zou het naar schatting in de orde van ca. 63 sectoren per 40MB kunnen zijn. Dus bij deze 30GB HDD is dat in de richting van tienduizenden reservesectoren.

Bij kritieke waarden zou CDI ook wel hebben gemekkerd over die Reallocation Event Count.
Maar een aantal van 72 komt zo te zien zelfs niet in de buurt van de drempel waarbij het kritisch wordt.
(de "genormaliseerde" waarden zeggen hier: huidige waarde: 100; slechtste:100 drempel:5.
Ik ben er inmiddels behoorlijk van overtuigd dat "100" bij dit model HDD is te interpreteren als: afgerond nog 100% OK)

Bij eventuele "onder"schrijding van een drempel zal CDI waarschuwen met een rode kleur op dat specifieke punt.
Zoals hij voorheen ook al deed bij (uitsluitend en alleen!) "Seek Error Rate", toen deze nog onder de drempelwaarde stond. En daarmee klassificeerde CDI de algehele toestand van de HDD toen meteen ook als "slecht".
Maar na kennelijk een reset van Seek Error Rate blijft er dus verder geen enkel punt meer over dat kritiek is. Daarom klassificeert CDI de HDD nú gewoon weer als "goed". Alle S.M.A.R.T.-waarden zijn zelfs ver uit de buurt van de bijbehorende drempelwaarden. (en waren dat eerder dus ook al; behalve toen dus die ene waarde voor "Seek Error Rate")

Opvallend is wel dat "Reallocated Sectors Count" op nul staat, en "Reallocation Event Count" op 72 (x48).
Ik zou eerder verwachten dat deze twee getallen (ongeveer) hetzelfde zijn.
Gokje: er is kennelijk 72 x geprobeerd om een "bad sector" te verhuizen, maar dit is dus niet één keer gelukt?
En het mondde vooral uit in een half uur lang "seek" -errors, d.w.z.: hij kon de sectoren niet meer vinden?

Dit blijft zo op het eerste gezicht wel wat merkwaardig, maar kan evengoed alles te maken hebben gehad met de tijdelijke "glitch" op het systeem vanwege die half aangesloten (en daarom qua EMC niet meer perfecte) netwerkconnector.
Is de HDD ingangsversterker trouwens gevoelig voor 10MHz signalen? Ik hing aan een 10M netwerkje, dus als er pulserende EMI rond die frequentie optrad, dan bevestigt dat mijn vermoedens alleen maar. Lijkt me nog steeds geen onwaarschijnlijk oorzaak. Seeks hebben volgens mij ook veel te maken met "de koppen zó boven de track plaatsen dat je maximale signaalsterkte hebt". En dan kan het minste of geringste bijkomende pulserende storinkje van buitenaf dat te ver doordringt en enigszins in de buurt van de bitfrequentie van de HDD ligt, de zaak natuurlijk helemaal van slag brengen.

Voor wat betreft de kritiek/vraag van "het vroegtijdig afbreken van de test":
Ik brak de test af omdat het in feite een temperatuurtest was, die waarschijnlijk eeuwig door blijft gaan totdat je hem afbreekt. En aangezien de temperatuur al urenlang niet meer veranderde...
In de temperatuurtest worden random seeks alleen maar gebruikt om de temperatuur van de drive tot een maximum
op te krikken. Want een "seek" op een mechanische HDD kost extra energie. Dat stookt de temperatuur van zo'n HDD lekker op. Maar dit gegeven heb ik dus een beetje "misbruikt" en als volgt geredeneerd:
"als er werkelijk een structureel seek-error probleem zou zijn (zoals CDI vanuit de S.M.A.R.T.-tabel toen dus nog aangaf), dan moet de Seek Error Rate bij zo'n temperatuurtest gaan toenemen. Niet per sé vanwege die temperatuurstijging,
maar vooral ook omdat er zoveel seeks worden uitgevoerd." En dat wilde ik verifiëren.
Maar heb tijdens die test geen retries gehoord. Alleen gezonde "seek"-geluiden. Uiteindelijk bleek de S.M.A.R.T. waarde dan ook niet toegenomen, maar zelfs gereset! Wat mij betreft een prima actie van S.M.A.R.T. in dit geval, en... het antwoord op mijn oorspronkelijke vraag. ;-)

Dus ik ben alleen maar blij dat S.M.A.R.T. kennelijk zo slim was om het met mij eens te worden, en denk overigens niet meteen dat HGST-tools zélf die S.M.A.R.T. waarde heeft gereset. Ik wijt het eerder aan het S.M.A.R.T.-controlesysteem
in de HDD na zoveel gelukte seeks. Het zou vast bij ieder ander seek-test programma óók zijn gebeurd(?)
Maar om meer zekerheid te krijgen dat de reset werkelijk door S.M.A.R.T. komt en niet door HGST-tools, zul je nog eens zo'n HDD mét seek errors bijv. één seconde aan die HGST-temperatuurtest moeten onderwerpen.
En dan kijken of zelfs na zo'n korte testtijd de Seek Errror Rate óók al wordt gereset. (ik hoop van niet, want dan wordt het dus wél wat bedenkelijk voor HGST-tools)
Op dit moment heeft zo'n test bij mij geen enkele zin, immers de Seek Error Rate van mijn HDD ís al nul geworden,
en zal bij een reset gelijk blijven (nul dus). Ik kan zoiets nu dus niet meer onderscheiden met mijn HDD drive.
En helaas: de S.M.A.R.T.-waarde eenvoudig even handmatig aanpassen zal niet gaan wordt er gezegd.
(tenzij iemand misschien toevallig over een DeepSpar setje beschikt en het voor ons even uit wil testen? ;-)

Maar de beste praktische wijsheid imho is wat mij betreft nu de strekking van het advies van Eric-Jan H te A:
alle (kritische) S.M.A.R.T.-waarden voorlopig wel even wat extra in de gaten houden of ze niet teveel veranderen binnen korte tijd." (zal ik doen). En natuurlijk niet te zuinig backups/reservekopieën maken van belangrijke bestanden.

Wederom bedankt voor het meedenken,
T.S.

P.S.: wie met Crystal Disk Info (CDI) wil spelen zij zich ervan bewust dat de installatieversie van CDI een OpenCandy module bevat. De portable versie zou dat volgens Tweakers niet hebben.
17-02-2015, 14:05 door Anoniem
13-02-2015, 15:05 door Anoniem: Mijn idee hierover is dat afhandeling van een seek error geheel in de HDD zélf gebeurt, en los staat van het O.S.
Oude documentatie (op papier) wijst uit dat dit een zeer beperkte waarheid is.
Gebruikelijk en het meest logisch is dat i.g.v. seek-error de HDD-controller het automatisch (dus buiten het O.S.om) een beperkt aantal malen opnieuw zal proberen (bijv. 4x). Gaat het alle 4x fout, dan zal de controller de seek-error ten slotte toch nog terugrapporteren (meestal aan het O.S. c.q. driver binnen het O.S), en die bepaalt dan wat er verder moet gebeuren. Maar ongeacht wat de oorzaak nu precies geweest is: fijn dat het naar tevredenheid opgelost lijkt.
12-04-2015, 23:48 door Anoniem
Na een tijdelijke opleving heb ik helaas toch afstand moeten doen van mijn ouwe trouwe HDD.
De seek-problemen hadden kennelijk toch hun voornaamste oorsprong in de HDD zelf.

De S.M.A.R.T. seek-error-rate melding trad weer op in dezelfde situatie als de eerste keer.
Hierbij staat de laptop langdurig aan, en wordt er af en toe flink bulk data weggeschreven.

Geconstateerd is dat de HDD nog wel iedere sector vindt, maar af en toe gaat het erg langzaam.
De gemiddelde "zoektijd" kan dan oplopen tot meer dan 200 milliseconden.
Aan de andere kant kon het soms ook best lange tijd goed gaan. (ca.18 ms zoektijd)
En als het maar lang genoeg goed gaat, dan reset S.M.A.R.T. de "seek-error rate failure" en lijkt alles weer ok.
Maar het leek langzaamaan erger te worden. Afgelopen vrijdag heb ik hem dus toch maar vervangen.

Wel nog een hele andere "Security" opmerking:
De vervangende HDD leek als nieuw en werd als nieuw verkocht "want het antistatisch verpakkingszakje
was immers nog gesealed". Echter toen ik thuis de schijf eerst maar eens met een diskedit programma benaderde,
bleek hij vol te staan met data van vermoedelijk de vorige eigenaar!!!...
Alleen de bootsector was op 4 bytes na leeg, en het ding startte niet op. (knipperende cursor)

Blijkbaar was dit dus toch een "refurbished" drive en geen echt nieuwe drive.
Maar het laat wel zien hoe onveilig het is om "defecte" HDD's even snel onder garantie om te ruilen
voor een nieuwe, want zo erg defect hoeft hij helemaal niet te zijn.
En dan kan een volgende eigenaar met technische know-how je privédata eventueel reconstrueren
(tenzij alle HDD-data goed versleuteld was)

Wat trouwens ook kan, is dat zo'n "nieuwe" HDD terecht komt bij iemand die geen enkel benul heeft.
Maar als hij/zij ooit verdachte zou worden in een zaak, en deze HDD wordt forensisch onderzocht,
dan vinden experts mogelijk dingen van de vorige eigenaar die niet door de beugel kunnen.
En dan zou je zomaar kunnen worden aangezien op dingen waar je nooit iets mee te maken hebt gehad.
Het zou iemands leven kunnen verwoesten.
Je kunt dus maar beter een installatie op zo'n "nieuwe" HDD met een volledige diskwipe beginnen.

Eerlijk gezegd vind ik het niet kunnen dat er harde schijven compleet met data van andere personen
na een "refurbish" worden doorverkocht. Een volledige diskwipe zou imho deel moeten uitmaken van
het refurbish proces. (maar is dat dus blijkbaar niet...)
13-04-2015, 17:35 door Anoniem
Door Anoniem:

Eerlijk gezegd vind ik het niet kunnen dat er harde schijven compleet met data van andere personen
na een "refurbish" worden doorverkocht. Een volledige diskwipe zou imho deel moeten uitmaken van
het refurbish proces. (maar is dat dus blijkbaar niet...)

Seagate disk van Mycom toevallig?
17-04-2015, 11:05 door miloson24
[Verwijderd door moderator]
17-04-2015, 11:21 door Anoniem
Door Anoniem: Na een tijdelijke opleving heb ik helaas toch afstand moeten doen van mijn ouwe trouwe HDD.
De seek-problemen hadden kennelijk toch hun voornaamste oorsprong in de HDD zelf.

De S.M.A.R.T. seek-error-rate melding trad weer op in dezelfde situatie als de eerste keer.

Dus eigenlijk kunnen we concluderen dat S.M.A.R.T. het gewoon bij het rechte eind had, en dat degene die bij een
dergelijke melding gewoon de disk backupt en vervangt een hoop tijd spaart t.o.v. iemand ie wantrouwend is ten opzichte
van waarschuwingen en eerst het mechanisme wil proberen te verslaan?

Tuurlijk kun je een hoop leren op die manier, maar de manier waarop het aangevlogen wordt (er is een waarschuwing maar
ik merk niks bijzonders dus ik wil niet meer gewaarschuwd worden) die vind ik toch wel wat merkwaardig.
17-04-2015, 14:40 door Anoniem
SMART warnings negeren is gewoon niet smart :)

De performance counters zijn niet zo zwart-wit te lezen, maar als je opstart-warnings krijgt, dan ben je echt wel in phase 2a van afsterven belandt omdat moderne HDDs initieel 'bad blocks' transparent voor de computer (lees: HDD-intern) oplost; pas als de HDD (bijna) niet meer 100% data-integriteit, schiet ie echt in alerting mode. Dan kan de HDD het nog prima een half jaar doen, ... of 30 minuten. Is gewoon Russische roulette. En trouwens vaak genoeg ook overleden HDDs zonder enige SMART melding meegemaakt hoor. Dergelijke jarenlang geimplementeerde waarschuwingslampjes zijn bijna nooit false-positives :)
18-04-2015, 16:07 door Anoniem
Door Anoniem: Na een tijdelijke opleving heb ik helaas toch afstand moeten doen van mijn ouwe trouwe HDD.
De seek-problemen hadden kennelijk toch hun voornaamste oorsprong in de HDD zelf.
Hate to say I told you so...

Wel fijn dat je deze info nog even komt delen, 1000 punten, respect en bedankt!


Gr anon 16:01 t/m 12-02-2015, 22:00.
23-04-2015, 17:09 door Anoniem
Door Anoniem:
Door Anoniem:

Eerlijk gezegd vind ik het niet kunnen dat er harde schijven compleet met data van andere personen
na een "refurbish" worden doorverkocht. Een volledige diskwipe zou imho deel moeten uitmaken van
het refurbish proces. (maar is dat dus blijkbaar niet...)

Seagate disk van Mycom toevallig?
De "nieuwe" drive is een Hitachi. Ik heb hem van een winkel bij wie hij al een jaar of twee op de plank lag.
De winkelier had er in 2013 voor een klant eentje nodig, en had er toen meteen maar twee besteld.
Maar er was geen vraag meer naar geweest. En ik weet verder niet bij wie de winkelier die HDD's toen had besteld.


Tja, S.M.A.R.T. leek het uiteindelijk bij het rechte eind te hebben. Maar ik schaam mij er niet voor dat ik deze ene keer
eerst een andere conclusie trok. Het was niet meteen zo duidelijk. Bijzonder toevallig allemaal.
De "intermittent nature" van deze storing en de omstandigheden waarbij de storing voor het eerst aan het licht kwam,
maakte het erg lastig om de boosdoener direct met 100% zekerheid aan te wijzen. Dat het na een flinke seektest was verholpen (duurtest nota bene van méér dan een miljoen seeks!!!), leek te bevestigen dat de HDD best oké was.
Maar helaas... (Overigens alle relevante S.M.A.R.T. waarden (zie 13-02-2015, 15:05 door Anoniem) zijn hetzelfde gebleven
het ging dus puur weer enkel en alleen om dat seekerror probleem)

Eerlijk gezegd houd ik ook nu nog een procentje twijfel. De "nieuwe" HDD heeft de eerste testen weliswaar glansrijk doorstaan, maar dat was de oude HDD ná de error ook al eens gelukt... Dus je weet maar nooit. De tijd zal het leren.


In ieder geval bedankt voor alle reacties, adviezen en medeleven.

T.S.
24-04-2015, 12:44 door Anoniem
Bij ons in het bedrijf indien er een S.M.A.R.T melding komt( server, werkstatation, laptop), ongeacht wat de oorzaak is, wordt de disk de zelfde dag nog vervangen. Ook al zou de disk b.v. nog 2 maanden of 6maanden mee kunnen. Vervangen we toch preventief, om ongewenste downtijden te voorkomen.
Dus we wachten niet af tot de melding dat de disk ook echt gefailed of defect raakt.
Dit voorkomt een hoop tijd / ellende, op momenten dat je "geen tijd hebt voor een restore". Aangezien dit vaak op de meest rare momenten voorkomt. (Buiten kantoor tijden.. met kerst, of met pasen etc)
24-04-2015, 13:10 door Anoniem
Harde schijven zijn verbruiksvoorwerpen die (helaas) zo'n beetje het belangrijkste component van computer of laptop vormen. S.M.A.R.T. geeft een indicatie af, soms eentje die je niet té licht moet nemen.

Zie het bericht hierboven: Bij bedrijven gaat men op zeker en wordt bij de eerste error direct de schijf vervangen om problemen te voorkomen.Hulde, zo zou iedereen het moeten doen!

Zelf raad ik mijn klanten altijd aan om na ongeveer 3 á 4 jaar überhaupt de harde schijf preventief te vervangen. Dit geldt dan voor de klassieke schijven, niet de SSD's.
24-04-2015, 14:30 door Anoniem
Door Anoniem: Harde schijven zijn verbruiksvoorwerpen die (helaas) zo'n beetje het belangrijkste component van computer of laptop vormen. S.M.A.R.T. geeft een indicatie af, soms eentje die je niet té licht moet nemen.

Zie het bericht hierboven: Bij bedrijven gaat men op zeker en wordt bij de eerste error direct de schijf vervangen om problemen te voorkomen.Hulde, zo zou iedereen het moeten doen!

Zelf raad ik mijn klanten altijd aan om na ongeveer 3 á 4 jaar überhaupt de harde schijf preventief te vervangen. Dit geldt dan voor de klassieke schijven, niet de SSD's.

Waarom niet voor SSDs ?
Die hebben een beperkt aantal write cycli . SSDs zijn misschien een beetje te jong om een goed beeld van verouderingsstatistiek te hebben, maar die is beslist niet oneindig.
Hoe goed de inwendige monitoring van een SSD en vertaling naar SMART heb ik geen beeld van .
Maar normaal verwacht je dat bij nieuwe technologie daar ook een leerproces in zit. Of een fabrikant dan voorzichtig begint (beter te vroeg dan te laat fouten vlaggen) of juist andersom , wie zal het zeggen.

Met wear levelling moet de SSD controller de schrijfacties verspreiden over de schijf . Als dat goed werkt, betekent het ook dat bij de eerste merkbare fouten feitelijk de hele schijf vrijwel versleten is.
24-04-2015, 21:19 door Eric-Jan H te D
Door Anoniem:De "intermittent nature" van deze storing en de omstandigheden waarbij de storing voor het eerst aan het licht kwam, maakte het erg lastig om de boosdoener direct met 100% zekerheid aan te wijzen.

Dit is inherent aan dit soort fouten die (meestal) een mechanische oorsprong hebben. Daarnaast werkt het "reallocation" gebeuren ook nog eens maskerend.
25-04-2015, 17:49 door Anoniem
Door Eric-Jan H te A: Daarnaast werkt het "reallocation" gebeuren ook nog eens maskerend.
Volgens mij kun je met een S.M.A.R.T. uitleesprogramma de ontwikkeling van een toenemend aantal reallocated sectors zien. Daar is naar mijn weten niets maskerend aan. (zolang je je "bad sectors" niet door het O.S. laat uitzoeken...)

Volgens mij kunnen "seek"-problemen veroorzaakt worden door:
1. een mechanisch probleem
2. verzwakte magnetische velden van bitjes die moeten aangeven om welke sectornummer het gaat (die staan in de zgn. "preamble" voordat de eigenlijke sector begint. De preambles worden mogelijk bij de fabricage slechts één keer geschreven, en daarna nooit meer herschreven, zodat die magnetische informatie na jaren langzaam vervaagt).
3. slechte contacten, die o.a. kunnen leiden tot power fluctaties waardoor spindlemotorsturing en/of headactuatorsturing
in de war raakt.

punt 1 kan je zelf meestal niets meer aan verhelpen
punt 2 kan soms verholpen worden door een tool als Spinrite (moet ergens nog een oude versie hebben liggen, mar waar?)
punt 3 had ik nog enigszins op gecontroleerd. Verbazingwekkend hoe simpel het elektronicabordje bij dit type HDD contact maakt met spindlemotor (evt.sensors), actuator voor positionering van de koppen, en met de koppen zelf.
Er waren nl. op het bordje een aantal contacteilandjes aanwezig met een kloddertje soldeer. Na plaatsing van het bordje op de HDD-behuizing drukten die eilandjes precies op evenzoveel pinnetjes op de HDD behuizing.
Heb mijn twijfels over de betrouwbaarheid van dit systeem: de pinnetjes drukken kuiltjes in het soldeer. Na lange tijd zouden die kuiltjes door de constante druk en door uitzetten/krimpen vanwege temperatuurwerking kunnen uithollen zodat ze "ruim" gaan zitten en gaan oxyderen, hetgeen op langere termijn tot slechte contacten zou kunnen leiden?

Hoewel mijn oude HDD dus nog steeds niet volledig kapot was, vond ik hem inmiddels wel duidelijk te onbetrouwbaar.
Het was voldoende bewezen dat het niet (alleen maar) aan dat losse netwerkkabeltje lag, en ook niet aan iets anders dat ik direct zelf gemakkelijk kon oplossen. Vandaar overgestapt naar een andere HDD (die echter wel afgeleverd werd met één of enkele reallocated sector(s): in S.M.A.R.T. stond "reallocated sector count" in ieder geval meteen al op 1.
En dat terwijl "reallocated sector count" van mijn oude HDD met "seek"-problemen zelfs ook na zoveel jaren nog steeds op 0 stond...)

T.S.
25-04-2015, 20:23 door Eric-Jan H te D
Door Anoniem: [Daar is naar mijn weten niets maskerend aan. (zolang je je "bad sectors" niet door het O.S. laat uitzoeken...).

Dat was nou precies waar ik op doelde. En het eerste S.M.A.R.T. programma dat een ondubbelzinnige voor (semi) leken begrijpelijke uitvoer levert moet ik nog tegenkomen.
25-04-2015, 22:02 door Anoniem
Door Eric-Jan H te A: En het eerste S.M.A.R.T. programma dat een ondubbelzinnige voor (semi) leken begrijpelijke uitvoer levert moet ik nog tegenkomen.
Ik kan me voorstellen dat alle details niet direct allemaal even duidelijk zijn als je (nog) niet helemaal thuis bent in die materie. Maar als je er eventjes mee bezig bent, valt het wel mee.

En wat vind jij dan dubbelzinnig aan bijv. een programma als Crystal Disk Info?
Crystal Disk Info laat op grond van de huidige S.M.A.R.T.-waarden zelfs voor de "leekste" leek in vetgedrukte letters bovenaan heel duidelijk de globale gezondheidstoestand van de HDD (of SSD) zien: "Goed" of "Slecht".
Hoe ondubbelzinnig wil je het hebben?
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.