Difettoso harddisk o il controller (alias scheda madre)

Usate questo forum per richieste di aiuto e consigli sull'hardware montato nelle vostre macchine con GNU/Linux Slackware.

Difettoso harddisk o il controller (alias scheda madre)

Messaggio da ZeroUno »

Ho un pc datato.

Era di amici a cui ho dovuto reinstallare/riparare windows un mare di volte (oltre a pulirlo un migliaio di volte da un migliaio di virus ma questa è un'altra storia).

Tutte le volte che non gli partiva windows (e la maggior parte delle volte era che non caricava i file di sistema per filesystem corrotto, ogni volta riparato con un chkdsk in 3 secondi), pensavano che avessero puntualmente fatto cavolate (spento brutalmente il pc, lamentavano crash ecc).

Ora il computer l'hanno cambiato e il loro l'ho preso io.

Ovviamente immediatamente piallato e installato slackware.
Però devo dire che i problemi di instabilità o lentezza li ho riscontrati anche con linux.

Ma solo questi giorni mi sono accorto finalmente di quale sia il problema.
Me ne sono accorto perchè una volta non si è impallato del tutto (come di solito) ma il filesystem è andato in readonly, cosa che avviene quando il sistema non riesce a leggere il disco per qualche motivo, ed infatti qualsiasi accesso a file non cachati falliva con i/o error.
Ho riavviato il pc e il bios non lo vedeva più.
L'ho spento e il giorno appresso lo vedeva. Tuttavia oggi si è impallato X solamente, così sono riuscito a dare ctrl+alt+f1 ed ho trovato i messaggi di problema di accesso al journaling. Altro palese problema che si verifica quando il sistema non legge correttamente il disco.

A questo punto ho lanciato un controllo dei settori danneggiati e non ha trovato nulla, quindi il disco è buono, però visto che in almeno un caso è proprio il bios che non lo vedeva, a questo punto il problema è l'elettronica del disco o il controller della scheda madre?

Secondo voi che prove posso fare?

L'harddisk è un sata da 320G; il pc l'ho upgradato almeno un paio di volte e quindi ha un giga di ram.

Ho un altro pc "coetaneo". Vediamo se di due riesco a farne uno.
Quest'altro il proprietario me l'ha dato perchè ha la cpu bruciata; la probabilità che le due schede madri siano compatibili sono basse.
L'harddisk questo non ce l'ha perchè l'ho reso al proprietario per prendere i dati.
Re: Difettoso harddisk o il controller (alias scheda madre)

Messaggio da ponce »

Io farei una verifica con lo SMART.

Re: Difettoso harddisk o il controller (alias scheda madre)

Messaggio da ZeroUno »

non lo conoscevo.

Da un test effettuato ora sembrano non esserci problemi
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Conveyance offline Completed without error 00% 3271 -
# 2 Short offline Completed without error 00% 3271 -
Ma sul pregresso penso di si

Codice: Seleziona tutto

# smartctl -a /dev/sda                                                                                                                     
smartctl 6.3 2014-07-26 r3976 [i686-linux-4.1.6-smp] (local build)                                                                                           
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org                                                                                  
=== START OF INFORMATION SECTION ===                                                                                                                         
Model Family:     Seagate Maxtor DiamondMax 21                                                                                                               
Device Model:     MAXTOR STM3250310AS                                                                                                                        
Serial Number:    6RY66P3Z                                                                                                                                   
Firmware Version: 3.AAC                                                                                                                                      
User Capacity:    250,059,350,016 bytes [250 GB]                                                                                                             
Sector Size:      512 bytes logical/physical                                                                                                                 
Device is:        In smartctl database [for details use: -P show]                                                                                            
ATA Version is:   ATA/ATAPI-7 (minor revision not indicated)
Local Time is:    Sun Aug 30 22:46:31 2015 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (  430) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        (  92) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
  1 Raw_Read_Error_Rate     0x000f   106   088   006    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0003   098   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       884
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   078   060   030    Pre-fail  Always       -       77985635
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       3271
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       875
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   096   096   000    Old_age   Always       -       4
190 Airflow_Temperature_Cel 0x0022   059   050   045    Old_age   Always       -       41 (Min/Max 40/41)
194 Temperature_Celsius     0x0022   041   050   000    Old_age   Always       -       41 (0 11 0 0 0)
195 Hardware_ECC_Recovered  0x001a   069   054   000    Old_age   Always       -       16366319
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   001   000    Old_age   Always       -       117150
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 Data_Address_Mark_Errs  0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 23 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 23 occurred at disk power-on lifetime: 2931 hours (122 days + 3 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 01 af 0a 0a e0  Error: ICRC, ABRT 1 sectors at LBA = 0x000a0aaf = 658095

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 03 08 89 94 fa e0 00      00:22:50.264  READ DMA EXT
  c6 03 10 01 a5 a5 a0 00      00:22:50.053  SET MULTIPLE MODE
  91 03 3f 01 a5 a5 af 00      00:22:50.016  INITIALIZE DEVICE PARAMETERS [OBS-6]
  f5 03 46 01 a5 a5 a0 00      00:22:50.002  SECURITY FREEZE LOCK
  ef 03 46 01 a5 a5 a0 00      00:22:50.002  SET FEATURES [Set transfer mode]

Error 22 occurred at disk power-on lifetime: 2578 hours (107 days + 10 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 01 91 4c a0 e0  Error: ICRC, ABRT 1 sectors at LBA = 0x00a04c91 = 10505361

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 03 08 cf 23 99 e0 00      00:51:01.024  READ DMA EXT
  c6 03 10 01 a5 a5 a0 00      00:51:01.024  SET MULTIPLE MODE
  91 03 3f 01 a5 a5 af 00      00:51:01.024  INITIALIZE DEVICE PARAMETERS [OBS-6]
  f5 03 46 01 a5 a5 a0 00      00:51:01.256  SECURITY FREEZE LOCK
  ef 03 46 01 a5 a5 a0 00      00:51:01.256  SET FEATURES [Set transfer mode]

Error 21 occurred at disk power-on lifetime: 1458 hours (60 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 01 26 1b 5e e0  Error: ICRC, ABRT 1 sectors at LBA = 0x005e1b26 = 6167334

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 03 08 bf 67 ea e0 00      04:15:48.405  READ DMA EXT
  c6 03 10 01 a5 a5 a0 00      04:15:48.405  SET MULTIPLE MODE
  91 03 3f 01 a5 a5 af 00      04:15:48.658  INITIALIZE DEVICE PARAMETERS [OBS-6]
  f5 03 46 01 a5 a5 a0 00      04:15:48.658  SECURITY FREEZE LOCK
  ef 03 46 01 a5 a5 a0 00      04:15:48.658  SET FEATURES [Set transfer mode]

Error 20 occurred at disk power-on lifetime: 1457 hours (60 days + 17 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 71 d6 99 03 e0  Error: ICRC, ABRT 113 sectors at LBA = 0x000399d6 = 235990

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 03 40 17 f2 41 e0 00      03:38:03.557  READ DMA EXT
  25 03 30 09 e2 3e e0 00      03:38:03.555  READ DMA EXT
  25 03 40 1f f0 41 e0 00      03:38:03.555  READ DMA EXT
  25 03 40 c9 e1 3e e0 00      03:38:03.548  READ DMA EXT
  25 03 08 f7 f3 41 e0 00      03:38:03.548  READ DMA EXT

Error 19 occurred at disk power-on lifetime: 1117 hours (46 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 00 00 00 00 e0  Error: ABRT at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  29 d8 60 b7 03 61 e0 00      00:01:25.089  READ MULTIPLE EXT
  29 d8 00 b7 02 61 e0 00      00:01:27.934  READ MULTIPLE EXT
  29 d8 60 b7 03 61 e0 00      00:01:27.376  READ MULTIPLE EXT
  29 d8 00 b7 02 61 e0 00      00:01:26.362  READ MULTIPLE EXT
  29 d8 f8 47 00 61 e0 00      00:01:25.447  READ MULTIPLE EXT

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Conveyance offline  Completed without error       00%      3271         -
# 2  Short offline       Completed without error       00%      3271         -

SMART Selective self-test log data structure revision number 1
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
magari domani faccio il test esteso. ma credo che devo fare anche il test di tutto il resto dell'hardware (memtest ecc ecc... mentre scrivevo questo post si è bloccato due volte ed ho dovuto forzare i reboot, e il pc era spento da qualche ora)
