Il giorno 14/mar/2014, alle ore 17:41, Giovanni Orlandi <orlangio@gmail.com> ha scritto: Una cosuccia da poco :-) Dipende dalla tua definizione di "gestire". In linea di massima puoi suddividere i problemi in due categorie: - localizzati su una certa zona (fisica o logica) del disco - altri (elettronica, connessione, etc...) Mi piacerebbe sapere come hai motivato tale idea. Considera che: - se usi dischi SATA, un problema anche banale ad un disco rischia di tenertelo fermo a lungo mentre tenta di accedere ad un blocco, possono passare decine di secondi prima che la cosa termini. Ed ovviamente non devi più tentare quel blocco o sei daccapo - se usi dischi SATA, hai un alto rischio che un disco "andato" ti crei problemi a tutto il controller cui è collegato - se usi dischi SAS... a sto punto fai un raid hardware :) In parole povere: un raid sas hardware costa meno degli sforzi del programmatore di girare intorno alle pippe dei dischi SATA direttamente connessi, e comunque è più robusto nel far fronte a danni. Tutti i dischi o pseudotali (mettici anche gli SSD, flash usb, schedine di memoria, etc) moderni sono overprovisioned, cioè hanno più capacità di quanta te ne presentino - usano questo spazio in più per rimapparci i settori (fisici) danneggiati. Il che significa che quando l'host arriva ad accorgersi che ci sono settori (logici) inaccessibili quello spazio libero è finito ed il disco non può più rimappare nulla, il che a sua volta significa che hai già subito parecchi danni. Statistiche e l'esperienza insegnano che quando un disco ha parecchi settori danneggiati quel che resta li seguirà a breve. Puoi avere il conto di tali settori tramite SMART. Per gli IDE/SATA di solito è l'attributo #5, per i SAS o per dispositivi virtuali (tipo un disco logico presentato al sistema da un controller RAID) può variare. Questo esempio è preso dal disco SATA del pc da cui ti scrivo ed indica che ho 77 settori riallocati: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 77 il disco appare al sistema perfettamente sano senza settori (logici) danneggiati, ma ha 77 settori (fisici) che sono stati riallocati. Essendo un desktop di casa ad uso saltuario, fuori garanzia, e costantentemente backuppato... me ne frego e fin che regge, regge. Ma non lo userei mai su un sistema "di produzione". In parole povere: se cominci ad aver problemi ad un disco, non sperare di farci qualcosa ancora per molto, anche evitando le aree danneggiate. Vedi sopra. Quando vedi settori danneggiati, è troppo tardi.
Ho lavorato anni in "questo settore": sistemi con dischi IDE/SATA, sistemi con dischi SATA su controller raid hardware sas, sistemi puramente sas. Usati con raid software, raid hardware, drbd, e qualsiasi altra cosa ti venga in mente. La mia personale esperienza mi lascia pienamente convinto che per qualsiasi uso "serio" (nel mio caso significa usare o fornire a clienti server o più saltuariamente workstation professionali) la via più economica è un bel controller raid hardware sas con dischi sas, perché le rogne o il tempo perso sui sata nel lungo termine non valgono il risparmio nel breve termine. Certo dipende anche dal contesto: se tu mi parti da un pc assemblato, farci un raid hardware sas ha un costo (in percentuale) molto alto. Se parti da sistemi di classe server, con cpu Xeon, memorie ECC, backplane e chassis e slitte dischi hotswap, il tutto su hardware certificato dal vendor (perché altrimenti il supporto e la garanzia non rispondono)... la differenza (sempre in percentuale) tra un SATA vulgaris ed un raid hardware modesto è veramente minima. Senza conoscere gli altri dettagli e dando per scontato che non ci siano particolari requisiti (performance o altro), per fare un sistema che parta e lavori da solo anni con ragionevoli garanzie di rimanere in funzione, io prenderei un bel "bidone di dischi" sas e ci metterei una quantità esagerata di ridondanza - tipo un RAID6 più altri 4 o 5 dischi pronti come spare. Non dimenticarti la ridondanza in tutto ciò che è meccanico o di potenza... in altre parole alimentatori e ventole... perché sono la seconda classe di guasti più comuni dopo quelli agli harddisk. Poi però devi ridondare anche ciò che scrive su sti dischi, perché se ti va giù il pc per un DIMM guasto sei punto e a capo :D -- Luca Lesinigo
|
_______________________________________________ Talking mailing list Talking@ml.linuxvar.it http://ml.linuxvar.it/cgi-bin/mailman/listinfo/talking