Диагностика на твърд диск и SSD. Тълкуване на SMART статус
Омръзна ми да попадам на компютри с дефектни твърди дискове, а някой умник да се е опитвал да преинсталира операционна система, за да реши хардуерен проблем. До гуша ми дойде от некадърници, които не се образоват, но със смелостта си и липсата на знания „конкурират“ можещите и коректни! Коректни е неслучайно написано, защото има и такива, които са може би наясно, че на съвременен твърд диск стигнеш ли до там, че да маркираш лошите сектори, значи е с единият крак в гроба, мамят клиентите си!
В случай, че периодично виждате сини екрани в Windows, операционната система се рестартира или не стартира е напълно възможно да е дефектирал твърдия диск. Много често се случва некомпетентни лица да преинсталират системен софтуер, заради проблеми в диска. Понякога това е временно решение, заради форматирането на файловата система, понякога положението е толкова лошо, че Windows-a “отказва да се инсталира“.
За наша радост в средата на 90-те години на миналия век производителите на твърди дискове създават единен стандарт за мониторинг и тестване S.M.A.R.T. Благодарение на него, с помощта на софтуер можем да проверяваме състоянието на „хардовете“ и още по-важно, да предотвратим загубата на информация. Разбира се, най-добре е да ползваме софтуера на самият вендор, но това не винаги е възможно, защото обикновено машината трябва да се стартира в DOS, а не винаги е възможно или желателно, когато става въпрос за сървър, рутер или натоварена работна станция. Затова има доста програми, които работят със стандартните S.M.A.R.T команди:
- Windows: HDD Tune, Everest, AIDA64, Argus Monitor, SpinRite, CrystalDiskInfo (безплатна), Speccy (безплатна), SpeedFan (безплатна)
- Mac: Disk Utility, smartmontools
- Linux: smartmontools
Основната информация, която предоставя SMART технологията е SMART статуса. Разчитането му е критично важно, тъй като според статистиката предсказва смъртта на устройството с над 50% точност. Статусът предоставя две стойности – “threshold not exceeded” и “threshold exceeded”. В случай, че прагът е превишен, означава, че твърдият диск не отговаря на спецификациите си – не може да чете/записва дадени сектори или бързодействието му е под обявеното. Важно е да се знае, че SMART статуса не гарантира отказоустойчивостта на устройството. Възможно е поради технически проблеми да не показва правилно надежността на харда. Също така, това, че даден сектор е недостъпен не значи, че целият диск е неизползваем. Следствие е на това, че в съвременните твърди дискове капацитетът е по-голям от обявеният и тези сектори, които са скрити за потребителите, се използват за замяна на лоши.
В някои устройства, поддържащи SMART са налични вградени тестове и журнали. Тестовете се изпълняват автоматично, когато дискът не е натоварен или със специализиран софтуер. Резултатите от тези тестове се записват в журнали.
За да се анализира правилно състоянието на устройството е нужно да се оценят всички SMART атрибути. Тях ще разгледам малко по-долу.
Как работи SMART?
S.M.A.R.T. Следи за основните характеристики на диска, всяка от които получава оценка. Могат да се разделят на две основни групи:
- параметри, отразяващи естествения процес на „стареене“ на диска – брой цикли включване-изключване, обороти на плочите, премествания на главата и т.н.
- текущи параметри – разстояние на главата от повърхността на диска, брой заменени сектори, грешки при търсене, време за търсене на пътечки и др.
Данните се съхраняват в шестнадесетичен вид (т.нар. raw value), а след това се преизчисляват във value – значението, символизиращо надежността на устройството, спрямо еталонните стойности. Тези стойности са в диапазона от 0 до 100, от 0 до 200 или от 0 до 253, в зависимост от атрибута, който отразяват. Високата стойност говори за отсъствие на изменение в дадения параметър (не е влошен). Понижаване на стойността – във възможност за влошаване на състоянието. Естествено, когато когато даден параметър падне под минималните спецификации на производителя – сигнализира за големи проблеми! В такъв случай, никой не може да гарантира безотказна работа на дисковото устройство.
S.M.A.R.T. Позволява:
- наблюдение на състоянието върху параметрите на устройството.
- Сканиране на повърхността на диска (за лоши сектори).
- Сканиране на повърхността и автоматична замяна на лошите сектори с по-надеждни.
Дисковете не могат сами да съобщават за състоянието си! За това е нужно програмно обезпечение в контролера. Много съвременни дънни платки съобщават за проблеми в SMART при стартиране на компютърната система, но не всички.
Софтуерите, които отразяват състоянието на S.M.A.R.T. атрибутите, работят по следният алгоритъм:
- Проверка за поддръжка на SMART.
- Изпраща се запитване за четене на SMART таблицата с атрибути.
- Когато ги получи се съхраняват във временен буфер.
- Разшифрова структурата на таблицата. Извлича номера на атрибута и цифровото му отражение.
- Преименува атрибутите по стандарт от номер към название, в зависимост от производител и модел.
- Визуализира числовите значения в удобни за възприемане вид. Изразява се в конвертиране на шестнадесетичните стойности в десетични.
- Извлича флаговете на атрибутите от таблицата, например дали са важни за работоспособността или са някакви броячи.
- Визуализира общото състояние на устройството.
В следната таблица са описани атрибутите на S.M.A.R.T, тълкуването им и някои съвети:
*Оцветените атрибути са критично важни!
Статията е процес на допълване и редакция.
Публикувано на | December 2, 2013 | 3 Коментара