Проверка жесткого диска, анализ и восстановление работоспособности

У меня на одном из серверов RAID-массивы стали работать очень не стабильно, виноватыми оказались два жестких диска с битыми секторами. Конечно сразу же были заказаны новые жесткие диски. А вот старые выкидывать не захотелось, решил их попытаться как-то реанимировать, для хранения не критичной информации где-то на локальном компьютере. Для этого понадобиться совершить такие действия как: проверка жесткого диска, анализ на битые сектора и ошибки, восстановление работоспособности hdd.

В записи будут перечислены полезные программы для работы с жесткими дисками и информация связанная с восстановлением работоспособности hdd с битыми секторами. Работоспособность жестких дисков я, кстати, восстановил.

Программы для проверки жесткого диска

Утилиты которые могут пригодится во время анализа состояния жестких дисков:

  • Victoria - одна из самых популярных программ для тестирования, сервисного обслуживания и помощи при восстановлении информации с жестких дисков. Есть версия под DOS и под Windows. Рекомендую использовать DOS-версию.
  • MHDD - по сути имеет почти же самые возможности что и victoria, даже интерфейс сильно похож. Запуск из под DOS
  • HDDScan - отображение подробной информации о жестком диске, S.M.A.R.T, тестирование поверхности. Windows
  • CrystalDiskMark - утилита для тестирования скорости чтения\записи данных различной длины. Windows
  • Scanner - анализ используемого пространства, просто и наглядно показывает какие папки и файлы съели ваше пространство. Windows
  • CrystalDiskInfo - программа для отображения и наблюдения за показателями S.M.A.R.T жесткого диска. Windows
  • HD Tune - в бесплатной версии: тестирование скорости чтения (размер блоков можно указывать), отображение S.M.A.R.T. и некоторой информации, тестирование поверхности. Windows
  • Recuva - бесплатная, простенькая не профессиональная программа, которая может поможет восстановить случайно удаленные данные с различных накопителей, будь то флешка или жесткий диск. Windows
  • www.r-studio.com - платная утилита для восстановления удаленной информации. Знакомому помогла после того как он перепробывал все остальные.
  • AS SSD Benchmark - похожа на Crystal Disk Mark, вычисляет скорость чтения и записи SSD в различных условиях: в последовательном режиме, случайном (4K), выдает итоговый результат по собственной шкале. Также измеряет время доступа чтения и записи.
  • Tweak-SSD - это целый набор различных инструментов для оптимизации твердотельного накопителя. При запуске программа определит статус оптимизации и предложит варианты по улучшению. Предусмотрена встроенная оптимизация TRIM. Среди полезных инструментов – отключение хранения системных файлов в памяти, использование меньшего системного кэша и другие. В общем, можно неплохо «прокачать» свой SSD и вдохнуть в него новую жизнь.

Некоторые определения

Сектор диска — минимальная адресуемая единица хранения информации на дисковых запоминающих устройствах

Бэд-блок, Bad Block, Бэд-блок, поврежденный сектор - сбойный, не читаемый сектор, на попытку обращения к которым накопитель возвращает ошибку (чаще всего UNC - некорректируемая ошибка чтения)

Remap - замена адреса не читаемого сектора одним из резервных секторов, которые как раз и созданы для таких случаев.

LBA (англ. Logical block addressing) — механизм адресации и доступа к блоку данных на жёстком или оптическом диске. Каждый блок, адресуемый на жёстком диске имеет свой номер, целое число, начиная с нуля. То есть LBA это номер сектора. Часто в программах в различных задачах можно указывать LBA - начиная с какого сектора делать сканирование, стирание, обрезание жесткого диска.

HPA  (Host Protected Area) - защищенная область жесткого диска в которой может хранится служебная критически важная информация, программы и операционная система не могут к ней обратиться (получить доступ), таким образом защищенная область жесткого диска защищается от каких-либо повреждений или изменений. В программах восстановления жестких дисков часто используется для "отрезания" произвольной части объема диска в его конце, то есть увеличивается HPA-область, которая не дает ОС обращаться к поврежденным секторам. Обрезание происходит всегда с конца, с помощью HPA нельзя вырезать произвольную область в середине, и нельзя сдвинуть начало диска.

S.M.A.R.T. (self-monitoring, analysis and reporting technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики.

S.M.A.R.T

Жесткий диск постоянно отслеживает определенные параметры своего состояния и записывает их  в характеристиках - атрибутах, которые быть считанны специальным ПО. Атрибуты идентифицируются своим цифровым номером, большинство из которых одинаково интерпретируется накопителями разных моделей. Некоторые атрибуты могут быть определены конкретным производителем оборудования, и поддерживаться только отдельными моделями накопителей. Атрибуты состоят из нескольких полей. Обычно, программы считывания S.M.A.R.T. выдают расшифровку атрибутов в виде:

  • Attribute - имя атрибута
  • ID - идентификатор атрибута
  • Value (Current) - текущее значение атрибута, для большинства атрибутов – это оставшийся ресурс в процентах.
  • Threshold - минимальное пороговое значения атрибута
  • Worst - самое низкое значение атрибута за все время работы накопителя
  • Raw - абсолютное значение атрибута. Если есть возможность выставляйте в ПО десятичное отображение
  • Type (необязательно) - тип атрибута - характеризует производительность (PR - Performance-related), характеризует сбои (ER - Error rate), счетчик событий (EC - Events count), определено производителем или не используется (SP - Self-preserve);

Value - условное число (обычно от 0 до 100 или до 253), заданное производителем. Значение Value изначально установлено на максимум и уменьшается в случае ухудшения его параметров. Для определенных атрибутов существует пороговое значение, до достижения которого, производитель гарантирует его работоспособность - поле Threshold. Если значение Value приближается или становится меньше значения Threshold, - накопитель пора менять. Перечень атрибутов и их значения не стандартизированы и определяются изготовителем накопителя, но наиболее важные из них интерпретируются одинаково. Например, атрибут с идентификатором 5 (Reallocated sector count) будет характеризовать число забракованных и переназначенных из резервной области секторов диска.

Полезная ссылка: Оцениваем состояние жёстких дисков при помощи S.M.A.R.T.

Возможные причины возникновения ошибок

При тестировании стоит помнить возможные причины возникновения ошибок в работе файловой системы или жесткого диска:

  • Плохие кабеля - заменить кабеля
  • Плохое питание:
    • Вздутые конденсаторы на материнской плате: протестировать на другом компьютере
    • Вздутые конденсаторы на блоке питания: заменить блок питания
    • Перебои подачи энергии в электросети: запитать компьютер через исправный источник бесперебойного питания
  • Если тестирование проходит из под Windows - загруженность самой ОС: загрузится с диска или флешки и запустить DOS-версию victoria или mhdd
  • Перегрев жесткого диска - контролировать температуру через S.M.A.R.T, поставить дополнительное охлаждение, например на время проверки направить дополнительный кулер на жесткий диск
  • Ненадёжный контакт в соединительных разъёмах HDD: аккуратный съем платы винчестера и чистка контактов  (спиртом, ластиком)

Чистка контактов платы жесткого диска

Если результаты тестирования слишком противоречивы, то учитывайте вышеописанный возможные причины.

Bad Blocks

Поврежденные сектора могут быть:

  • Логическими (софт-бэды, soft bad): когда нарушена контрольная сумма сектора.
  • Физические: повреждения поверхности или механизмов (головок и т.д.).

Как исправить Bad'ы на жестком диске? Для начала нужно попробовать затереть ("занулить") все сектора при помощи таких программ как victoria или mhdd - функция erase. В результате, если это были логические бэд-сектора, то контрольная сумма плохих блоков винчестера будет восстановлена при перезаписи сектора целиком. Так же это может помочь в случае исправления незначительного количества дефектов жесткого диска, поскольку в случае физической перезаписи секторов микропрограмма HDD автоматически заместит найденные дефекты или исключит их из трансляции, поместив в пользовательскую таблицу дефектов, то есть сделает remap.

Если же стирание не помогло, то можно попробовать остальные режимы remap'инга в программе victoria. Но это вряд ли даст какие-либо результаты, так как при неудачных попытках записи remap должен происходить автоматически. Стоит знать что на некоторых линейках жестких дисков (например seagate) определенные режимы remap работают не корректно.

Если мы имеем не излечимые bad сектора, то можно пойти двумя путями, в зависимости от того, где эти сектора находятся:

  • Если плохие сектора находятся в конце диска, то обрезать этот конец диска. В этом могут помочь программы victoria или mhdd. Сканируем ими поверхность диска, если битые сектора появились не вначале, а под конец сканирования, то запоминаем номер сектора и используем в этой же программе обрезания размера жесткого диска (hpa): обрезаем диск до первого сбойного сектора. Я обрезаю с запасом.
  • Если плохие сектора находятся в середине или начале диска, то оставить эту часть диска не размеченной. То есть разбить жесткий диск на логические тома так, чтобы используемые логические диски не находились в области где есть bad-секторы.

Victoria - проверка жесткого диска, анализ и восстановление работоспособности

Проверка жесткого диска при помощи Victoria

Одна из самых популярных программ для тестирования, сервисного обслуживания и помощи при восстановлении информации с жестких дисков. Есть версия под dos и под windows. Предпочтительней использовать версию под dos с загрузочных флешек или дисков - в результатах сканирования будет меньше погрешностей. Версия под Windows может пригодится, когда нужно сохранить в лог файл список битых секторов. Основные возможности victoria:

  • Вывод технической информации о накопителе;
  • Управление уровнем акустического шума;
  • Просмотр S.M.A.R.T.
  • Работа с Host Protected Area: изменение и восстановление физического объема диска;
  • 5 режимов тестирования поверхности: верификацией, чтением и записью, с подсчетом и отображением адресов дефектных блоков;
  • 2 режима построения графика поверхности: полный и оценочный (аналогично тому, как сделано в программе HD Tach);
  • Дефектоскоп: анализ состояния поверхности 3-мя видами тестов, с подсчетом и отображением нестабильных участков, с указанием точных адресов каждого нестабильного сектора и автоматическим занесением их в текстовый файл;
  • Тестирование буферной памяти и интерфейса на наличие "глюков" и искажения информации при приеме и передаче;
  • Измерение частоты вращения вала HDD, в том числе на новых дисках без поля INDEX;
  • Remap 3-мя способами
  • Измерение производительности жесткого диска (бенчмарк функции):
  • Измерение скорости линейного, нелинейного и случайного чтения с HDD;
  • Измерение скорости позиционирования головок HDD и времени доступа к секторам;
  • Измерение скорости чтения графическими методами;
  • Очистка диска (или его части) от информации
  • Управление опциями безопасности: установка пароля на HDD, снятие пароля, быстрое стирание информации без возможности её восстановления и т.п.
  • Возможность остановки и запуска шпиндельного двигателя HDD;
  • Тест позиционирования головок HDD (аналогично тому, как это делает ОС при интенсивной работе), с целью выявления надежности и термоустойчивости дисковой подсистемы ПК (приводит к разогреву HDD);
  • Посекторное копирование произвольной области HDD в файл, с пропуском дефектных участков (может быть полезно для спасения информации с поврежденного диска);
  • Посекторное копирование файлов на HDD;
  • Просмотр информации о логических разделах HDD с указанием границ разделов (без определения HDD в BIOS);

Проверка жесткого диска на битые сектора в Victoria (в dos-версии):

  • Жмем P и указываем контроллер (например SATA или IDE)
  • Из списка жестких дисков которые подключены к указанному контролеру вводим номер необходимого
  • Жмем F4 и выбираем параметры проверки
  • Жмем Enter

Если необходимо сохранить в лог-файл нестабильные области, то запускаем дефектоскоп, после проверки жмем X для выхода в Volcov Commander и копируем log-файл на флешку.

Расшифровка кодов ошибок в Victoria:

  • BBK (Bad Block Detected) — Найден бэд-блок. Устарело;
  • UNCR (Uncorrectable Error) — Не удалось скорректировать данные избыточным кодом, блок признан нечитаемым. Может быть как следствием нарушения контрольной суммы данных (софтовый Bad Block), так и следствием физического повреждения HDD;
  • IDNF (ID Not Found) — Не идентифицирован сектор. Обычно говорит о разрушении микрокода или формата нижнего уровня HDD. У исправных винчестеров такая ошибка выдается при попытке обратиться к несуществующему адресу;
  • ABRT (Aborted Command) — hdd отверг команду в результате неисправности, или команда не поддерживается данным HDD (пароль, устаревшая или слишком новая модель и т.д.).
  • T0NF (Track 0 Not Found) — невозможно найти нулевую дорожку, невозможно выполнить рекалибровку на стартовый цилиндр рабочей области. На современных HDD говорит о неисправности микрокода или магнитных головок;
  • AMNF (Address Mark Not Found) — адресная метка не найдена, невозможно прочитать сектор, обычно в результате серьезной аппаратной проблемы (например, на HDD Toshiba, Maxtor — говорит о неисправности магнитных головок);

Для обрезания через изменение размера HPA

Изменение размера HPA, чтобы задать новый объем диска, вызывается клавишей F6 или консольной командой "HPA". После ввода команды появляется приглашение к вводу количества секторов (LBA). Какое количество секторов указывать? Указывайте немного меньшее количество секторов, чем номер сектора с которого начинаются bad block'и.

Также есть команды:

  • RHPA - показать реальный размер диска в LBA. Команда чисто информативная.
  • NHPA - восстановить заводской объем диска. После ввода, на экране отображаются текущий и заводской объемы, и от пользователя требуется подтверждение действия.

Результат:

На обеих жестких дисках я "избавился" от битых секторов.

На одном помогло обнуление диска через программу mhdd и команду erase (в программе victoria это делается значительно дольше, думаю это от того, что mhdd обращается за раз сразу блоками по 256 секторов) - то есть там были логические бед-сектора. Правда в начале жесткого диска есть "медленные сектора" с временем доступа более 500 мс. Эту область лучше оставить не размеченной.

На втором винчестере битые сектора были как в начале диска, так и в конце. Обнуление излечило от битых секторов в начале диска. Интересно что remap, который я делал в первую очередь, их не излечил. А вот от битых секторов в конце диска удалось избавится только урезанием при помощи HPA. Отрезал 10% от жесткого диска объемом 750 ГБ.

Стоит понимать что эти жесткие диски уже не годятся для хранения важной информации или работы в RAID-массивах. А вот для хранения контента, который без труда можно скачать из Интернета - можно.

Полезное:

Записывать через утилиту WinSetupFromUSB с такими параметрами:

WinSetupFromUSB

Немного о SDD дисках на NAND флеш памяти:

  • Здоровье SSD. Современные SSD гарантируют всего 1000-3000 циклов перезаписи ячейки. То есть если у вас SSD винчестер с памятью SLC на 500 гб, то его "здоровье" подсчитывается например так: 500 гб * 2000 циклов перезаписи = 1000 тб минус количество уже записанных данных на винчестер, и считаем сколько еще данных в процентном выражении от начального можно записать. То есть формула: (Емкость гб*Количество гарантированных циклов перезаписи - Обьем записанных данных гб)/(Емкость гб*Количество гарантированных циклов перезаписи/100) = Процент оставшегося износа
  • Чтобы SATA SSD нормально функционировал, нужно в BIOS переключить в интерфейс SATA из IDE в AHCI. Это позволит активировать TRIM и очередь команд NCO.
  • SLC (хранит 1 бит в ячейке)
    • Производительность: хорошая
    • Выносливость: хорошая
    • Сложность коррекции ошибок: легко
    • Стоимость: дорого
  • MLC (хранит 2 бита в ячейке)
    • Производительность: средняя
    • Выносливость: средняя
    • Сложность коррекции ошибок: средне
    • Стоимость: средне
  • TLC (хранит 3 бита в ячейке)
    • Производительность: плохая
    • Выносливость: слабая
    • Сложность коррекции ошибок: тяжело
    • Стоимость: дешево

Полезная информация:

 

Понравилось? =) Поделись с друзьями:

Обсуждение записи “Проверка жесткого диска, анализ и восстановление работоспособности”

  1. Олег says:

    добрый день!
    вы не описали процесс отрезания 10% именно это меня интересует как при помощи виктории это сделать правильно

  2. Владимир Демянович (elims.org.ua) says:

    Олег, добрый день, добавил в запись информацию: сканируете жесткий диск, запоминаете с какого сектора начинаются битые сектора и вызываете через F6 изменение размера HPA, указываете немного меньшее количество секторов чем номер сектора с которого начались ошибки, чтобы доступная область винчестера вплотную не касалась поврежденной.

  3. Павел says:

    Здравствуйте, интересует момент касательно битых секторов в середине диска. Вот у вас пишется: «Если плохие сектора находятся в середине или начале диска, то оставить эту часть диска не размеченной. То есть разбить жесткий диск на логические тома так, чтобы используемые логические диски не находились в области где есть bad-секторы.»
    Вы не могли бы объяснить подробнее как это сделать, как сделать не размеченную область диска, что это такое?
    Можно здесь описать, и если можно на почту отправьте пожалуйста. Заранее благодарен!

Обсудить