Автор: Роман Хмелевский. Рубрики: Центр обработки данных. Опубликовано: Сентябрь 25th, 2009

Продолжим внимательное чтение отчета специалистов Google — Failure Trends in a Large Disk Drive Population (pdf 242 KB) опубликованный на конференции FAST07, и содержащий статистический анализ отказов "популяции" 100000 дисков consumer-серий примерно за пять лет срока их службы.

Это четвертая, заключительная статья, предыдущие:
Насколько можно доверять величине MTBF?
...

Автор: Роман Хмелевский. Рубрики: Центр обработки данных. Опубликовано: Сентябрь 21st, 2009

Являющиеся частью стандарта ATA, средства мониторинга и предсказания ошибок, носящие название S.M.A.R.T — Self-Monitoring, Analysis and Reporting Tool присутствуют в контроллерах всех дисков ATA (как PATA, так и SATA) с 90-х годов. По мысли разработчиков этих средств, они должны предотвратить неожиданные выходы из строя, так как SMART оценивает ряд критичных параметров диска, и пытается предсказать вероятность таких сбоев, а также ожидаемое время до сбоя.

Группа исследователей Google на протяжении 9 месяцев анализировала данные S.M.A.R.T. в 100 ...

Автор: Роман Хмелевский. Рубрики: Центр обработки данных. Опубликовано: Сентябрь 17th, 2009

Сегодня мы продолжаем разбирать результаты опубликованной специалистами Google научной работы, в которой анализируются причины отказов 100.000 жестких дисков в датацентрах Google на протяжении пяти лет.

Мы считаем само собой разумеющимся тот факт, что бо’льшая нагрузка на диски вызывает их более ранний выход из строя. Так ли это? Данные Google показывают, что это не так. Более того, результаты сами по себе неожиданны.

hdd-failures-load-rate...

Автор: Роман Хмелевский. Рубрики: Центр обработки данных. Опубликовано: Сентябрь 14th, 2009

Еще в 2007 году, на одной из конференций исследовательской группы USENIX (USENIX File and Storage Technologies, 2007 — FAST07) группа инженеров Google опубликовала результаты исследования показателей надежности дисков SATA и PATA. На сегодняшний день это самое крупное такое исследование по количеству наблюдавшихся «в естественной среде» жестких дисков. Результаты там, подчас, предстают самые неожиданные.

Инженеры Google собрали статистику по отказам для примерно 100 тысяч дисков в своих датацентрах. Особо интересно то, что Google использует у себя в серверах ...