Аппаратные решения для повышения отказоустойчивости серверов
Серверное оборудование не только намного мощнее обычных персональных компьютеров, но и гораздо стабильнее. Хотя в принципе оно состоит из тех же основных компонентов – материнская плата, процессор, оперативная память и локальный накопитель. В этом материале мы решили разобрать, чем обусловлена высокая отказоустойчивость серверов.
Самое главное заключается в использовании при сборке серверов качественных комплектующих. В первую очередь, рассмотрим аппаратные решения, обеспечивающие стабильность и сводящие риск сбоев к минимуму. При этом, мы будем говорить о двух стандартных для всего серверного оборудования технологиях, а не о специальных решениях, применяющихся отдельными производителями.
Коррекция ошибок ECC
Технология ECC (Error-Correcting Сode) заключается в том, что попадающая из расположенных на локальных накопителях баз данных в оперативную память информация проверяется на наличие ошибок. Дело в том, что передача данных с ошибками на обработку процессором может приводить к серьезным проблемам.
Самым пессимистичным исходом при таком сценарии станет повреждение изначальных файлов в базе. Конечно, всегда можно попробовать восстановить поврежденные данные, но успех операции нельзя гарантировать на 100%, поэтому лучше предотвращать возникновение подобных ситуаций, для чего и предназначен встроенный в оперативную память модуль ECC.
Принцип этой технологии заключается в проверке контрольных сумм каждых 8-ми бит поступающей в оперативную память информации. ECC сравнивает сумму полученных нулей и единиц (если говорить простым языком) с их суммой в изначальном файле. Если сумма не сходится, модуль отделяет поврежденную информацию от остальной и направляет обратный запрос в базу данных на локальном накопителе, чтобы повторно получить те же данные. В ходе анализа ECC определяет правильную комбинацию нулей и единиц, после чего уже отправляет информацию на обработку процессором.
Выше описан базовый принцип действия модуля, но на сегодняшний день технологии ECC значительно усложнились, так как ведущие производители процессоров и ОЗУ постоянно совершенствовали данный модуль, перенимая и дорабатывая решения друг друга.
Также существуют процессоры, способные запоминать последовательности битов в файлах, с обработкой которой они уже сталкивались. Но это не значит, что Error-Correcting Сode больше не нужен – такие процессоры являются лишь дополнением к этому аппаратному решению для повышения отказоустойчивости серверов.
RAID-массивы
RAID-массив – это виртуальный накопитель, состоящий из нескольких HDD или SSD, дополняющих друг друга. База данных или любая другая информация разделяются на части и упорядоченно разделяется между физическими носителями, выполняющими, по факту, роль секторов обычных жестких дисков. При этом часть информации с каждого носителя дублируется на несколько других.
Таким образом в случае механической поломки одного из накопителя ни один бит информации не будет утерян. При этом весь остальной массив будет продолжать работу, а после замены вышедшего из строя устройства все данные будут восстановлены на него автоматически.
Компания Восточный Путь предлагает купить сервер от одного ведущих производителей с повышенным уровнем отказоустойчивости. В зависимости от выбранной модели вы получите оборудование, защищенное не только описанными выше технологиями, но и специально разработанными производителями решениями.