Выделенные серверы - важный компонент любого предприятия. Непрерывность бизнеса зависит от постоянной работы серверов, и каждая ошибка приводит к дорогостоящему простою. Вот почему обслуживание серверов так важно.
Поддержание работоспособности сервера включает в себя не только загрузку последних патчей и обновлений. Используйте наш контрольный список работ по обслуживанию сервера, чтобы обеспечить его бесперебойную работу и избежать простоев.
Проверка данных сервера
Двойная проверка и верификация резервных копий
Если вам когда-либо приходилось восстанавливаться после катастрофического отказа диска, вы знаете, насколько важны данные для бесперебойной работы бизнеса.
При хорошей стратегии резервного копирования лучше иметь их и не нуждаться в них, чем нуждаться в них и не иметь их. Выделите несколько минут каждую неделю (или каждый день) для проверки резервных копий сервера. В качестве альтернативы создайте зеркальное отражение серверной среды на виртуальной машине в облаке и регулярно проверяйте ее.
Проверьте RAID-массив
Многие выделенные серверы работают с массивом RAID (Redundant Array of Independent Disks). В RAID-массиве несколько жестких дисков действуют как одно устройство хранения данных в случае отказа одного диска.
Некоторые типы RAID-массивов предназначены для повышения производительности, другие - для обеспечения избыточности. В большинстве случаев современные RAID-массивы имеют расширенные средства мониторинга. Быстрый взгляд на утилиту мониторинга RAID может предупредить вас о потенциальных отказах дисков. Это позволит вам спланировать замену и восстановление дисков таким образом, чтобы минимизировать время простоя.
Проверяйте использование хранилища
Периодически проверяйте использование жестких дисков на ваших серверах. Серверы генерируют много файлов журналов, старых электронных писем и устаревших пакетов программного обеспечения.
Если важно сохранить старые файлы журналов, рассмотрите возможность их архивирования на внешнем накопителе. Старые электронные письма также можно архивировать или удалять. Некоторые программы обновления приложений не удаляют старые файлы. К счастью, некоторые менеджеры пакетов имеют встроенные протоколы очистки, которые вы можете использовать. Вы также можете найти сторонние утилиты для управления старыми файлами программного обеспечения.
Жесткие диски используются не только для хранения данных. Они также используют файл подкачки, который действует как физическая память. Если загрузка диска превышает 90%, это может помешать работе файла подкачки, что может серьезно снизить производительность.
Проверка программного обеспечения и серверной системы
Проверка использования ресурсов сервера
В дополнение к проверке дискового пространства целесообразно также следить за использованием других ресурсов сервера.
Использование памяти и процессора может показать, насколько интенсивно используется сервер. Если использование процессора и памяти часто приближается к 100%, это признак того, что ваш сервер перегружен. Рассмотрите возможность снижения нагрузки на оборудование путем модернизации или добавления дополнительных серверов. Другие варианты включают переназначение определенных рабочих нагрузок в облачную среду, таким образом, реализуя гибридное облачное решение.
Обновите панель управления
Программное обеспечение панели управления (например, cPanel) необходимо обновлять вручную. При обновлении cPanel обновляется только панель управления. Вам по-прежнему необходимо обновить приложения, которыми она управляет, такие как Apache и PHP.
Обновление приложений
В зависимости от конфигурации вашего сервера, у вас может быть много различных приложений. Некоторые системы имеют менеджеры пакетов, которые могут автоматически обновлять программное обеспечение. Для тех, кто этого не делает, создайте расписание для просмотра доступных обновлений программного обеспечения.
Это особенно актуально для веб-приложений, на которые приходится подавляющее большинство нарушений. Помните, что некоторые операционные системы могут требовать более старых версий приложений. В тех случаях, когда в производственной среде необходимо использовать более старое программное обеспечение, старайтесь не выставлять его в открытую сеть.
Изучите средства удаленного управления
Проверьте средства удаленного управления, включая удаленную консоль, удаленную перезагрузку и режим спасения. Это особенно важно, если вы используете виртуальную серверную среду на базе облака или управляете своими серверами удаленно. Защитите удаленный доступ для своих сотрудников, если в вашей организации практикуется удаленная работа.
Регулярно проверяйте эти утилиты, чтобы убедиться в их работоспособности. Перезагрузка может решить многие проблемы сама по себе. Удаленная консоль позволяет войти на сервер без физического присутствия. Режим спасения - это решение Red Hat, но большинство серверных операционных систем имеют режим управления или "безопасный" режим, который можно удаленно загрузить для проведения ремонта.
Проверьте использование сети
Так же, как и использование памяти и процессора, нагрузка на сервер зависит от пропускной способности сети. Если ваш сервер приближается к максимальной мощности сетевого оборудования, подумайте об установке обновлений. В дополнение к пропускной способности сети, вы можете рассмотреть возможность использования инструментов мониторинга сети. Эти инструменты могут отслеживать сетевой трафик на предмет необычного или проблематичного использования.
Мониторинг моделей трафика может помочь вам оптимизировать ваш веб-трафик. Например, вы можете перенести часто используемые ресурсы на более быстрый сервер. Вы также можете отслеживать необычное поведение для выявления попыток вторжения и утечки данных и превентивного управления ими.
Проверка обновлений операционной системы
Обновления операционной системы могут быть сложным полем для навигации. С одной стороны, патчи и обновления могут решить проблемы безопасности, расширить функциональность и повысить производительность. С другой стороны, хакеры часто планируют атаки кибербезопасности на основе эксплойтов "нулевого дня". То есть они изучают выпущенные исправления для ОС и атакуют эти слабые места до того, как компания сможет устранить уязвимость.
С другой стороны, пользовательское программное обеспечение может испытывать конфликты и нестабильность при обновлении ПО. Регулярно выделяйте время на просмотр обновлений ОС. Если у вас чувствительная производственная среда, подумайте о создании тестовой среды для проверки обновлений перед их распространением на производстве.
Серверное оборудование
Физическая очистка серверного оборудования
Планируйте время для физической чистки и осмотра серверов, чтобы предотвратить поломку оборудования. Это поможет предотвратить попадание пыли и мусора на печатные платы и вентиляторы.
Скопление пыли мешает управлению теплом, а тепло - враг производительности сервера. Во время уборки визуально осмотрите серверы и серверную среду. Убедитесь, что в шкафах достаточно воздушного потока. Проверьте, нет ли необычных проводов и соединений. Неожиданный флеш-накопитель может быть нарушением безопасности. Несанкционированный сетевой кабель может стать причиной нарушения конфиденциальности данных.
Проверьте наличие аппаратных ошибок
Современные серверные операционные системы ведут журналы аппаратных ошибок.
Аппаратная ошибка может быть ошибкой SMART на неисправном жестком диске, ошибкой драйвера для неисправного устройства или случайными ошибками, которые могут указывать на проблемы с памятью. Проверка журналов ошибок может помочь вам определить и решить аппаратную проблему до того, как она приведет к сбою системы.
Мониторинг безопасности
Проверка безопасности паролей
Регулярно оценивайте политику паролей. Если вы не используете корпоративную систему управления паролями, начните прямо сейчас.
У вас должна быть система, автоматизирующая соблюдение гигиены паролей. В противном случае самое время проинструктировать пользователей о необходимости менять пароли вручную.
Оцените учетные записи пользователей
В большинстве компаний наблюдается определенная текучесть кадров, поэтому учетные записи пользователей легко упустить из виду.
Периодически просматривайте список учетных записей пользователей и удаляйте те из них, которые больше не нужны. Вы также можете проверить разрешения учетных записей, чтобы убедиться, что они подходят для каждого пользователя. Во время просмотра этих данных следует также изучить данные и учетные записи клиентов. Возможно, вам придется вручную удалить данные бывших клиентов, чтобы избежать юридических проблем или проблем с безопасностью.
Рассмотрите общую безопасность сервера
Оцените политику безопасности вашего сервера, чтобы убедиться в ее актуальности и работоспособности. Рассмотрите возможность использования стороннего инструмента сетевой безопасности для проверки вашей сети извне. Это поможет выявить области, которые вы упустили из виду, и поможет вам предотвратить нарушения до того, как они произойдут.
Регулярно проверяйте журналы сервера
Серверы ведут журналы, которые отслеживают доступ и ошибки на сервере. Эти журналы могут быть обширными, но некоторые инструменты и процедуры облегчают работу с ними.
Регулярно просматривайте журналы, чтобы быть в курсе работы ваших серверов. Зафиксированная в журнале ошибка может выявить проблему с оборудованием, которую можно устранить до того, как оно выйдет из строя. Аномалии в журналах доступа могут означать несанкционированное использование пользователями или несанкционированный доступ злоумышленника.
Регулярное обслуживание серверов сокращает время простоя и количество отказов
С помощью этого контрольного списка вы должны лучше понимать, как проводить регулярное обслуживание сервера.
Регулярное обслуживание гарантирует, что незначительные проблемы сервера не перерастут в катастрофический сбой системы. Многие отказы серверов являются результатом предотвратимых ситуаций из-за плохого планирования.