Watchdog записывает данные на /dev/watchdog каждые десять секунд. Если устройство открыто, но запись на него не производится в течение минуты, машина перезагрузится. Эта функция доступна, если ядро собрано с поддержкой "программного сторожевого таймера" (стандартно в ядрах Debian) или если машина оснащена аппаратным сторожевым таймером. Способность программного сторожевого таймера ядра к перезагрузке будет зависеть от состояния машины и прерываний. . Сам инструмент watchdog выполняет несколько проверок состояния системы и действует соответствующим образом, если система не в порядке.
Есть три способа установить watchdog на Debian. Мы можем использовать apt-get, apt и aptitude. В следующих разделах мы опишем каждый способ. Вы можете выбрать один из них.
Установка watchdog с помощью apt-get
Обновите базу данных apt с помощью apt-get, используя следующую команду.
1 | apt-get update |
После обновления базы данных apt мы можем установить watchdog с помощью apt-get, выполнив следующую команду:
1 | apt-get -y install watchdog |
Установка watchdog с помощью apt
Обновите базу данных apt с помощью apt, выполнив следующую команду.
1 | apt update |
После обновления базы данных apt мы можем установить watchdog с помощью apt, выполнив следующую команду:
1 | apt -y install watchdog |
Установка watchdog с помощью aptitude
Если вы хотите использовать этот метод, вам, возможно, потребуется сначала установить aptitude, так как aptitude обычно не установлен по умолчанию в Debian. Обновите базу данных apt с помощью aptitude, используя следующую команду.
1 | aptitude update |
После обновления базы данных apt мы можем установить watchdog с помощью aptitude, выполнив следующую команду:
1 | aptitude -y install watchdog |
Настройка watchdog
Открываем файл конфигурации
1 | nano /etc/watchdog.conf |
параметры конфигурации
- interval - Интервал между двумя операциями записи в watchdog устройство. Значение по умолчанию составляет 10 секунд. Интервал больше минуты может быть использованы только параметром -f из командной строки.
- logtick - Если пишутся логи, можно пропускать запись событий каждое указанно количество интервалов. Например если logtick = 60 и interval 10, получится 600 секунд, то есть в логируемый файл будет добавляться запись не чаще одного раза в 10 минут.
- max-load-1 - Максимально разрешенное значение загрузки системы за 1 минуту при превышении которого система перезагрузится. 0 — отключает проверку.
- max-load-5 - Максимально разрешенное значение загрузки системы за 5 минуту при превышении которого система перезагрузится. 0 — отключает проверку.
- max-load-15 - Максимально разрешенное значение загрузки системы за 15 минуту при превышении которого система перезагрузится. 0 — отключает проверку.
- min-memory - Установка минимального количества виртуальной памяти которое должно быть свободно. 0 — проверка отключено.
- max-temperature - Установка максимально разрешенной температуры.
- watchdog-device - Установка имени устройства.
- temperature-device - Установка имени устройства температуры.
- file - Файловый режим, проверка файлов.
- change - Интервал времени для файлового режима.
- pidfile - Имя pid файла. Можно добавить отслеживаемый процесс, например "pidfile = /var/run/apache2.pid". В случае невозможности запуска процесса watchdog будет постоянно перезагружать систему.
- ping - Режим пинга, для проверки сетевых соединений. Опция может быть использована более одного раза.
- interface - Установка имени сетевого интерфейса.
- test-binary - Выполнение пользовательского теста.
- test-timeout - Тест может выполняться указанное количество секунд. 0 — неограничено.
- repair-binary - Выполняется при невозможности перезагрузки системы.
- admin - Адрес email для уведомлений, можно оставить значение пустым для отключения.
- realtime - Yes для невозможности выгрузки watchdog из оперативной памяти.
- priority - Установка приоритета для режима realtime.
Запуск службы
Устанавливаем службу в автоматический запуск
1 | systemctl enable watchdog |
и запускаем службу
1 | systemctl start watchdog |
проверяем статус
1 | systemctl status watchdog |
Удаление watchdog в Debian
Для удаления только пакета watchdog мы можем использовать следующую команду:
1 | apt-get remove watchdog |
Удаление watchdog и его зависимостей
Чтобы удалить watchdog и его зависимости, которые больше не нужны в Debian, мы можем использовать следующую команду:
1 | apt-get -y autoremove watchdog |
Удаление конфигураций и данных watchdog
Чтобы удалить конфигурацию и данные watchdog из Debian 11, мы можем использовать следующую команду:
1 | apt-get -y purge watchdog |
Удаление конфигурации, данных и всех зависимостей watchdog
Для удаления конфигурации, данных и всех зависимостей watchdog мы можем использовать следующую команду:
1 | apt-get -y autoremove --purge watchdog |
А что именно посылается в watchdog-device?
Как настроить строку которую туда надо отправить?
watchdog - это компонент, который контролирует работу других частей компьютера или системы, чтобы убедиться, что они функционируют правильно.
Обычно оно получает сигнал "heartbeat" от контролируемых компонентов и сбрасывает их, если сигнал прекращается.
Т.е. это не строка, сигнал сформированный в специальном формате.