
6 советов по быстрому устранению неполадок сервера
При столкновении с проблемой, выясните, есть ли у других пользователей такие же сложности или проблема локальна. Вот несколько методов и советов, которые позволят добиться бесперебойной работы серверов и простого устранения неполадок.
1. Определите область воздействия проблемы с сервером
Для начала выясните, как широко распространяется замедление или отключение работы, а также на что оно влияет.
Проблемы с сетью могут быть связаны с повреждением кабеля на одном ПК или небольшом кластере; с неправильным использованием программного обеспечения; с повреждением локального сервера и т. д.
Выполните следующие шаги:
- Определите, кого из пользовательской базы затронула проблема.
- Если у вас несколько сайтов, выясните, затронуты ли они все.
- Проверьте, в чем проблема для конечных пользователей и есть ли постоянные сообщения об ошибках.
- Сообщите о своих результатах владельцам приложений, владельцам инфраструктуры и всем, кто может иметь отношение к возникшей проблеме.
2. Определите, является ли проблема самим сервером
Какая часть инфраструктуры центра обработки данных затронута? Когда несколько серверов и приложений работают со сбоями, это обычно исключает проблему с сервером и указывает на сеть или массивы хранения.
Проверьте с помощью виртуализации расположение физического узла всех затронутых виртуальных машин, чтобы убедиться, что они не используют одно и то же оборудование.
Проверьте, как проходит копирование из одного файлового ресурса в другой и занимает ли это много времени? Медленное копирование с одного на другой сервера (на одном сайте) значит, что проблема не в WAN. Медленное копирование между локальными дисками на сервер означает, что дело не в SAN или LAN. Но устранение неполадок сервера после тестов скорости ввода-вывода длительны по времени.
Выполните следующие шаги, чтобы определить, связана ли проблема с сервером:
- Проверьте, работает ли сервер. Вам помогут справочные инструменты мониторинга.
- Проверьте сетевое подключение к серверу, связанным с проблемой, как по имени хоста, так и по IP-адресу.
- Оцените работоспособность обнаруженных серверов с помощью доступных средств устранения неполадок.
- Изучите документацию по топологии среды, чтобы убедиться, что вы ничего не пропустили.
3. Вести подробный учет настроек сервера и подключений
Документация – это невероятно ценный инструмент, помогающий быстро устранять неполадки на сервере. Вам необходимо иметь четкое представление об операциях центра обработки данных: сколько серверов задействовано в каждом приложении; какие основные настройки сети и т. д.
Например, если у ваших клиентов возникла проблема к подключению через систему, вы сможете понять, на каком сервере проблема по документации.
Выполните следующие шаги:
- Если вы еще не ведете документацию, настройте систему записей.
- Составьте список приложений, серверов, инфраструктуры и документации и свяжите их вместе.
- Поделитесь платформой с другими, чтобы легче исправлять ошибки.
- Назначьте владельцев, например, укажите его / их для каждого приложения.
- Обновляйте записи в качестве процессов изменения ИТ.
4. Сообщайте членам команды обо всей работе и деятельности
Связь играет ключевую роль в устранении неполадок сервера. Например, ваш коллега вчера изменил настройки сервера. На следующий день что-то не работает. Вы должны знать о каждом изменении.
Коммуникация помогает команде центра обработки данных подготовиться и проактивно следить за средой, когда изменения вступают в силу. В противном случае они будут спрашивать о новом приложении, его развертывании и потребностях в ресурсах, когда конечные пользователи начнут жаловаться на плохую функциональность.
Выполните шаги для эффективного общения с командой:
- Проведите встречу, чтобы обсудить пробелы в общении и способствовать ясному общению.
- Подавайте личный пример – своевременно сообщайте об изменениях и проблемах и задавайте вопросы.
- Убедитесь, что никто не остался в стороне; упростите взаимодействие сотрудников на любой из работающих платформ, например Slack или Microsoft Teams.
- При необходимости вовлекайте владельцев приложений и конечных пользователей в общение, но не перегружайте их нерелевантной информацией или слишком регулярными обновлениями.
5. Всесторонний мониторинг состояния сервера и просмотр данных журнала
Существует множество инструментов мониторинга, доступных для центров обработки данных разного размера и структуры. При правильной настройке они отслеживают ключевые показатели (задержку, скорость ввода-вывода и так далее). Это дает возможность задействовать специалистов по хранилищу или сети в зависимости от ситуации.
Инструменты мониторинга позволяют экономить время на устранение неполадок и предупреждают вас о потенциально полезной информации. Многие продукты также отслеживают службы; если критическая служба выйдет из строя и остановится, инструмент отправит предупреждение или автоматически попытается перезапустить ее в соответствии с установленными вами правилами.
Проверьте системные журналы на предмет предупреждений и ошибок. Журналы приложений же часто содержат данные об ошибках, указывающие на причину их возникновения. Сохраняйте данные журнала в изолированном месте хранения, чтобы отслеживать долгосрочное состояние и поведение сервера.
Выполните следующие шаги для доступа к статистике:
- Выберите и настройте инструмент мониторинга в сотрудничестве со всей командой.
- Сделайте общий доступ к информации о времени безотказной работы или работоспособности службы общедоступным через веб-сайт или телеэкраны, чтобы все несли ответственность за поддержку инструмента мониторинга.
- Убедитесь, что каждое приложение отправляет журналы централизованному серверу; платформы безопасности и обнаружения вторжений также могут использовать эти журналы.
6. Узнайте условия SLA поставщика
Проверьте конкретные детали соглашений об уровне обслуживания (SLA) поддержки с поставщиками вашей организации. Если поставщик не свяжется с вами до следующего рабочего дня, зарегистрируйте проблему как можно раньше. У многих поставщиков есть конкретные инструкции по устранению проблем с сервером. Ознакомьтесь с ресурсами в базе знаний поставщика и на онлайн-форумах.
Опережайте проблемы поставщика:
- Запишите SLA для каждого поставщика или приложения.
- Изучите свой список поставщиков и договоритесь об обсуждении с соответствующими сторонами.
- Обсудите с поставщиками понимание SLA и убедитесь, что обе стороны согласны с документацией и записанными контрактами.
- Сообщите поставщику о любых новых проблемах, которые возникли или могут возникнуть, которые могут повлиять на ваш бизнес.
- Выделите любые риски, которые необходимо поднять с высшим руководством, прежде чем они станут проблемой.
Не бойтесь обращаться за помощью. Подготовка, общение и четкое понимание – самые полезные инструменты. CloudNetworks занимается интеграцией средств защиты данных в компании. Обратитесь к нашему менеджеру для консультации по вопросам информационной безопасности.