Cloud Networks • Аналитика • 6 советов по быстрому устранению неполадок сервера
Устранение неполадок сервера
25.06.2021

6 советов по быстрому устранению неполадок сервера

При столкновении с проблемой, выясните, есть ли у других пользователей такие же сложности или проблема локальна. Вот несколько методов и советов, которые позволят добиться бесперебойной работы серверов и простого устранения неполадок.

 

1. Определите область воздействия проблемы с сервером

Для начала выясните, как широко распространяется замедление или отключение работы, а также на что оно влияет.

Проблемы с сетью могут быть связаны с повреждением кабеля на одном ПК или небольшом кластере; с неправильным использованием программного обеспечения; с повреждением локального сервера и т. д.

Выполните следующие шаги:

  • Определите, кого из пользовательской базы затронула проблема.
  • Если у вас несколько сайтов, выясните, затронуты ли они все.
  • Проверьте, в чем проблема для конечных пользователей и есть ли постоянные сообщения об ошибках.
  • Сообщите о своих результатах владельцам приложений, владельцам инфраструктуры и всем, кто может иметь отношение к возникшей проблеме.

 

2. Определите, является ли проблема самим сервером

Какая часть инфраструктуры центра обработки данных затронута? Когда несколько серверов и приложений работают со сбоями, это обычно исключает проблему с сервером и указывает на сеть или массивы хранения.

Проверьте с помощью виртуализации расположение физического узла всех затронутых виртуальных машин, чтобы убедиться, что они не используют одно и то же оборудование.

Проверьте, как проходит копирование из одного файлового ресурса в другой и занимает ли это много времени? Медленное копирование с одного на другой сервера (на одном сайте) значит, что проблема не в WAN. Медленное копирование между локальными дисками на сервер означает, что дело не в SAN или LAN. Но устранение неполадок сервера после тестов скорости ввода-вывода длительны по времени.

Выполните следующие шаги, чтобы определить, связана ли проблема с сервером:

  • Проверьте, работает ли сервер. Вам помогут справочные инструменты мониторинга.
  • Проверьте сетевое подключение к серверу, связанным с проблемой, как по имени хоста, так и по IP-адресу.
  • Оцените работоспособность обнаруженных серверов с помощью доступных средств устранения неполадок.
  • Изучите документацию по топологии среды, чтобы убедиться, что вы ничего не пропустили.

 

3. Вести подробный учет настроек сервера и подключений

Документация – это невероятно ценный инструмент, помогающий быстро устранять неполадки на сервере. Вам необходимо иметь четкое представление об операциях центра обработки данных: сколько серверов задействовано в каждом приложении; какие основные настройки сети и т. д.

Например, если у ваших клиентов возникла проблема к подключению через систему, вы сможете понять, на каком сервере проблема по документации.

Выполните следующие шаги:

  • Если вы еще не ведете документацию, настройте систему записей.
  • Составьте список приложений, серверов, инфраструктуры и документации и свяжите их вместе.
  • Поделитесь платформой с другими, чтобы легче исправлять ошибки.
  • Назначьте владельцев, например, укажите его / их для каждого приложения.
  • Обновляйте записи в качестве процессов изменения ИТ.

 

4. Сообщайте членам команды обо всей работе и деятельности

Связь играет ключевую роль в устранении неполадок сервера. Например, ваш коллега вчера изменил настройки сервера. На следующий день что-то не работает. Вы должны знать о каждом изменении.

Коммуникация помогает команде центра обработки данных подготовиться и проактивно следить за средой, когда изменения вступают в силу. В противном случае они будут спрашивать о новом приложении, его развертывании и потребностях в ресурсах, когда конечные пользователи начнут жаловаться на плохую функциональность.

Выполните шаги для эффективного общения с командой:

  • Проведите встречу, чтобы обсудить пробелы в общении и способствовать ясному общению.
  • Подавайте личный пример – своевременно сообщайте об изменениях и проблемах и задавайте вопросы.
  • Убедитесь, что никто не остался в стороне; упростите взаимодействие сотрудников на любой из работающих платформ, например Slack или Microsoft Teams.
  • При необходимости вовлекайте владельцев приложений и конечных пользователей в общение, но не перегружайте их нерелевантной информацией или слишком регулярными обновлениями.

 

5. Всесторонний мониторинг состояния сервера и просмотр данных журнала

Существует множество инструментов мониторинга, доступных для центров обработки данных разного размера и структуры. При правильной настройке они отслеживают ключевые показатели (задержку, скорость ввода-вывода и так далее). Это дает возможность задействовать специалистов по хранилищу или сети в зависимости от ситуации.

Инструменты мониторинга позволяют экономить время на устранение неполадок и предупреждают вас о потенциально полезной информации. Многие продукты также отслеживают службы; если критическая служба выйдет из строя и остановится, инструмент отправит предупреждение или автоматически попытается перезапустить ее в соответствии с установленными вами правилами.

Проверьте системные журналы на предмет предупреждений и ошибок. Журналы приложений же часто содержат данные об ошибках, указывающие на причину их возникновения. Сохраняйте данные журнала в изолированном месте хранения, чтобы отслеживать долгосрочное состояние и поведение сервера.

Выполните следующие шаги для доступа к статистике:

  • Выберите и настройте инструмент мониторинга в сотрудничестве со всей командой.
  • Сделайте общий доступ к информации о времени безотказной работы или работоспособности службы общедоступным через веб-сайт или телеэкраны, чтобы все несли ответственность за поддержку инструмента мониторинга.
  • Убедитесь, что каждое приложение отправляет журналы централизованному серверу; платформы безопасности и обнаружения вторжений также могут использовать эти журналы.

 

6. Узнайте условия SLA поставщика

Проверьте конкретные детали соглашений об уровне обслуживания (SLA) поддержки с поставщиками вашей организации. Если поставщик не свяжется с вами до следующего рабочего дня, зарегистрируйте проблему как можно раньше. У многих поставщиков есть конкретные инструкции по устранению проблем с сервером. Ознакомьтесь с ресурсами в базе знаний поставщика и на онлайн-форумах.

Опережайте проблемы поставщика:

  • Запишите SLA для каждого поставщика или приложения.
  • Изучите свой список поставщиков и договоритесь об обсуждении с соответствующими сторонами.
  • Обсудите с поставщиками понимание SLA и убедитесь, что обе стороны согласны с документацией и записанными контрактами.
  • Сообщите поставщику о любых новых проблемах, которые возникли или могут возникнуть, которые могут повлиять на ваш бизнес.
  • Выделите любые риски, которые необходимо поднять с высшим руководством, прежде чем они станут проблемой.

Не бойтесь обращаться за помощью. Подготовка, общение и четкое понимание – самые полезные инструменты. CloudNetworks занимается интеграцией средств защиты данных в компании. Обратитесь к нашему менеджеру для консультации по вопросам информационной безопасности.

Мы не передадим ваши данные третьим лицам и не будем донимать спамом
to-top