SAgent - решение для мониторинга за производительностью и текущим состоянием ИТ - инфраструктуры
Цена: 1 руб.
Производитель: FLUKE NETWORKS
• Порой, когда начинают возникать проблемы, в голове всплывает вопрос –
“В чем дело?”, “За что хвататься?”, “Какое подразделение привлекать к
решению проблемы?”. SAgent позволит дать однозначный ответ в течение
нескольких минут - проблема в сети, сервере, пользователе или самом
приложении. Эта локализация позволит Вам привлечь правильные ресурсы и
получить результат, который повысит уровень удовлетворенности персонала
и эффективность всего бизнеса, а так же сэкономит ваши деньги.
SAgent - решение для мониторинга за
производительностью и текущим состоянием ИТ - инфраструктуры, поиска и
устранения неисправностей в работе сети на ранней стадии. Позволяет
выявлять источники задержек в работе сетевых ресурсов без установки
дополнительных устройств диагностики с клиентской стороны и агентов
(мониторов) на сервера. Принцип работы SAgent основан на пассивном
мониторинге всех пользовательских TCP транзакций к серверам приложений.
Используя процедуру установления TCP-сессии наша система раскладывает
каждый запрос на составляющие: время прохождения пакета по сети, время
необходимое серверу для начала обработки запроса, время необходимое
приложению, чтобы переслать запрашиваемые данные. На основе собранной
статистики система выстраивает разнообразные графики, тренды, таблицы
позволяющие в автоматическом режиме контролировать множество параметров
ИТ-инфраструктуры, а так же наглядно сравнивать работоспособность
отдельных ее компонентов, выявляя самые слабые участки. SAgent это
система управления качеством ИТ-услуг. Она позволит обеспечить четкую и
однозначную взаимосвязь между техническими параметрами
ИТ-инфраструктуры и качеством обслуживания реальных пользователей. Наше
решение автоматизирует процесс мониторинга за работой приложений,
позволяя ИТ - специалистам быстро выявлять и изолировать возникающие
проблемы с производительностью.
Одной из основных задач ИТ департамента является обеспечение
работоспособности бизнес-значимых приложений. В конечном счете,
количество серверов, а также пропускная способность активного сетевого
оборудования теряет смысл, если пользователи жалуются на медленную
работу приложений. Современные системы мониторинга позволяют
контролировать огромное количество элементов ИТ-инфраструктуры, при
этом полученные данные лишь опосредованно связаны с реальной
работоспособностью пользователей.
Система
SuperAgent позволяет объединить работу различных технических средств
мониторинга, а так же работу различных отделов (сетевой инфраструктуры,
поддержки пользователей, поддержки серверов, приложений) для решения
проблем со временем отклика приложений для реальных пользователей.
SuperAgent в пассивном режиме анализирует каждый запрос каждого
пользователя к серверам приложения. Используя процедуру установления
TCP-сессии, наша система раскладывает время отклика приложения для
конкретных пользователей на время потребовавшееся серверу для
установления сессии с пользователем, время потребовавшееся приложению
для обработки пользовательского запроса, время потраченное пакетом для
прохождения по сети, а так же на время повторных передач.
Эти
четыре базовые характеристики позволяют локализовать проблему до
конкретного сервера, приложения или подсети. Для более глубокого
анализа сервер позволяет формировать графики по следующим параметрам:
Пользователи начинают звонить в службу поддержки в тех случаях, когда
время отклика приложения не соответствует их ожиданиям. При этом вполне
возможно, что в понедельник утром или в начале каждого рабочего дня
время отклика для пользователей бывает обычно хуже чем всегда. Как
определить пороговые значения для автоматического мониторинга в
подобных случаях, учитывая еще и то, что разные пользователи подключены
по каналам различной пропускной способности? В системе SuperAgent для
ведения автоматического диспетчерского мониторинга за временем отклика
используется система Intelligent Baselines. Эта система сравнивает
текущую производительность с ранее наблюдавшейся и идентифицирует
«деградацию» или «значительное ухудшение» сервиса в случае если
наблюдается отклонение от работоспособности исторически свойственной
данному компоненту. Кривую производительности SuperAgent высчитывает
самостоятельно, используя краткосрочную, среднесрочную и долгосрочную
статистику. Тем не менее, чувствительность системы можно настраиваться
вручную.
Изменения постоянно происходят в сети и затрагивают все элементы
ИТ-инфраструктуры. Изменения о которых вы знаете – вы можете
контролировать. Изменения, которые остались без внимания, могут
привести к значительным проблемам как непосредственно для
пользователей, так и для бизнес процессов в целом. SuperAgent позволяет
определить проблему как только она появилась и взять изменения под
контроль до того как они коснутся пользователей. Как правило одна
проблема влечет за собой множество последствий и бывает довольно сложно
найти первоисточник или определить взаимосвязанные инциденты. При
деградации какого-либо сервиса, наша система автоматически определяет
все взаимосвязанные характеристики с таким же или похожим снижением
производительности, тем самым экономя ваше время и снижая общее число
записей о инцидентах.
Инцидент создается когда производительность определенных серверов,
приложений или подсетей снижается ниже пороговых значений, высчитанных
на основе Intelligent Baselines или установленных вручную.
Помимо процедуры создания инцидентов, при которой остается запись о
событии, определяются взаимосвязанные проблемы и проводится
автоматическое расследование, можно настраивать обычные напоминания,
при которых система будет сообщать о превышении пороговых значений по
некоторым важным характеристикам:
- Packet loss percent
- Connection time
- Network round trip time
- Effective round trip time (network round trip time + retransmission delay)
- Server response time
- Transaction time
- Open sessions
- Data transfer
- Complete sessions
- Refused sessions
- Timed out sessions
При деградации времени отклика приложений SuperAgent создает
уведомление, составляет запись с описанием события, определяет
взаимосвязанные факторы, после чего начинает процедуру
«интеллектуального расследования инцидента». В том случае если
наблюдается снижение производительности подсети, для расследования
используются Trace Route и SNMP-запрос. Если проблема в конкретном
сервере, посылается запрос ping, производится SNMP-запрос, или
захватывается трафик от данного сервера к проблемным подсетям. Если
причина деградации – приложение, то производится запрос Application
Connection Time, а так же производится захват трафика. В случае
обнаружения проблем SuperAgent определяет их на начальном этапе,
сообщает об этом ответственным специалистам, ведет запись на протяжении
всего времени пока проблемы наблюдаются, проводит автоматическое
расследование инцидента. Таким образом, даже если неисправности носят
периодический характер или возникают во время отсутствия ответственного
персонала на рабочем месте, вы будете иметь полную картину
происходивших в вашей сети изменений.
SAgent позволяет вводить на вашем предприятии соглашение об уровне
сервиса (SLA) и контролировать его. Данная процедура позволяет
соотнести IT – ресурсы предприятия и задачи бизнеса за счет контроля
качества работы бизнес приложений. В прошлом SLA использовалось для
контроля работы провайдеров. Сегодня вы можете использовать его для
того чтобы демонстрировать руководству компании отдачу от их инвестиций
в ИТ постоянно улучшая качество работы инфраструктуры и документально
подтверждая это.
Отличительная особенность нашей системы в том, что SLA контролируется,
основываясь на данных о качестве выполнения реальных пользовательских
запросов. В то время как все современные системы контроля SLA
основываются на времени доступности серверов и приложений или на
синтетических транзакциях.
SuperAgent представляет собой идеальное средство для
ведения отчетности по соблюдению SLA так как представляет понятную
информацию для сотрудников любого уровня: от финансового директора и
CIO до сетевого администратора.
Для финансового директора
Для CIO
Для технического специалиста
Соблюдение SLA может контролироваться по четырем основным параметрам:
Время выполнения транзакций – мониторинг реального времени
отклика для пользователя с целью определения для каких пользователей
этот параметр деградирует а для каких уже недопустим.
Время отклика сервера – определение эффективности работы data-центра посредством сравнения работоспособности разных серверов внутри серверной фермы.
Время прохождения запросов по сети – контроль уровня сервиса предоставляемого вам вашим провайдером по каждому арендуемому каналу.
Доступность серверов и приложений – контроль доступности серверов и приложений.