Мониторинг vs ремедиация

Мониторинг обнаруживает проблемы. mttrly действует после алерта.

Grafana, Datadog, Sentry, PagerDuty и Prometheus помогают командам видеть метрики, traces, логи, ошибки, алерты и исторический контекст. mttrly - это incident response action layer, который начинается после сигнала от этих инструментов.

Direct answer

Мониторинг обнаруживает; mttrly действует после алерта

Используйте Grafana, Datadog, Sentry, PagerDuty, Prometheus или ваш observability stack для обнаружения и объяснения инцидентов. Используйте mttrly после алерта, чтобы проверить live server reality, запустить scoped diagnostics, выбрать prepared playbooks, запросить human approval для risky remediation, проверить результат и сохранить audit trail.

Что остаётся в мониторинге, а что делает mttrly

ВозможностьИнструменты мониторингаmttrly
Основная задачаОбнаруживать, визуализировать, коррелировать и маршрутизировать сигналы инцидента.Диагностировать и координировать одобренный response после алерта.
Лучшие сигналыМетрики, дашборды, traces, логи, ошибки, алерты и исторический контекст.Server reality, health state, диагностика, playbooks, pending approvals, verification и audit trail.
Типичный вопрос"Что нездорово, когда началось и кто должен узнать?""Что можно безопасно проверить или исправить на этом сервере дальше?"
Модель действийОбычно read, alert, route, annotate или запуск incident workflow.Inspect, diagnose, choose a playbook, request approval, execute approved actions, and verify.
Контроль рискаОбычно в процессе реагирования команды вокруг мониторинга.Рискованные действия требуют human approval; AI не может approve своё рискованное действие.
Command executionНе основная задача observability-инструментов.Доступно только если включено: scoped, approval-gated и audited. Playbooks предпочтительнее.
Основная цельРеакция на инцидентыНаблюдаемость
Активные действияДа (рестарт, деплой)Нет (только алерты)
Сложность настройки2 минутыЧасы или дни
СтоимостьБесплатный тариф, Bro 3900₽/мес, Crew 9900₽/мес$50-500+/месяц
Мобильное приложениеTelegram (уже есть)Отдельное приложение
Мобильные действияПолный контрольТолько просмотр

Workflow после алерта

Если действие меняет состояние, response path намеренно проходит через human approval.

  1. 01

    Алерт сработал

    Grafana, Datadog, Sentry, PagerDuty или Prometheus сигналит о проблеме в существующий incident channel.

  2. 02

    Responder расследует через mttrly

    Человек или AI assistant использует mttrly для проверки затронутого сервера после алерта, а не вместо мониторинга.

  3. 03

    Сначала scoped diagnostics

    mttrly читает текущий server health, service reality, alerts, logs и targeted diagnostics до предложения изменений.

  4. 04

    Запрашивается playbook или action

    Prepared playbooks предпочтительнее. Scoped command execution можно включить для узких случаев, но это controlled action path.

  5. 05

    Human approval для risky remediation

    Risky actions создают pending approvals. AI может request action, но не должен approve своё risky action.

  6. 06

    Verification и audit закрывают цикл

    mttrly проверяет что может, записывает diagnostics, approval decisions, execution results, а monitoring tools подтверждают системный тренд.

Две разные задачи

Monitoring tools обнаруживают и объясняют сигналы

  • +Метрики и дашборды для состояния сервисов и инфраструктуры
  • +Traces, логи и application errors для root-cause context
  • +Alerts, routing, escalation и historical timelines
  • +Trends, baselines, regressions и capacity context
  • +Shared observability context для incident team

Они отвечают: "Что происходит, где происходит и как это менялось со временем?"

mttrly расследует и действует после алерта

  • +Server reality checks для затронутого host или service
  • +Post-alert diagnostics для текущего operating context
  • +Prepared remediation playbooks до free-form commands
  • +Approval-gated action requests для risky changes
  • +Verification steps и audit trail для incident review

Он отвечает: "Что можно безопасно inspect, request, approve и verify дальше?"

Используйте мониторинг для видимости. Добавьте mttrly как controlled action layer после сигнала.

Где место знакомых monitoring tools

Grafana

Dashboards, metric exploration и alert context

Grafana остаётся местом, где команда видит поведение системы во времени. mttrly не Grafana alternative; это action layer после Grafana alert или dashboard investigation.

Prometheus

Metrics collection, alert rules и time-series context

Prometheus отлично измеряет resource pressure и service signals. mttrly использует alert как старт для live server diagnostics и approval-gated remediation.

Datadog

APM, infrastructure telemetry, logs, monitors и alerts

Datadog помогает коррелировать infrastructure и application behavior. mttrly превращает confirmed alert в controlled investigate, approve, act и verify workflow.

Sentry

Application errors, exceptions, releases и issue context

Sentry объясняет application failures и affected code paths. mttrly помогает inspect server, выбрать bounded operational response и зааудировать действия после error signal.

PagerDuty

Alert routing, escalation и responder coordination

PagerDuty приводит нужного человека в loop. mttrly даёт responder scoped action surface: diagnostics, approvals, playbooks и audit history.

Safety model для action layer

mttrly рассчитан на controlled response, а не на unattended risky remediation.

Read first

AI может inspect server status, alerts, logs, service reality и diagnostics до рекомендации действия.

Playbooks preferred

Известные remediation paths должны идти через prepared playbooks, а не через ad hoc shell commands.

Human approval

Risky actions требуют явного human approval. AI может request approval, но не может approve своё risky action.

Scoped commands

Command execution, если включён, scoped, approval-gated и записывается в audit trail.

Verify and audit

Response должен завершаться verification и reviewable trail из diagnostics, approvals и execution results.

Куда перейти дальше

FAQ

mttrly - это Grafana alternative?

Нет. mttrly не Grafana alternative. Оставьте Grafana для dashboards, metrics и alert context; используйте mttrly после alert для server diagnostics, approval-gated remediation, verification и audit trail.

mttrly заменяет Datadog, Sentry, PagerDuty или Prometheus?

Нет. Эти инструменты detect, explain, route и contextualize incidents. mttrly дополняет их как incident response action layer после alert.

Может ли AI выполнять команды через mttrly?

Только если command execution включён, scoped, approval-gated и audited. Prepared playbooks предпочтительнее, risky actions требуют human approval. AI не должен approve своё risky action.

Что происходит после monitoring alert?

Responder может использовать mttrly, чтобы inspect live server reality, run focused diagnostics, choose a playbook or request an action, get human approval for risky remediation, verify the result и сохранить audit trail.

mttrly не является альтернативой Grafana, Datadog или Sentry. Он дополняет мониторинг: обнаружение остаётся в observability-инструментах, а post-alert diagnostics, approval-gated remediation, verification и audit trail живут в mttrly.