Мониторинг vs ремедиация
Мониторинг обнаруживает проблемы. mttrly действует после алерта.
Grafana, Datadog, Sentry, PagerDuty и Prometheus помогают командам видеть метрики, traces, логи, ошибки, алерты и исторический контекст. mttrly - это incident response action layer, который начинается после сигнала от этих инструментов.
Direct answer
Мониторинг обнаруживает; mttrly действует после алерта
Используйте Grafana, Datadog, Sentry, PagerDuty, Prometheus или ваш observability stack для обнаружения и объяснения инцидентов. Используйте mttrly после алерта, чтобы проверить live server reality, запустить scoped diagnostics, выбрать prepared playbooks, запросить human approval для risky remediation, проверить результат и сохранить audit trail.
Что остаётся в мониторинге, а что делает mttrly
| Возможность | Инструменты мониторинга | mttrly |
|---|---|---|
| Основная задача | Обнаруживать, визуализировать, коррелировать и маршрутизировать сигналы инцидента. | Диагностировать и координировать одобренный response после алерта. |
| Лучшие сигналы | Метрики, дашборды, traces, логи, ошибки, алерты и исторический контекст. | Server reality, health state, диагностика, playbooks, pending approvals, verification и audit trail. |
| Типичный вопрос | "Что нездорово, когда началось и кто должен узнать?" | "Что можно безопасно проверить или исправить на этом сервере дальше?" |
| Модель действий | Обычно read, alert, route, annotate или запуск incident workflow. | Inspect, diagnose, choose a playbook, request approval, execute approved actions, and verify. |
| Контроль риска | Обычно в процессе реагирования команды вокруг мониторинга. | Рискованные действия требуют human approval; AI не может approve своё рискованное действие. |
| Command execution | Не основная задача observability-инструментов. | Доступно только если включено: scoped, approval-gated и audited. Playbooks предпочтительнее. |
| Основная цель | Реакция на инциденты | Наблюдаемость |
| Активные действия | Да (рестарт, деплой) | Нет (только алерты) |
| Сложность настройки | 2 минуты | Часы или дни |
| Стоимость | Бесплатный тариф, Bro 3900₽/мес, Crew 9900₽/мес | $50-500+/месяц |
| Мобильное приложение | Telegram (уже есть) | Отдельное приложение |
| Мобильные действия | Полный контроль | Только просмотр |
Workflow после алерта
Если действие меняет состояние, response path намеренно проходит через human approval.
- 01
Алерт сработал
Grafana, Datadog, Sentry, PagerDuty или Prometheus сигналит о проблеме в существующий incident channel.
- 02
Responder расследует через mttrly
Человек или AI assistant использует mttrly для проверки затронутого сервера после алерта, а не вместо мониторинга.
- 03
Сначала scoped diagnostics
mttrly читает текущий server health, service reality, alerts, logs и targeted diagnostics до предложения изменений.
- 04
Запрашивается playbook или action
Prepared playbooks предпочтительнее. Scoped command execution можно включить для узких случаев, но это controlled action path.
- 05
Human approval для risky remediation
Risky actions создают pending approvals. AI может request action, но не должен approve своё risky action.
- 06
Verification и audit закрывают цикл
mttrly проверяет что может, записывает diagnostics, approval decisions, execution results, а monitoring tools подтверждают системный тренд.
Две разные задачи
Monitoring tools обнаруживают и объясняют сигналы
- +Метрики и дашборды для состояния сервисов и инфраструктуры
- +Traces, логи и application errors для root-cause context
- +Alerts, routing, escalation и historical timelines
- +Trends, baselines, regressions и capacity context
- +Shared observability context для incident team
Они отвечают: "Что происходит, где происходит и как это менялось со временем?"
mttrly расследует и действует после алерта
- +Server reality checks для затронутого host или service
- +Post-alert diagnostics для текущего operating context
- +Prepared remediation playbooks до free-form commands
- +Approval-gated action requests для risky changes
- +Verification steps и audit trail для incident review
Он отвечает: "Что можно безопасно inspect, request, approve и verify дальше?"
Используйте мониторинг для видимости. Добавьте mttrly как controlled action layer после сигнала.
Где место знакомых monitoring tools
Grafana
Dashboards, metric exploration и alert context
Grafana остаётся местом, где команда видит поведение системы во времени. mttrly не Grafana alternative; это action layer после Grafana alert или dashboard investigation.
Prometheus
Metrics collection, alert rules и time-series context
Prometheus отлично измеряет resource pressure и service signals. mttrly использует alert как старт для live server diagnostics и approval-gated remediation.
Datadog
APM, infrastructure telemetry, logs, monitors и alerts
Datadog помогает коррелировать infrastructure и application behavior. mttrly превращает confirmed alert в controlled investigate, approve, act и verify workflow.
Sentry
Application errors, exceptions, releases и issue context
Sentry объясняет application failures и affected code paths. mttrly помогает inspect server, выбрать bounded operational response и зааудировать действия после error signal.
PagerDuty
Alert routing, escalation и responder coordination
PagerDuty приводит нужного человека в loop. mttrly даёт responder scoped action surface: diagnostics, approvals, playbooks и audit history.
Safety model для action layer
mttrly рассчитан на controlled response, а не на unattended risky remediation.
Read first
AI может inspect server status, alerts, logs, service reality и diagnostics до рекомендации действия.
Playbooks preferred
Известные remediation paths должны идти через prepared playbooks, а не через ad hoc shell commands.
Human approval
Risky actions требуют явного human approval. AI может request approval, но не может approve своё risky action.
Scoped commands
Command execution, если включён, scoped, approval-gated и записывается в audit trail.
Verify and audit
Response должен завершаться verification и reviewable trail из diagnostics, approvals и execution results.
Куда перейти дальше
FAQ
mttrly - это Grafana alternative?
Нет. mttrly не Grafana alternative. Оставьте Grafana для dashboards, metrics и alert context; используйте mttrly после alert для server diagnostics, approval-gated remediation, verification и audit trail.
mttrly заменяет Datadog, Sentry, PagerDuty или Prometheus?
Нет. Эти инструменты detect, explain, route и contextualize incidents. mttrly дополняет их как incident response action layer после alert.
Может ли AI выполнять команды через mttrly?
Только если command execution включён, scoped, approval-gated и audited. Prepared playbooks предпочтительнее, risky actions требуют human approval. AI не должен approve своё risky action.
Что происходит после monitoring alert?
Responder может использовать mttrly, чтобы inspect live server reality, run focused diagnostics, choose a playbook or request an action, get human approval for risky remediation, verify the result и сохранить audit trail.
mttrly не является альтернативой Grafana, Datadog или Sentry. Он дополняет мониторинг: обнаружение остаётся в observability-инструментах, а post-alert diagnostics, approval-gated remediation, verification и audit trail живут в mttrly.