Защищённый разбор инцидентов на живом сервере

Сервер упал.
mttrly покажет почему._

/ mät·ter·ly /

Следит за VPS, собирает факты и предлагает следующий шаг. Опасное ждёт твоего подтверждения; каждый шаг пишется в аудит.

Работает на многошаговом AI-разборе - не на общих советах чат-бота.

Запустить Watchdog бесплатно

Проверка снаружи не требует регистрации. Подключи агента, когда будешь готов увидеть сервер изнутри.

Бесплатный watchdog • AI-функции от 3900₽/мес
>_ MTTRLY // ИНЦИДЕНТ
api.myapp.com отдаёт 502
Проверил nginx, процесс приложения, диск и метки последних деплоев. API-процесс был убит по OOM 8 мин назад; давление по RAM - 94%. Варианты: 1. Показать падающие логи 2. Перезапустить API-процесс 3. Продолжить наблюдение и предупредить снова Подтвердить рестарт?
Да
Перезапустил. Латентность вернулась в норму. Наблюдаю 5 мин для подтверждения. Больше ничего не трогал - всё действие в audit log.

Проверка снаружи

Начни без регистрации

Проверь DNS, TLS, доступность и публичные симптомы до того, как открывать SSH.

Факты

Смотри что изменилось

Когда агент подключён, mttrly читает живое состояние сервера, а не гадает по промпту.

Подтверждение

Фикс выбираешь ты

Рискованные рестарты, команды и деплой-действия ждут явного подтверждения.

Аудит

Каждый шаг записан

Запросы, апрувы, действия и результат остаются видимыми после инцидента.

Узнаёшь?

01_ПАНИКА

«На моей машине работало»

Выкатил изменение, а продакшен стал белым экраном. SSH открывает стену логов, полезная строка где-то внутри, пользователи уже замечают.

02_ПОТЕРЯН

«Что вообще значит эта ошибка?»

ChatGPT объяснит строку ошибки. Но он не видит статус nginx, память процесса, давление на диск и конкретный сервис, который лежит.

03_В ЛОВУШКЕ

«Одна неверная команда — и всё»

Похоже, надо что-то перезапустить. Но какой процесс? Что ещё заденет команда? mttrly держит следующий шаг ограниченным и ждёт твоего решения.

Что mttrly делает на самом деле

Превращает инцидент на живом сервере в контролируемый цикл: заметить, разобрать, подтвердить, проверить.

  • Видит реальное состояние сервера, а не только вставленную строку лога
  • Объясняет вероятную причину обычным языком
  • Держит рискованные действия за подтверждением и аудитом

Цикл инцидента:

1. Следит и ловит

Watchdog проверяет публичные и подключённые серверные сигналы, затем отправляет симптом в дашборд, Telegram или MCP.

2. Диагностирует по фактам

mttrly проверяет процессы, логи, порты, диск, память и метки последних изменений, прежде чем объяснять вероятную причину.

3. Чинит после подтверждения

Предлагает ограниченные следующие шаги. Рестарты, команды и деплой-действия ждут явного апрува и остаются в журнале аудита.

Контроль остаётся у тебя. mttrly делает тяжёлую работу.

Как работает AI

Не чат-бот. Reasoning loop, который проверяет реальное состояние сервера и держит рискованные действия за апрувом.

01
ALERTАномалия найдена

Watchdog или проверка снаружи ловит симптом и отправляет его в твой workspace.

02
TRIAGEКлассификация <1с

Быстрая модель определяет тип инцидента и выбирает следующий diagnostic recipe.

03
DIAGNOSEЦикл фактов

Scoped tools читают логи, сервисы, порты, диск, память и метки недавних изменений.

04
ROOT CAUSEПаттерн найден

Модель связывает факты, объясняет вероятную причину и оценивает уверенность.

05
PLANОграниченные варианты

mttrly показывает следующие шаги с уровнем риска, а не прыгает сразу в терминальную команду.

06
YOUR CALLПодтверждение человеком

Чувствительные действия ждут апрува из дашборда, Telegram или MCP/IDE-потока.

07
EXECUTEПодтверждённый фикс

Агент выполняет только approved action, затем читает новое состояние и проверяет восстановление.

08
SUMMARYОтчёт по инциденту

Ты видишь, что случилось, что изменилось и как снизить шанс повтора.

Многошаговый reasoning на инцидент • ограниченные server tools • апрувы и журнал аудита

Старый способ vs с mttrly

«Моё приложение работает?»

Старый способ:

SSH → systemctl status → docker ps → проверить процессы Занимает 5 минут. Надо знать что проверять.

С mttrly:

Спрашиваешь один раз. mttrly проверяет процесс приложения, nginx, соединения с базой и ресурсы, затем возвращает статус обычным языком.

«Почему тормозит?»

Старый способ:

Открыть htop, читать логи, сравнивать последние изменения и надеяться, что помнишь нормальный расход RAM для сервиса.

С mttrly:

Он проверяет RAM, диск, CPU, сеть, логи и последние метки деплоя, затем даёт вероятное узкое место и понятные варианты.

«Покажи ошибки»

Старый способ:

journalctl -u app -n 1000 | grep ERROR Потом листать сотни строк и гадать, какие из них важны.

С mttrly:

Он группирует повторяющиеся ошибки, находит первый новый паттерн, связывает его с недавними изменениями и предлагает безопасный следующий шаг.

«Можно деплоить безопасно?»

Старый способ:

Вручную пройти чеклист: pull, install, migrate, build, restart, verify. Пропустил шаг — платит продакшен.

С mttrly:

Профили деплоя могут выполнять pre-checks, защищённые шаги, post-checks и rollback paths для поддерживаемых режимов. Рискованное всё равно подтверждаешь ты.

Реальные сценарии

Как работают диагностические рецепты на практике

Сценарий 1: «Сайт не работает»

Сайт не работает
Запускаю диагностику...

✓ Сервер доступен (ping 34ms)
✓ Порт 80 открыт
✓ Порт 443 открыт
✗ Nginx не отвечает

Проверяю статус nginx...
✗ Процесс nginx не запущен

Читаю лог ошибок nginx...
Найдено: "nginx: [emerg] unexpected '}' in /etc/nginx/sites-enabled/default:47"

Проблема найдена: В конфиге nginx синтаксическая ошибка в строке 47.

Исправь опечатку, потом я перезагружу nginx.
Или: хочешь восстановить вчерашний рабочий конфиг?

30 секунд от «сайт не работает» до точного понимания что чинить.

Сценарий 2: «Всё тормозит»

Почему всё так тормозит?
Проверяю...

CPU: 23% (норма)
Диск: 45% занято (норма)
RAM: 94% занято ⚠️

Нашёл проблему: процесс node.js жрёт 3.2GB RAM

Проверяю логи на ошибки памяти...
Найдено: 127 предупреждений 'JavaScript heap out of memory'
Начались: 2 часа назад (сразу после деплоя)

Диагноз: Утечка памяти, скорее всего появилась в последнем деплое.

Варианты:
1. Перезапустить сервис сейчас (быстрый фикс, утечка вернётся)
2. Откатить на предыдущую версию (безопаснее)
3. Показать мне diff коммита чтобы найти утечку

Что делаем?

Реальный анализ. Несколько вариантов. Контроль у тебя.

Начни снаружи, потом подключи изнутри

STEP 01: Запусти проверку снаружи

Сначала проверь публичный URL. Без регистрации, без агента, без доступа к серверу.

STEP 02: Подключи агента

Когда нужны факты изнутри сервера, создай аккаунт и установи outbound-агента на VPS.

curl -sL https://mttrly.com/install.sh | bash -s -- -t YOUR_TOKEN

Инсталлер создаёт outbound-only агента. Если хочешь проверить точные изменения, посмотри скрипт перед запуском.

STEP 03: Работай через апрувы

Используй дашборд, Telegram или MCP-инструменты, чтобы расследовать, подтверждать рискованные изменения и сохранять журнал аудита.

Твой сервер, твой контроль

Подтверждай там, где работаешь

Апрувы в дашборде используют passkey для биометрического подтверждения. Telegram остаётся доступен на ходу. MCP и мессенджеры работают по отдельным trust-моделям.

Не прямой SSH

Выполнение команд есть как ограниченное MCP-действие с подтверждением и аудитом. Обычный путь — диагностика, playbooks и серверные инструменты, а не свободный терминал для AI.

BYOK — твой AI, твои расходы

Приноси свой ключ OpenAI/Anthropic. Без наценки, прозрачные расходы. Или используй нашу AI-инфраструктуру (3900₽/мес включает AI).

Не нужно открывать порты

Агент подключается только наружу. Файрвол остаётся закрытым. Нулевая поверхность атаки.

MCP-интеграция

Работает из твоей IDE.

Подключи mttrly к Claude Code, Cursor или OpenAI Codex через Model Context Protocol. Проверяй алерты, запускай диагностику, смотри факты и запрашивай действия с подтверждением, не выходя из редактора.

Все 40 инструментов
Claude Codeclaude mcp add mttrly --transport http https://api.mttrly.com/mcp
Cursor{ "mcpServers": { "mttrly": { "url": "https://api.mttrly.com/mcp" } } }
OpenAI Codex[mcp_servers.mttrly] url = "https://api.mttrly.com/mcp"

Работает в продакшене

204,594
автоматизированных команд выполнено
48.9%
инцидентов решено автоматически
37,276
проверок здоровья
15.6%
потребовали подтверждения человеком

Production-метрики внутренней инфраструктуры, март 2026.

Частые вопросы

Перестань бояться продакшена.

Начни с того, что видно интернету. Подключи агента, когда понадобятся факты изнутри сервера и фиксы с подтверждением.

Проверка снаружи без регистрации • Watchdog бесплатно • AI-функции от 3900₽/мес