Skip to content

Argus MCP & Plugin Integration Architecture

PhD-Level Analysis: The Intelligent SDLC/STLC Interface Layer

Version: 3.0 Date: 2026-01-29 Status: Production Implementation Review


Executive Summary

Argus is not a testing tool — it's an AI-powered Quality Intelligence Platform that serves as "Jarvis for engineering organizations." The MCP server and Claude Code plugin form the critical human-AI interface layer that connects developers directly to:

  • 73 MCP tools exposing full platform capabilities
  • 27 specialized AI agents for autonomous task execution
  • 60+ API endpoints for every SDLC/STLC operation
  • 10+ data source integrations (Sentry, Jira, GitHub, Datadog, etc.)
  • Real-time knowledge graph (Cognee + FalkorDB + Neo4j)
  • Multi-tier intelligence (Cache → Vector → Graph → LLM)

1. Current Implementation Status

1.1 MCP Server: 73 Tools Implemented ✅

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           ARGUS MCP SERVER - 73 TOOLS                                        │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│  AUTHENTICATION (4)                 BROWSER TESTING (7)                                     │
│  ├─ argus_auth                      ├─ argus_health                                         │
│  ├─ argus_auth_complete             ├─ argus_discover                                       │
│  ├─ argus_auth_status               ├─ argus_act                                            │
│  └─ argus_auth_logout               ├─ argus_test                                           │
│                                     ├─ argus_extract                                        │
│  QUALITY INTELLIGENCE (3)           ├─ argus_agent                                          │
│  ├─ argus_quality_score             └─ argus_generate_test                                  │
│  ├─ argus_quality_stats                                                                      │
│  └─ argus_risk_scores               PRODUCTION EVENTS (4)                                   │
│                                     ├─ argus_events                                          │
│  TEST MANAGEMENT (2)                ├─ argus_event_triage                                   │
│  ├─ argus_tests                     ├─ argus_test_from_event                                │
│  └─ argus_test_review               └─ argus_batch_generate                                 │
│                                                                                              │
│  SELF-HEALING (4)                   SMART INSIGHTS (4)                                      │
│  ├─ argus_healing_config            ├─ argus_what_to_test                                   │
│  ├─ argus_healing_patterns          ├─ argus_coverage_gaps                                  │
│  ├─ argus_healing_stats             ├─ argus_dashboard                                      │
│  └─ argus_healing_review            └─ argus_ask                                            │
│                                                                                              │
│  SYNCHRONIZATION (4)                TEST EXPORT (4)                                         │
│  ├─ argus_sync_push                 ├─ argus_export                                         │
│  ├─ argus_sync_pull                 ├─ argus_export_languages                               │
│  ├─ argus_sync_status               ├─ argus_recording_to_test                              │
│  └─ argus_sync_resolve              └─ argus_recording_snippet                              │
│                                                                                              │
│  COLLABORATION (2)                  DISCOVERY (4)                                           │
│  ├─ argus_presence                  ├─ argus_discovery_start                                │
│  └─ argus_comments                  ├─ argus_discovery_flows                                │
│                                     ├─ argus_discovery_generate                             │
│  TIME TRAVEL (5)                    └─ argus_discovery_compare                              │
│  ├─ argus_time_travel_checkpoints                                                            │
│  ├─ argus_time_travel_history       CI/CD INTEGRATION (4)                                   │
│  ├─ argus_time_travel_replay        ├─ argus_cicd_test_impact                               │
│  ├─ argus_time_travel_fork          ├─ argus_cicd_deployment_risk                           │
│  └─ argus_time_travel_compare       ├─ argus_cicd_builds                                    │
│                                     └─ argus_cicd_pipelines                                 │
│  CORRELATIONS (4)                                                                            │
│  ├─ argus_correlations_timeline     API TESTING (3)                                         │
│  ├─ argus_correlations_root_cause   ├─ argus_api_discover                                   │
│  ├─ argus_correlations_insights     ├─ argus_api_generate                                   │
│  └─ argus_correlations_query        └─ argus_api_run                                        │
│                                                                                              │
│  SCHEDULING (4)                     VISUAL AI (5)                                           │
│  ├─ argus_schedule_create           ├─ argus_visual_capture                                 │
│  ├─ argus_schedule_list             ├─ argus_visual_compare                                 │
│  ├─ argus_schedule_run              ├─ argus_visual_baseline                                │
│  └─ argus_schedule_history          ├─ argus_visual_baselines                               │
│                                     └─ argus_visual_analyze                                 │
│  INFRASTRUCTURE (5)                                                                          │
│  ├─ argus_infra_overview            PROJECTS (1)                                            │
│  ├─ argus_infra_recommendations     └─ argus_projects                                       │
│  ├─ argus_infra_apply                                                                        │
│  ├─ argus_browser_pool                                                                       │
│  └─ argus_llm_usage                                                                          │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

1.2 Backend Agents: 27 Implemented ✅

Tier Agent Purpose Status
Core CodeAnalyzerAgent AST-based codebase analysis
Core TestPlannerAgent STAMP framework test specs
Core UITesterAgent v2 Browser pool testing
Core APITesterAgent Schema validation
Core DBTesterAgent Data integrity
Core SelfHealerAgent 4-mode healing (99.9%)
Core ReporterAgent Multi-format reports
Quality PerformanceAnalyzerAgent Core Web Vitals
Quality SecurityScannerAgent OWASP Top 10
Quality AccessibilityCheckerAgent WCAG 2.1
Quality VisualAIAgent Screenshot comparison
Quality FlakyTestDetector Statistical flakiness
Quality QualityAuditorAgent Code quality
Intelligence ReporterAgent Report generation
Intelligence RouterAgent Multi-model routing
Intelligence TestImpactAnalyzerAgent Change impact
Intelligence MRAnalyzerAgent PR analysis
Intelligence NLPTestCreatorAgent Plain English → tests
Intelligence RootCauseAnalyzerAgent Failure diagnosis
Advanced AutoDiscoveryAgent App crawling
Advanced SessionToTestAgent Recording → test
Orchestration SupervisorAgent Multi-agent coordination

1.3 Integrations: 13+ Platforms ✅

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           INTEGRATION STATUS                                                 │
├──────────────────────┬───────────────┬───────────────────────────────────────────────────────┤
│  Platform            │  Status       │  Capabilities                                         │
├──────────────────────┼───────────────┼───────────────────────────────────────────────────────┤
│  GitHub              │  ✅ Complete  │  PRs, Issues, Webhooks, Check Runs, Actions           │
│  GitLab              │  ✅ Complete  │  MRs, Pipelines, Webhooks                             │
│  Jira                │  ✅ Complete  │  Issues, Stories, Acceptance Criteria, Comments       │
│  Linear              │  ✅ Complete  │  Issues, Projects, Cycles                             │
│  Sentry              │  ✅ Complete  │  Errors, Stack Traces, Fingerprints                   │
│  Datadog             │  ✅ Complete  │  APM, Metrics, Session Replay (via Hub)               │
│  New Relic           │  ✅ Complete  │  APM, Analytics (via Hub)                             │
│  Slack               │  ✅ Complete  │  Notifications, Alerts, Reports                       │
│  PagerDuty           │  ✅ Complete  │  Incidents, Correlation                               │
│  Vercel              │  ✅ Complete  │  Deployments, Preview URLs                            │
│  LaunchDarkly        │  ✅ Complete  │  Feature Flags, Conditional Testing                   │
│  Amplitude           │  ✅ Complete  │  Product Analytics, User Journeys                     │
│  Confluence          │  🔄 Partial   │  Read-only, Needs Full Sync                           │
│  FullStory           │  📋 Planned   │  Session Replay to Test                               │
│  PostHog             │  📋 Planned   │  Product Analytics                                    │
└──────────────────────┴───────────────┴───────────────────────────────────────────────────────┘

2. MCP Architecture Deep Dive

2.1 Deployment Architecture

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           MCP SERVER DEPLOYMENT                                              │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│   AI IDE (Claude Code / Cursor / Windsurf / VS Code)                                        │
│                              │                                                               │
│                              │ MCP Protocol (SSE / Streamable-HTTP)                          │
│                              ▼                                                               │
│   ┌──────────────────────────────────────────────────────────────────────────────────────┐  │
│   │                    ARGUS MCP SERVER (Cloudflare Workers)                              │  │
│   │                                                                                        │  │
│   │   ┌────────────────────────────────────────────────────────────────────────────────┐ │  │
│   │   │  AUTHENTICATION LAYER                                                           │ │  │
│   │   │  • OAuth2 Device Flow (user authentication)                                     │ │  │
│   │   │  • JWT Signing (browser pool access)                                            │ │  │
│   │   │  • Token Storage (Durable Objects + KV)                                         │ │  │
│   │   └────────────────────────────────────────────────────────────────────────────────┘ │  │
│   │                                                                                        │  │
│   │   ┌────────────────────────────────────────────────────────────────────────────────┐ │  │
│   │   │  TOOL ROUTER (73 Tools)                                                         │ │  │
│   │   │  • Input validation (Zod schemas)                                               │ │  │
│   │   │  • Activity logging (non-blocking)                                              │ │  │
│   │   │  • Error handling (auth-aware)                                                  │ │  │
│   │   └────────────────────────────────────────────────────────────────────────────────┘ │  │
│   │                                                                                        │  │
│   │   ┌────────────────────────────────────────────────────────────────────────────────┐ │  │
│   │   │  STORAGE LAYER                                                                  │ │  │
│   │   │  • R2 Bucket (screenshots with signed URLs)                                     │ │  │
│   │   │  • Durable Objects (session state)                                              │ │  │
│   │   │  • KV Namespace (cross-session tokens)                                          │ │  │
│   │   └────────────────────────────────────────────────────────────────────────────────┘ │  │
│   │                                                                                        │  │
│   └──────────────────────────────────────────────────────────────────────────────────────┘  │
│                              │                                                               │
│              ┌───────────────┴───────────────┐                                              │
│              ▼                               ▼                                              │
│   ┌─────────────────────────┐     ┌─────────────────────────┐                              │
│   │  BROWSER POOL (Vultr)   │     │  BRAIN API (Railway)    │                              │
│   │                         │     │                         │                              │
│   │  • Selenium Grid        │     │  • 60+ API Endpoints    │                              │
│   │  • JWT Authentication   │     │  • 27 AI Agents         │                              │
│   │  • Screenshot Capture   │     │  • LangGraph Orchestr.  │                              │
│   │  • Action Execution     │     │  • Cognee Knowledge     │                              │
│   │  • Element Discovery    │     │  • Multi-tier Intel.    │                              │
│   │                         │     │                         │                              │
│   └─────────────────────────┘     └─────────────────────────┘                              │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

2.2 MCP Tool Categories by SDLC Phase

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           MCP TOOLS BY SDLC PHASE                                            │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│  PLANNING                          DEVELOPMENT                     TESTING                  │
│  ───────                           ──────────                      ───────                  │
│  argus_ask                         argus_api_discover              argus_test               │
│  argus_what_to_test                argus_api_generate              argus_act                │
│  argus_coverage_gaps               argus_discovery_start           argus_discover           │
│  argus_correlations_insights       argus_discovery_flows           argus_extract            │
│  argus_dashboard                   argus_recording_snippet         argus_visual_compare     │
│                                    argus_generate_test             argus_visual_capture     │
│                                    argus_recording_to_test         argus_api_run            │
│                                                                    argus_agent              │
│                                                                                              │
│  CI/CD                             MONITORING                      MAINTENANCE              │
│  ─────                             ──────────                      ───────────              │
│  argus_cicd_test_impact            argus_events                    argus_healing_patterns   │
│  argus_cicd_deployment_risk        argus_event_triage              argus_healing_review     │
│  argus_cicd_builds                 argus_quality_score             argus_healing_stats      │
│  argus_cicd_pipelines              argus_quality_stats             argus_sync_push          │
│  argus_schedule_create             argus_risk_scores               argus_sync_pull          │
│  argus_schedule_run                argus_infra_overview            argus_time_travel_*      │
│                                    argus_browser_pool                                       │
│                                    argus_llm_usage                                          │
│                                                                                              │
│  COLLABORATION                     ANALYSIS                                                 │
│  ─────────────                     ────────                                                 │
│  argus_presence                    argus_correlations_timeline                              │
│  argus_comments                    argus_correlations_root_cause                            │
│  argus_test_review                 argus_correlations_query                                 │
│  argus_projects                    argus_visual_analyze                                     │
│                                    argus_test_from_event                                    │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

2.3 Data Flow: MCP → Brain → Knowledge Graph

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           INTELLIGENCE QUERY FLOW                                            │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│   Developer in IDE                                                                           │
│   ────────────────                                                                           │
│   "Why did this test fail?"                                                                  │
│           │                                                                                  │
│           ▼                                                                                  │
│   ┌───────────────────────┐                                                                  │
│   │  MCP: argus_ask       │                                                                  │
│   │  or argus_event_triage│                                                                  │
│   └───────────┬───────────┘                                                                  │
│               │                                                                              │
│               ▼                                                                              │
│   ┌───────────────────────────────────────────────────────────────────────────────────────┐ │
│   │  BRAIN API: Query Router (src/intelligence/query_router.py)                           │ │
│   │                                                                                        │ │
│   │  Step 1: Intent Classification (Workers AI - <10ms)                                    │ │
│   │  ────────────────────────────────────────────────                                      │ │
│   │  • SIMILAR_ERRORS: "Find failures like this"                                           │ │
│   │  • ROOT_CAUSE: "Why did this fail?"                                                    │ │
│   │  • TEST_IMPACT: "What tests for this file?"                                            │ │
│   │  • HEALING: "How to fix this selector?"                                                │ │
│   │  • COVERAGE_GAP: "What's not tested?"                                                  │ │
│   │  • RISK_SCORE: "How risky is this change?"                                             │ │
│   │  • DOCUMENTATION: "What does this feature do?"                                         │ │
│   │                                                                                        │ │
│   │  Step 2: Tiered Resolution                                                             │ │
│   │  ────────────────────────                                                              │ │
│   │                                                                                        │ │
│   │  ┌─────────────┐    ┌─────────────┐    ┌─────────────┐    ┌─────────────┐            │ │
│   │  │  TIER 1     │    │  TIER 2     │    │  TIER 3     │    │  TIER 4     │            │ │
│   │  │  Cache      │───▶│  Vector     │───▶│  Graph      │───▶│  LLM        │            │ │
│   │  │  (Valkey)   │    │  (pgvector) │    │  (Cognee)   │    │  (Claude)   │            │ │
│   │  │  <5ms       │    │  <50ms      │    │  <200ms     │    │  3-15s      │            │ │
│   │  │  100% conf  │    │  >0.85 conf │    │  >0.7 conf  │    │  Fallback   │            │ │
│   │  └─────────────┘    └─────────────┘    └─────────────┘    └─────────────┘            │ │
│   │        │                  │                  │                  │                      │ │
│   │        └──────────────────┴──────────────────┴──────────────────┘                      │ │
│   │                                   │                                                     │ │
│   │                                   ▼                                                     │ │
│   │                          Confidence-Based Exit                                          │ │
│   │                          (Stop at first tier with conf > threshold)                    │ │
│   │                                                                                        │ │
│   └───────────────────────────────────────────────────────────────────────────────────────┘ │
│               │                                                                              │
│               ▼                                                                              │
│   ┌───────────────────────┐                                                                  │
│   │  Response to IDE      │                                                                  │
│   │  • Answer/Suggestion  │                                                                  │
│   │  • Source tier        │                                                                  │
│   │  • Confidence score   │                                                                  │
│   │  • Latency            │                                                                  │
│   └───────────────────────┘                                                                  │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

3. Knowledge Graph Architecture (Cognee)

3.1 Multi-Source Data Ingestion

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           COGNEE DATA PIPELINE                                               │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│  DATA SOURCES                                                                                │
│  ───────────                                                                                 │
│                                                                                              │
│  ┌───────────┐ ┌───────────┐ ┌───────────┐ ┌───────────┐ ┌───────────┐ ┌───────────┐      │
│  │  GitHub   │ │   Jira    │ │  Sentry   │ │  Datadog  │ │ Confluence│ │  Tests    │      │
│  │  PRs      │ │  Issues   │ │  Errors   │ │  APM      │ │  Docs     │ │  Results  │      │
│  └─────┬─────┘ └─────┬─────┘ └─────┬─────┘ └─────┬─────┘ └─────┬─────┘ └─────┬─────┘      │
│        │             │             │             │             │             │              │
│        └─────────────┴─────────────┴─────────────┴─────────────┴─────────────┘              │
│                                          │                                                   │
│                                          ▼                                                   │
│  ┌───────────────────────────────────────────────────────────────────────────────────────┐  │
│  │                        REDPANDA (Kafka Topics)                                         │  │
│  │                                                                                        │  │
│  │  argus.codebase.ingested    argus.test.created     argus.test.completed               │  │
│  │  argus.healing.event        argus.integration.*    argus.dlq.*                        │  │
│  │                                                                                        │  │
│  └───────────────────────────────────────────────────────────────────────────────────────┘  │
│                                          │                                                   │
│                                          ▼                                                   │
│  ┌───────────────────────────────────────────────────────────────────────────────────────┐  │
│  │                        COGNEE WORKER (ECL Pipeline)                                    │  │
│  │                                                                                        │  │
│  │  ┌──────────────────────────────────────────────────────────────────────────────────┐│  │
│  │  │  EXTRACT                                                                          ││  │
│  │  │  • Parse JSON/YAML/XML                                                            ││  │
│  │  │  • Extract text from docs                                                         ││  │
│  │  │  • Parse code ASTs                                                                ││  │
│  │  │  • Extract entities (files, functions, tests, errors, tickets)                    ││  │
│  │  └──────────────────────────────────────────────────────────────────────────────────┘│  │
│  │                                          │                                             │  │
│  │  ┌──────────────────────────────────────────────────────────────────────────────────┐│  │
│  │  │  COGNIFY (AI Enhancement)                                                         ││  │
│  │  │  • Generate embeddings (nomic-embed-text / text-embedding-3-small)                ││  │
│  │  │  • Classify data types & intents                                                  ││  │
│  │  │  • Extract relationships (file→test, error→code, ticket→PR)                      ││  │
│  │  │  • Detect patterns (flaky tests, recurring errors)                                ││  │
│  │  │  • Compute risk scores                                                            ││  │
│  │  └──────────────────────────────────────────────────────────────────────────────────┘│  │
│  │                                          │                                             │  │
│  │  ┌──────────────────────────────────────────────────────────────────────────────────┐│  │
│  │  │  LOAD                                                                             ││  │
│  │  │  • Store in PostgreSQL (structured data via Supabase)                             ││  │
│  │  │  • Store in pgvector (embeddings for semantic search)                             ││  │
│  │  │  • Store in FalkorDB (local knowledge graph)                                      ││  │
│  │  │  • Store in Neo4j Aura (cloud graph for complex queries)                          ││  │
│  │  │  • Store in Valkey (hot cache for frequent patterns)                              ││  │
│  │  │  • Store in R2/S3 (artifacts: screenshots, videos, logs)                          ││  │
│  │  └──────────────────────────────────────────────────────────────────────────────────┘│  │
│  │                                                                                        │  │
│  └───────────────────────────────────────────────────────────────────────────────────────┘  │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

3.2 Knowledge Graph Schema

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           UNIFIED KNOWLEDGE GRAPH                                            │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│   ENTITIES                              RELATIONSHIPS                                        │
│   ────────                              ─────────────                                        │
│                                                                                              │
│   • File (code, test, config)           • File TESTS_FOR File                               │
│   • Function                            • Commit MODIFIES File                              │
│   • Class                               • Error OCCURS_IN File                              │
│   • Commit                              • Ticket REFERENCES Commit                          │
│   • PullRequest                         • User AUTHORED Commit                              │
│   • Test                                • Build DEPLOYS_TO Environment                      │
│   • TestRun                             • Test FLAKY_IN Environment                         │
│   • TestResult                          • Pattern HEALS Error                               │
│   • Error                               • Session TRIGGERS Error                            │
│   • StackTrace                          • Document DESCRIBES Feature                        │
│   • Ticket (Jira/Linear)                • Test COVERS Function                              │
│   • User                                • File DEPENDS_ON File                              │
│   • Team                                • PR CLOSES Ticket                                  │
│   • Deployment                          • Flag AFFECTS Test                                 │
│   • Environment                         • Incident CAUSED_BY Error                          │
│   • HealingPattern                                                                           │
│   • UserSession                                                                              │
│   • Document                                                                                 │
│   • FeatureFlag                                                                              │
│   • Incident                                                                                 │
│                                                                                              │
│   VECTOR INDICES (pgvector)                                                                  │
│   ────────────────────────                                                                   │
│   • Code embeddings (semantic code search)                                                   │
│   • Error embeddings (similar error matching)                                                │
│   • Document embeddings (knowledge search)                                                   │
│   • Test embeddings (test similarity)                                                        │
│   • Healing pattern embeddings (fix matching)                                                │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

4. Cross-Source Pattern Analysis

4.1 Implemented Correlation Types

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           CROSS-SOURCE CORRELATIONS (Implemented)                            │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│  PATTERN 1: ERROR → ROOT CAUSE                                                              │
│  ─────────────────────────────                                                              │
│                                                                                              │
│    Sentry Error ──┬── Stack Trace ──── Code File ──── Recent Commit ──── Author             │
│                   │                                                                          │
│                   └── Similar Errors ──── Past Fixes ──── Healing Pattern                   │
│                                                                                              │
│    MCP Tool: argus_correlations_root_cause, argus_event_triage                              │
│    Backend: RootCauseAnalyzerAgent + Cognee graph traversal                                 │
│                                                                                              │
│  ────────────────────────────────────────────────────────────────────────────────────────── │
│                                                                                              │
│  PATTERN 2: CODE CHANGE → TEST IMPACT                                                       │
│  ───────────────────────────────────                                                        │
│                                                                                              │
│    PR Files ──┬── Modified Functions ──── Tests Covering Functions                          │
│               │                                                                              │
│               └── Dependency Graph ──── Transitive Test Dependencies                        │
│                                                                                              │
│    MCP Tool: argus_cicd_test_impact                                                         │
│    Backend: TestImpactAnalyzerAgent + Precomputed Matrix (Flink)                            │
│    Latency: 20-50ms (precomputed) vs 2-3s (LLM fallback)                                    │
│                                                                                              │
│  ────────────────────────────────────────────────────────────────────────────────────────── │
│                                                                                              │
│  PATTERN 3: PRODUCTION ERROR → TEST GAP                                                     │
│  ─────────────────────────────────────                                                      │
│                                                                                              │
│    Sentry Error ──── Code Location ──── Test Coverage Check ──── No Test Found              │
│                                                                          │                   │
│                                                       argus_test_from_event                  │
│                                                                          │                   │
│                                                       Auto-Generate Test                     │
│                                                                                              │
│    MCP Tool: argus_coverage_gaps, argus_test_from_event                                     │
│    Backend: Production event indexing + Coverage analysis                                    │
│                                                                                              │
│  ────────────────────────────────────────────────────────────────────────────────────────── │
│                                                                                              │
│  PATTERN 4: FLAKY TEST → ROOT CAUSE                                                         │
│  ─────────────────────────────────                                                          │
│                                                                                              │
│    Test Run History ──── Pass/Fail Pattern ──── Environment Correlation                     │
│                │                                                                             │
│                └── Time of Day ──── Load Metrics ──── External Dependencies                 │
│                                                                                              │
│    MCP Tool: argus_healing_patterns (flaky detection)                                       │
│    Backend: FlakyTestDetectorAgent + Statistical analysis                                   │
│                                                                                              │
│  ────────────────────────────────────────────────────────────────────────────────────────── │
│                                                                                              │
│  PATTERN 5: DEPLOYMENT → RISK ASSESSMENT                                                    │
│  ──────────────────────────────────────                                                     │
│                                                                                              │
│    PR Changes ──┬── Historical Bug Rate of Files                                            │
│                 │                                                                            │
│                 ├── Test Coverage Delta                                                      │
│                 │                                                                            │
│                 ├── Author's Past Success Rate                                              │
│                 │                                                                            │
│                 └── Missing Acceptance Criteria                                             │
│                                                                                              │
│    MCP Tool: argus_cicd_deployment_risk, argus_risk_scores                                  │
│    Backend: Multi-source correlation (GitHub + Jira + Test Results)                         │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

5. Tiered Deployment Model

5.1 MCP/Plugin Behavior by Tier

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           MCP/PLUGIN CAPABILITIES BY TIER                                    │
├──────────────────┬──────────────────────────────────────────────────────────────────────────┤
│                  │                                                                           │
│  FREE            │  FULL MCP ACCESS (73 tools)                                              │
│  ($0)            │  • All tools available (rate-limited)                                    │
│                  │  • Cloud processing only                                                 │
│                  │  • 100 tests/month                                                       │
│                  │  • Shared healing patterns (cross-tenant anonymized)                     │
│                  │  • Basic Cognee queries                                                  │
│                  │                                                                           │
├──────────────────┼──────────────────────────────────────────────────────────────────────────┤
│                  │                                                                           │
│  STARTER         │  FULL MCP ACCESS + GitHub Integration                                    │
│  ($49/mo)        │  • argus_cicd_* tools enabled                                            │
│                  │  • Slack notifications via argus_ask                                     │
│                  │  • 500 tests/month                                                       │
│                  │  • Higher rate limits                                                    │
│                  │                                                                           │
├──────────────────┼──────────────────────────────────────────────────────────────────────────┤
│                  │                                                                           │
│  PRO             │  FULL MCP + Local MCP Server Option                                      │
│  ($99/mo)        │  • Docker deployment available                                           │
│                  │  • Local code indexing (src/mcp/local_mcp_server.py)                     │
│                  │  • Code never leaves machine (privacy mode)                              │
│                  │  • BYOK (Bring Your Own Key) for LLM                                     │
│                  │  • 2,000 tests/month                                                     │
│                  │  • Git-aware self-healing (99.9% accuracy)                               │
│                  │                                                                           │
├──────────────────┼──────────────────────────────────────────────────────────────────────────┤
│                  │                                                                           │
│  TEAM            │  FULL MCP + Team Collaboration                                           │
│  ($299/mo)       │  • argus_presence, argus_comments enabled                                │
│                  │  • SSO integration (Okta, Azure AD)                                      │
│                  │  • Dedicated Supabase namespace                                          │
│                  │  • Private cloud option                                                  │
│                  │  • Cross-project pattern sharing                                         │
│                  │  • 10,000 tests/month                                                    │
│                  │                                                                           │
├──────────────────┼──────────────────────────────────────────────────────────────────────────┤
│                  │                                                                           │
│  ENTERPRISE      │  SELF-HOSTED MCP + Brain                                                 │
│  (Custom)        │  • Deploy entire stack on-premise (K8s/OpenShift)                        │
│                  │  • On-premise Ollama/vLLM option                                         │
│                  │  • Zero external calls possible                                          │
│                  │  • Custom model routing                                                  │
│                  │  • SAML 2.0 SSO                                                          │
│                  │  • Unlimited tests                                                       │
│                  │                                                                           │
├──────────────────┼──────────────────────────────────────────────────────────────────────────┤
│                  │                                                                           │
│  AIR-GAPPED      │  100% LOCAL OPERATION                                                    │
│  (Custom)        │  • No internet required                                                  │
│                  │  • Local LLM only (Llama 3, Mistral)                                     │
│                  │  • Offline license activation                                            │
│                  │  • HSM-backed encryption                                                 │
│                  │  • STIG-hardened containers                                              │
│                  │                                                                           │
└──────────────────┴──────────────────────────────────────────────────────────────────────────┘

5.2 Local MCP Server Architecture (Pro+)

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           LOCAL MCP SERVER (Privacy Mode)                                    │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│   DEVELOPER MACHINE                                                                          │
│   ─────────────────                                                                          │
│                                                                                              │
│   ┌───────────────────────────────────────────────────────────────────────────────────────┐ │
│   │                        LOCAL MCP SERVER (src/mcp/local_mcp_server.py)                  │ │
│   │                                                                                        │ │
│   │   ┌────────────────────────────────────────────────────────────────────────────────┐ │ │
│   │   │  LOCAL ANALYSIS (Code Never Leaves)                                             │ │ │
│   │   │                                                                                  │ │ │
│   │   │  • Tree-sitter AST parsing (all languages)                                      │ │ │
│   │   │  • Merkle tree change detection                                                 │ │ │
│   │   │  • Local embeddings (nomic-embed via Ollama)                                    │ │ │
│   │   │  • Semantic chunking                                                            │ │ │
│   │   │  • Test mapping                                                                 │ │ │
│   │   │  • Git history analysis                                                         │ │ │
│   │   └────────────────────────────────────────────────────────────────────────────────┘ │ │
│   │                                                                                        │ │
│   │   ┌────────────────────────────────────────────────────────────────────────────────┐ │ │
│   │   │  LOCAL STORAGE                                                                  │ │ │
│   │   │                                                                                  │ │ │
│   │   │  • SQLite (structured data)                                                     │ │ │
│   │   │  • LanceDB (vector embeddings)                                                  │ │ │
│   │   │  • Local file index                                                             │ │ │
│   │   └────────────────────────────────────────────────────────────────────────────────┘ │ │
│   │                                                                                        │ │
│   │   ┌────────────────────────────────────────────────────────────────────────────────┐ │ │
│   │   │  CLOUD SYNC (Metadata Only)                                                     │ │ │
│   │   │                                                                                  │ │ │
│   │   │  • Test results (no code)                                                       │ │ │
│   │   │  • Healing patterns (anonymized)                                                │ │ │
│   │   │  • Quality metrics                                                              │ │ │
│   │   │  • Obfuscated file paths (optional)                                             │ │ │
│   │   └────────────────────────────────────────────────────────────────────────────────┘ │ │
│   │                                                                                        │ │
│   └───────────────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                              │
│   Key Files:                                                                                 │
│   • src/mcp/local_mcp_server.py (MCP stdio server)                                          │
│   • src/indexer/tree_sitter_parser.py (AST parsing)                                         │
│   • src/indexer/merkle_tree.py (change detection)                                           │
│   • src/indexer/local_embedder.py (on-device embeddings)                                    │
│   • src/indexer/semantic_chunker.py (code splitting)                                        │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

6. Linear: Recent Completions (Last 7 Days)

6.1 MCP Tools Sprint (RAP-276 → RAP-282) ✅

All 7 MCP tool expansions completed: - RAP-276: CI/CD Integration (4 tools) - Urgent ✅ - RAP-277: Discovery & Crawling (4 tools) - High ✅ - RAP-278: Time Travel Debugging (5 tools) - High ✅ - RAP-279: Visual AI Testing (5 tools) - Medium ✅ - RAP-280: Scheduling & Automation (4 tools) - Medium ✅ - RAP-281: Correlation & Analytics (4 tools) - Medium ✅ - RAP-282: API Testing (3 tools) - Medium ✅

6.2 Intelligence Layer (UIIL) Sprint (RAP-236 → RAP-250) ✅

All 15 intelligence layer tickets completed: - RAP-236: Intelligence cache module (Valkey wrapper) ✅ - RAP-237: AI Gateway caching (90% latency reduction) ✅ - RAP-238: Query router with intent detection ✅ - RAP-239: Sentry integration topic/handler ✅ - RAP-240: Precomputed results table migration ✅ - RAP-241: precomputed.py reader module ✅ - RAP-242: Jira integration handler ✅ - RAP-243: GitHub PR integration handler ✅ - RAP-244: Confluence integration handler ✅ - RAP-245: Flink test impact precomputation ✅ - RAP-246: Flink failure clustering job ✅ - RAP-247: Workers AI for intent classification ✅ - RAP-248: Vectorize edge vector search ✅ - RAP-249: Healing API intelligence layer ✅ - RAP-250: CI/CD API precomputed matrix ✅

6.3 Agent Evaluation (Backlog)

Agent testing tickets created but not started: - RAP-257 to RAP-275: Individual agent tests (Tier 1-3)


7. Summary: What Argus Actually Is

┌─────────────────────────────────────────────────────────────────────────────────────────────┐
│                           ARGUS: QUALITY INTELLIGENCE PLATFORM                               │
├─────────────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                              │
│  NOT JUST TESTING → FULL SDLC/STLC INTELLIGENCE                                             │
│  ─────────────────────────────────────────────                                              │
│                                                                                              │
│  ┌─────────────────────────────────────────────────────────────────────────────────────┐   │
│  │                                                                                      │   │
│  │   INTERFACE LAYER                                                                    │   │
│  │   ───────────────                                                                    │   │
│  │   • MCP Server (73 tools, Cloudflare Workers)                                        │   │
│  │   • Claude Code Plugin                                                               │   │
│  │   • Cursor / Windsurf / VS Code support                                              │   │
│  │   • Dashboard (Next.js 15, 19 pages)                                                 │   │
│  │   • REST API (60+ endpoints)                                                         │   │
│  │                                                                                      │   │
│  └─────────────────────────────────────────────────────────────────────────────────────┘   │
│                                          │                                                   │
│                                          ▼                                                   │
│  ┌─────────────────────────────────────────────────────────────────────────────────────┐   │
│  │                                                                                      │   │
│  │   INTELLIGENCE LAYER                                                                 │   │
│  │   ──────────────────                                                                 │   │
│  │   • 27 AI Agents (specialized for different tasks)                                   │   │
│  │   • Multi-tier resolution (Cache → Vector → Graph → LLM)                             │   │
│  │   • Query router with intent classification                                          │   │
│  │   • Supervisor orchestration (LangGraph)                                             │   │
│  │   • Multi-model routing (13 providers)                                               │   │
│  │                                                                                      │   │
│  └─────────────────────────────────────────────────────────────────────────────────────┘   │
│                                          │                                                   │
│                                          ▼                                                   │
│  ┌─────────────────────────────────────────────────────────────────────────────────────┐   │
│  │                                                                                      │   │
│  │   KNOWLEDGE LAYER (Cognee)                                                           │   │
│  │   ────────────────────────                                                           │   │
│  │   • Unified knowledge graph (FalkorDB + Neo4j)                                       │   │
│  │   • Vector embeddings (pgvector)                                                     │   │
│  │   • Hot cache (Valkey)                                                               │   │
│  │   • Event streaming (Redpanda)                                                       │   │
│  │   • Stream processing (Flink)                                                        │   │
│  │                                                                                      │   │
│  └─────────────────────────────────────────────────────────────────────────────────────┘   │
│                                          │                                                   │
│                                          ▼                                                   │
│  ┌─────────────────────────────────────────────────────────────────────────────────────┐   │
│  │                                                                                      │   │
│  │   DATA SOURCES (10+ Categories)                                                      │   │
│  │   ─────────────────────────────                                                      │   │
│  │   • Code & VCS (GitHub, GitLab)                                                      │   │
│  │   • Project Management (Jira, Linear)                                                │   │
│  │   • Observability (Sentry, Datadog, New Relic)                                       │   │
│  │   • CI/CD (GitHub Actions, Vercel)                                                   │   │
│  │   • Documentation (Confluence)                                                       │   │
│  │   • Analytics (Amplitude, PostHog - planned)                                         │   │
│  │   • Communication (Slack)                                                            │   │
│  │   • Incidents (PagerDuty)                                                            │   │
│  │   • Feature Flags (LaunchDarkly)                                                     │   │
│  │   • Test Results (internal)                                                          │   │
│  │                                                                                      │   │
│  └─────────────────────────────────────────────────────────────────────────────────────┘   │
│                                                                                              │
│  KEY DIFFERENTIATORS                                                                         │
│  ───────────────────                                                                         │
│  1. MCP-first: AI IDE is the primary interface, not a web dashboard                         │
│  2. Privacy-preserving: Local MCP option keeps code on-device                               │
│  3. Multi-source intelligence: Correlates data across 10+ platforms                         │
│  4. Self-healing: 99.9% accuracy with git-aware healing                                     │
│  5. Tiered resolution: <5ms cache hits, <15% LLM fallback                                   │
│  6. Enterprise-ready: Air-gapped deployment, SOC2, HIPAA (roadmap)                          │
│                                                                                              │
└─────────────────────────────────────────────────────────────────────────────────────────────┘

8. Gaps & Roadmap

8.1 Current Gaps

Area Status Priority
SSO (SAML 2.0) 🔄 Needs Work High
Fine-grained RBAC 🔄 Needs Work High
SOC2 Type 2 Certification 🔄 In Progress High
Air-gapped packaging 📋 Planned Medium
FullStory integration 📋 Planned Medium
PostHog integration 📋 Planned Medium
Offline license activation 📋 Planned Low

8.2 Q1 2026 Roadmap (From Linear)

  • Complete agent evaluation tests (RAP-257 to RAP-275)
  • SSO integration (Okta, Azure AD)
  • Enhanced RBAC for Enterprise
  • SOC2 Type 2 audit completion
  • Local indexing MVP refinement

Document Author: Claude (Analysis) Source: Argus Backend, Dashboard, MCP Server, argus-docs, Linear Confidence: High (based on actual code review)