Pourquoi AgentGuard ?

Un agent IA qui exécute du code, envoie des emails, ou accède à des bases de données amplifie les conséquences de chaque vulnérabilité. Une instruction malicieuse ne déclenche plus seulement une mauvaise réponse, mais une action irréversible. AgentGuard teste vos agents autonomes contre les techniques d'attaque connues sur les systèmes outillés.

Types d'agents supportés

Agents de support client

Assistants avec accès aux comptes utilisateurs, CRM, base de connaissances

Intercom · Zendesk · Agents personnalisés

Agents de développement

Agents capables de modifier du code, exécuter des commandes, créer des PR

GitHub Copilot · Cursor · Agents CI/CD

Agents de recherche & analyse

Agents qui naviguent sur le web, lisent des documents, produisent des rapports

Deep Research · Perplexity-style · Agents personnalisés

Agents d'orchestration

Agents qui coordonnent plusieurs sous-agents ou workflows automatisés

AutoGen · CrewAI · LangGraph · Agents multi-niveaux

Agents de commerce

Agents avec accès à des paiements, commandes, gestion d'inventaire

Agents e-commerce · Booking · Payment

Agents data & analytics

Agents avec accès aux bases de données, génération de SQL, exécution de queries

Text-to-SQL · BI agents · Agents analytiques

Agents de communication

Agents qui envoient des emails, messages, notifications automatisées

Email agents · Slack · Teams · Marketing automation

Agents système

Agents DevOps, SRE, gestion d'infrastructure cloud

Agents infra · K8s · AWS · Automation

Votre agent n'est pas listé ?

Si votre framework ou type d'agent n'apparaît pas ici, contactez-nous. Nous développons des modules de test sur demande.

Nous contacter →

Catégories d'attaques testées

Détournement d'outils

Manipulation de l'agent pour qu'il appelle des outils de manière inattendue ou avec des paramètres malveillants.

Dérive d'objectif

Tests pour détourner progressivement l'agent de sa mission initiale via des instructions intermédiaires.

Escalade de privilèges

Tentatives de faire accéder l'agent à des ressources ou outils au-delà de son périmètre autorisé.

Boucles infinies & exhaustion

Provoquer l'agent à entrer en boucle ou à consommer ses ressources jusqu'à épuisement.

Empoisonnement de mémoire

Injection d'informations malveillantes dans la mémoire long-terme de l'agent.

Détection de backdoor

Identification de comportements anormaux déclenchés par des triggers cachés dans les inputs.

Cross-agent contamination

Tests pour les architectures multi-agents : un agent compromis peut-il infecter les autres ?

Exfiltration de données

Tentatives de faire l'agent transmettre des données sensibles via ses outils (email, API externe, logs).

Bypass de confirmation humaine

Techniques pour contourner les étapes de validation humaine requises pour les actions critiques.

Démarrage en quelques commandes

# Installationpip install rednblue

# Test d'un agent autonomernb llm --file my_agent.py --attacks AGT

# Suite complète (LLM + Agent + RAG)rnb llm --file my_agent.py --all

# Mode autonome (agent multi-tool)rnb llm --file my_agent.py --mode autonomous --max-steps 20

Prêt à tester votre agent IA ?