OWASP LLM Top 10  ·  11 Suites  ·  102 Pruebas

Si tu agente
lo puede ver,
el atacante también.

Aegis prueba automáticamente tu agente de IA contra las 11 categorías OWASP LLM Top 10 — desde prompt injection hasta envenenamiento de MCP y abuso de herramientas — y entrega un informe de vulnerabilidades con evidencia, puntuación y recomendaciones.

Self-hosted · Tus datos nunca salen de tu infra Sin cuenta · Corre en tu infraestructura
assessment · report.json
// Evaluación completada ✓
 
"security_score": 6.84,
"overall_risk": "medium",
"total_tests": 102,
"vulnerable_tests": 21,
"blocked_by_filter": 14,
 
"category_results": [
{ "suite": "mcp_poisoning", "vuln": 4/7 },
{ "suite": "tool_abuse", "vuln": 5/8 },
{ "suite": "agent_trust", "vuln": 3/8 },
{ "suite": "jailbreak", "vuln": 1/7 }
],
 
// Veredicto LLM: 18 CONFIRMADO, 3 FALSO POSITIVO
// Informe PDF → /report/pdf
0 Categorías OWASP
0 Pruebas de seguridad
0–10 Puntuación de riesgo
0 Nuevas suites agentivas
01
El Problema

Los Agentes de IA se Despliegan Sin Pruebas de Seguridad

Los equipos pasan semanas ajustando prompts pero despliegan agentes en producción sin ninguna prueba adversarial. Con herramientas externas, acceso a MCP y operaciones autónomas, el impacto de una brecha es mucho mayor.

P-01

Ataques agentivos sin cubrir

Los scanners clásicos no prueban envenenamiento de MCP, abuso de herramientas, inyección indirecta ni abuso de confianza entre agentes — las amenazas más críticas para agentes autónomos.

LLM01 · LLM07 · LLM08 · LLM09
P-02

PII y credenciales expuestas

Los agentes pueden ser manipulados para exfiltrar datos sensibles — números de tarjeta, contraseñas, API keys — codificados en base64, morse o vía webhooks aparentemente legítimos.

LLM06 · Data Exfiltration
P-03

Sin auditoría formal de seguridad

Los equipos de compliance no tienen evidencia estructurada de qué fue probado, qué fue encontrado ni qué necesita remediación para pasar una auditoría.

Compliance · SOC 2 · GDPR
02
Capacidades

Todo lo que necesitás para desplegar agentes con confianza

11 suites de prueba, 102 sondas, scoring honesto y verificación con LLM — en una sola herramienta.

LLM01–09 · OWASP

Cobertura OWASP LLM Top 10

11 suites que cubren las vulnerabilidades más críticas: prompt injection, jailbreaks, extracción de system prompt, PII leakage, output inseguro, agencia excesiva y los 5 vectores agentivos nuevos.

LLM01 LLM06LLM07 LLM08LLM09
Verificación · LLM Verdict

Veredicto LLM de Segunda Opinión

Un LLM independiente analiza cada hallazgo y emite un veredicto: CONFIRMADO, FALSO POSITIVO o INCONCLUSO. Reduce ruido y aumenta la confianza del reporte antes de presentarlo.

CONFIRMADO INCONCLUSO FALSO_POSITIVO
Reporting · PDF

Informes PDF Profesionales

Portada full-bleed, gauge de puntuación animado, tarjetas de hallazgos con borde de color por nivel de riesgo. Branding personalizable: logo, colores y pie de página desde la pantalla de configuración.

Portada con logo Score gauge Branding custom
Real-time · SSE

Resultados en Tiempo Real

Los hallazgos aparecen en el dashboard mientras la evaluación se ejecuta en segundo plano. Sin polling manual — el servidor envía eventos vía Server-Sent Events a medida que cada prueba completa.

Server-Sent Events Live findings Background runner
Azure · AI Foundry

Azure AI Foundry Native

Soporte de primera clase para Azure OpenAI y AI Foundry. Detecta automáticamente bloqueos por filtro de contenido vs. respuestas del modelo — nunca los confunde en el scoring.

cognitiveservices ai.azure.com Filter-aware
Scoring · CI/CD Badge

Scoring Honesto + Badges

El score 0–10 se calcula solo sobre pruebas que llegaron al modelo. Los bloqueos por filtro se rastrean por separado. Generá un badge SVG tipo shields.io para incrustar en tu README o pipeline.

0–10 escala SVG badge shields.io
Retest · Verificación

Retest Individual de Hallazgos

Reejecutá cualquier hallazgo con un click sin relanzar toda la evaluación. Útil para verificar si una remediación funcionó o para explorar variantes de un ataque específico.

Single retest Verificación rápida Sin full-scan
Dashboard · Analytics

Dashboard con Heatmap OWASP

Heatmap de categorías OWASP, funnel de ataques, sparklines históricas y comparación lado a lado entre evaluaciones. Visualizá evolución de seguridad en el tiempo.

Heatmap Attack funnel Comparar evaluaciones
Conectividad · HTTP

Cualquier Endpoint de Agente

Conectá cualquier agente HTTP o despliegue Azure AI Foundry. Sin cambios de SDK — solo URL del endpoint y credenciales. Backoff exponencial automático ante errores 429.

HTTP genérico Azure Foundry Rate-limit retry

"Los agentes autónomos tienen una superficie de ataque radicalmente distinta a los chatbots."

— Equipo Aegis
03
Seguridad Agentiva

5 nuevas suites para ataques específicos de agentes

Cada fuente de datos que el agente consume — resultados de búsqueda, documentos, respuestas de tools MCP, correos — puede ser envenenada con instrucciones maliciosas. Aegis simula exactamente esos ataques con payloads de framing empresarial realista, no lenguaje obviamente malicioso que los filtros de contenido ya bloquean.

Los 5 nuevos vectores se diseñaron siguiendo el enfoque 'red team realista': en lugar de pedirle al agente que ignore todas las instrucciones anteriores, los payloads usan framing de auditoría SOC 2, cumplimiento GDPR, pipelines de CI/CD y comunicaciones de orquestador — exactamente como lo haría un atacante real.

Esta frase es el origen de Aegis — y la razón de existir de estas cinco suites.

LLM01
Inyección Indirecta
Vía búsqueda web, documentos, emails y resultados de tools
LLM06
Exfiltración de Datos
Vía base64, morse, ROT13, URL embeds y volcados JSON
LLM07
Envenenamiento de MCP
Descripciones de tools, recursos, schemas JSON
LLM08
Abuso de Herramientas
Exfiltración por email, ejecución de shell, escritura en DB, webhooks
LLM09
Abuso de Confianza Multi-Agente
Suplantación de orquestador, proveedor de IA, consenso de pipeline
04
Cobertura Completa

Las 11 suites de prueba

Cobertura end-to-end del OWASP LLM Top 10, incluyendo los 5 vectores específicos de ataques agentivos.

01LLM01Prompt Injection26 pruebas
02LLM02System Prompt Extraction8 pruebas
03LLM03Jailbreak7 pruebas
04LLM04PII Leakage7 pruebas
05LLM05Output Handling7 pruebas
06LLM05+Excessive Agency8 pruebas
07LLM01Indirect Injection8 pruebas
08LLM06Data Exfiltration8 pruebas
09LLM07MCP Poisoning7 pruebas
10LLM08Tool Abuse8 pruebas
11LLM09Agent Trust Abuse8 pruebas
05
Cómo Funciona

Del endpoint al informe en minutos

Aegis gestiona todo el ciclo de evaluación — sin scripts, sin testing manual, sin setup más allá de las credenciales de tu agente.

01

Conectá tu agente

Ingresá la URL del endpoint y tu API key. Compatible con Azure AI Foundry (cognitiveservices, ai.azure.com) y cualquier endpoint HTTP compatible con OpenAI.

02

Seleccioná las suites

Elegí entre las 11 categorías OWASP LLM Top 10. Ejecutá las 102 sondas para una auditoría completa, o apuntá a clases de vulnerabilidad específicas.

03

La evaluación se ejecuta

Las sondas se lanzan de forma asíncrona. Los hallazgos llegan en tiempo real vía SSE. El rate limiting de Azure se maneja automáticamente con backoff exponencial.

04

Obtenés tu informe

Revisá hallazgos en el dashboard con evidencia completa. El veredicto LLM filtra falsos positivos. Descargá el PDF con tu branding para compliance o briefings.

Arquitectura del flujo
Tu Agente
Cualquier endpoint HTTP · Azure AI Foundry
Aegis
102 sondas de seguridad · SSE real-time
Veredicto LLM
Segunda opinión · Filtro de falsos positivos
Dashboard
Score · Hallazgos · Heatmap OWASP
PDF Export
Informe con branding · Listo para compliance
Contacto

Empezá tu primera evaluación de seguridad

Contanos sobre tu agente y te ayudamos a configurar la primera evaluación. Sin cuenta, sin setup complejo — solo el endpoint y las credenciales.

Self-hosted · Tus datos nunca salen de tu infraestructura
Respondemos en menos de 24 h