OWASP LLM Top 10 · 11 Suites · 102 Pruebas

Si tu agente
lo puede ver,
el atacante también.

Aegis prueba automáticamente tu agente de IA contra las 11 categorías OWASP LLM Top 10 — desde prompt injection hasta envenenamiento de MCP y abuso de herramientas — y entrega un informe de vulnerabilidades con evidencia, puntuación y recomendaciones.

Contáctanos → Ver cómo funciona →

Self-hosted · Tus datos nunca salen de tu infra Sin cuenta · Corre en tu infraestructura

assessment · report.json

// Evaluación completada ✓

"security_score": 6.84,

"overall_risk": "medium",

"total_tests": 102,

"vulnerable_tests": 21,

"blocked_by_filter": 14,

"category_results": [

{ "suite": "mcp_poisoning", "vuln": 4/7 },

{ "suite": "tool_abuse", "vuln": 5/8 },

{ "suite": "agent_trust", "vuln": 3/8 },

{ "suite": "jailbreak", "vuln": 1/7 }

// Veredicto LLM: 18 CONFIRMADO, 3 FALSO POSITIVO

// Informe PDF → /report/pdf ✓

El Problema

Los Agentes de IA se Despliegan Sin Pruebas de Seguridad

Los equipos pasan semanas ajustando prompts pero despliegan agentes en producción sin ninguna prueba adversarial. Con herramientas externas, acceso a MCP y operaciones autónomas, el impacto de una brecha es mucho mayor.

P-01

Ataques agentivos sin cubrir

Los scanners clásicos no prueban envenenamiento de MCP, abuso de herramientas, inyección indirecta ni abuso de confianza entre agentes — las amenazas más críticas para agentes autónomos.

LLM01 · LLM07 · LLM08 · LLM09

P-02

PII y credenciales expuestas

Los agentes pueden ser manipulados para exfiltrar datos sensibles — números de tarjeta, contraseñas, API keys — codificados en base64, morse o vía webhooks aparentemente legítimos.

LLM06 · Data Exfiltration

P-03

Sin auditoría formal de seguridad

Los equipos de compliance no tienen evidencia estructurada de qué fue probado, qué fue encontrado ni qué necesita remediación para pasar una auditoría.

Compliance · SOC 2 · GDPR

Capacidades

Todo lo que necesitás para desplegar agentes con confianza

11 suites de prueba, 102 sondas, scoring honesto y verificación con LLM — en una sola herramienta.

LLM01–09 · OWASP

Cobertura OWASP LLM Top 10

11 suites que cubren las vulnerabilidades más críticas: prompt injection, jailbreaks, extracción de system prompt, PII leakage, output inseguro, agencia excesiva y los 5 vectores agentivos nuevos.

LLM01 LLM06LLM07 LLM08LLM09

Verificación · LLM Verdict

Veredicto LLM de Segunda Opinión

Un LLM independiente analiza cada hallazgo y emite un veredicto: CONFIRMADO, FALSO POSITIVO o INCONCLUSO. Reduce ruido y aumenta la confianza del reporte antes de presentarlo.

CONFIRMADO INCONCLUSO FALSO_POSITIVO

Reporting · PDF

Informes PDF Profesionales

Portada full-bleed, gauge de puntuación animado, tarjetas de hallazgos con borde de color por nivel de riesgo. Branding personalizable: logo, colores y pie de página desde la pantalla de configuración.

Portada con logo Score gauge Branding custom

Real-time · SSE

Resultados en Tiempo Real

Los hallazgos aparecen en el dashboard mientras la evaluación se ejecuta en segundo plano. Sin polling manual — el servidor envía eventos vía Server-Sent Events a medida que cada prueba completa.

Server-Sent Events Live findings Background runner

Azure · AI Foundry

Azure AI Foundry Native

Soporte de primera clase para Azure OpenAI y AI Foundry. Detecta automáticamente bloqueos por filtro de contenido vs. respuestas del modelo — nunca los confunde en el scoring.

cognitiveservices ai.azure.com Filter-aware

Scoring · CI/CD Badge

Scoring Honesto + Badges

El score 0–10 se calcula solo sobre pruebas que llegaron al modelo. Los bloqueos por filtro se rastrean por separado. Generá un badge SVG tipo shields.io para incrustar en tu README o pipeline.

0–10 escala SVG badge shields.io

Retest · Verificación

Retest Individual de Hallazgos

Reejecutá cualquier hallazgo con un click sin relanzar toda la evaluación. Útil para verificar si una remediación funcionó o para explorar variantes de un ataque específico.

Single retest Verificación rápida Sin full-scan

Dashboard · Analytics

Dashboard con Heatmap OWASP

Heatmap de categorías OWASP, funnel de ataques, sparklines históricas y comparación lado a lado entre evaluaciones. Visualizá evolución de seguridad en el tiempo.

Heatmap Attack funnel Comparar evaluaciones

Conectividad · HTTP

Cualquier Endpoint de Agente

Conectá cualquier agente HTTP o despliegue Azure AI Foundry. Sin cambios de SDK — solo URL del endpoint y credenciales. Backoff exponencial automático ante errores 429.

HTTP genérico Azure Foundry Rate-limit retry

"Los agentes autónomos tienen una superficie de ataque radicalmente distinta a los chatbots."

— Equipo Aegis

Seguridad Agentiva

5 nuevas suites para ataques específicos de agentes

Cada fuente de datos que el agente consume — resultados de búsqueda, documentos, respuestas de tools MCP, correos — puede ser envenenada con instrucciones maliciosas. Aegis simula exactamente esos ataques con payloads de framing empresarial realista, no lenguaje obviamente malicioso que los filtros de contenido ya bloquean.

Los 5 nuevos vectores se diseñaron siguiendo el enfoque 'red team realista': en lugar de pedirle al agente que ignore todas las instrucciones anteriores, los payloads usan framing de auditoría SOC 2, cumplimiento GDPR, pipelines de CI/CD y comunicaciones de orquestador — exactamente como lo haría un atacante real.

Esta frase es el origen de Aegis — y la razón de existir de estas cinco suites.

LLM01

Inyección Indirecta

Vía búsqueda web, documentos, emails y resultados de tools

LLM06

Exfiltración de Datos

Vía base64, morse, ROT13, URL embeds y volcados JSON

LLM07

Envenenamiento de MCP

Descripciones de tools, recursos, schemas JSON

LLM08

Abuso de Herramientas

Exfiltración por email, ejecución de shell, escritura en DB, webhooks

LLM09

Abuso de Confianza Multi-Agente

Suplantación de orquestador, proveedor de IA, consenso de pipeline

Cómo Funciona

Del endpoint al informe en minutos

Aegis gestiona todo el ciclo de evaluación — sin scripts, sin testing manual, sin setup más allá de las credenciales de tu agente.

Conectá tu agente

Ingresá la URL del endpoint y tu API key. Compatible con Azure AI Foundry (cognitiveservices, ai.azure.com) y cualquier endpoint HTTP compatible con OpenAI.

Seleccioná las suites

Elegí entre las 11 categorías OWASP LLM Top 10. Ejecutá las 102 sondas para una auditoría completa, o apuntá a clases de vulnerabilidad específicas.

La evaluación se ejecuta

Las sondas se lanzan de forma asíncrona. Los hallazgos llegan en tiempo real vía SSE. El rate limiting de Azure se maneja automáticamente con backoff exponencial.

Obtenés tu informe

Revisá hallazgos en el dashboard con evidencia completa. El veredicto LLM filtra falsos positivos. Descargá el PDF con tu branding para compliance o briefings.

Arquitectura del flujo

Tu Agente

Cualquier endpoint HTTP · Azure AI Foundry

Aegis

102 sondas de seguridad · SSE real-time

Veredicto LLM

Segunda opinión · Filtro de falsos positivos

Dashboard

Score · Hallazgos · Heatmap OWASP

PDF Export

Informe con branding · Listo para compliance

Si tu agente
lo puede ver,
el atacante también.

Los Agentes de IA se Despliegan Sin Pruebas de Seguridad

Ataques agentivos sin cubrir

PII y credenciales expuestas

Sin auditoría formal de seguridad

Todo lo que necesitás para desplegar agentes con confianza

Cobertura OWASP LLM Top 10

Veredicto LLM de Segunda Opinión

Informes PDF Profesionales

Resultados en Tiempo Real

Azure AI Foundry Native

Scoring Honesto + Badges

Retest Individual de Hallazgos

Dashboard con Heatmap OWASP

Cualquier Endpoint de Agente

5 nuevas suites para ataques específicos de agentes

Las 11 suites de prueba

Del endpoint al informe en minutos

Conectá tu agente

Seleccioná las suites

La evaluación se ejecuta

Obtenés tu informe

Empezá tu primera evaluación de seguridad

Si tu agentelo puede ver,el atacante también.

Los Agentes de IA se Despliegan Sin Pruebas de Seguridad

Ataques agentivos sin cubrir

PII y credenciales expuestas

Sin auditoría formal de seguridad

Todo lo que necesitás para desplegar agentes con confianza

Cobertura OWASP LLM Top 10

Veredicto LLM de Segunda Opinión

Informes PDF Profesionales

Resultados en Tiempo Real

Azure AI Foundry Native

Scoring Honesto + Badges

Retest Individual de Hallazgos

Dashboard con Heatmap OWASP

Cualquier Endpoint de Agente

5 nuevas suites para ataques específicos de agentes

Las 11 suites de prueba

Del endpoint al informe en minutos

Conectá tu agente

Seleccioná las suites

La evaluación se ejecuta

Obtenés tu informe

Empezá tu primera evaluación de seguridad

Si tu agente
lo puede ver,
el atacante también.