Hace dos años, el término «framework de agente de IA» solía referirse principalmente a un simple contenedor alrededor de una llamada de finalización de chat y un mientras bucle. En junio de 2026, esta categoría ha madurado. Las bibliotecas líderes ahora incluyen ejecución duradera, puntos de control con intervención humana, ejecución de herramientas en entornos aislados (sandboxes) y observabilidad real; además, varias ya han alcanzado su versión 1.0, lo que cambia radicalmente la seriedad con la que se pueden considerar en entornos productivos.
Esa madurez genera un nuevo problema: demasiadas opciones. Esta guía las simplifica. Verificamos la versión actual y el estado de cada framework enumerado a continuación en PyPI y GitHub a mediados de 2026, y luego los clasificamos según sus verdaderas fortalezas. Al final, sabrás cuál es adecuado para un prototipo experimental, cuál resiste un reinicio del servidor a las 2 a.m. y cuál puede adoptar tu equipo de .NET sin tener que reescribirlo todo en Python.
Conclusiones clave
- LangGraph (v1.2.5) es la opción predeterminada para agentes productivos con estado y larga duración: la ejecución duradera y la creación de puntos de control son características nativas, no añadidas posteriormente.
- CrewAI (v1.14.7) sigue siendo la forma más rápida de implementar un «equipo» multiagente basado en roles, y con 53 600 estrellas en GitHub posee la comunidad más grande entre los frameworks puros de agentes.
- Microsoft Agent Framework (v1.8.1, versión general disponible en abril de 2026) integró AutoGen y Semantic Kernel; ambos proyectos anteriores ahora están en modo de mantenimiento, por lo que los nuevos proyectos en .NET o Python deberían comenzar aquí.
- SDK de Agentes de OpenAI (v0.17.5) es ligero, independiente del proveedor (compatible con más de 100 modelos) y, en 2026, incorporó soporte nativo para entornos aislados (sandboxing) y para tareas de largo alcance.
- smolagents (v1.26.0) y Pydantic AI (v1.107.0) destacan en extremos opuestos: minimalismo de aproximadamente 1 000 líneas de código frente a validación estricta y segura mediante tipos.
- No existe un único «mejor» framework: elige según el entorno de despliegue, el lenguaje y la cantidad real de orquestación que necesitas.
- Qué te aporta realmente un framework de agentes
- LangGraph: la opción predeterminada para producción
- CrewAI: roles y equipos, rápido
- Microsoft Agent Framework: sucesor de AutoGen
- SDK de Agentes de OpenAI: ligero e independiente del proveedor
- smolagents: minimalismo que escribe código
- El resto del panorama que vale la pena conocer
- Resumen comparativo de 2026
- Recomendaciones según caso de uso
- Preguntas frecuentes
- Conclusión final
- Artículos relacionados
Qué te aporta realmente un framework de agentes
Si eliminamos la publicidad, un framework de agentes realiza tres funciones básicas: gestiona el bucle (llama al modelo, analiza la salida, ejecuta una herramienta y reintroduce el resultado), gestiona el estado durante ese bucle y gestiona la orquestación cuando intervienen varios agentes. Todo lo demás —memoria, salvaguardias, trazabilidad, transferencias entre agentes— son funciones adicionales construidas sobre esas tres bases.
Los frameworks se dividen en dos filosofías. Sistemas basados en grafos y flujos de trabajo (LangGraph, Google ADK, LlamaIndex Workflows) exigen que describas la ejecución como nodos y aristas explícitos. Son más verbosos, pero deterministas y fáciles de depurar. Abstracciones centradas en el agente (CrewAI, SDK de Agentes de OpenAI, smolagents) ocultan el bucle tras roles u objetos agente sencillos, lo que reduce la cantidad de código que debes escribir, aunque cedes cierto control. Saber qué enfoque prefieres reduce drásticamente las opciones disponibles.
Una nota sobre nuestro método no prueba: benchmarks de rendimiento bruto. El rendimiento de un agente depende fundamentalmente de la latencia del modelo subyacente y de tus llamadas a herramientas, no del framework. Elegir en función de micro-benchmarks es un error. Elige según la facilidad de uso, el manejo del estado y la compatibilidad con tu entorno de despliegue.
LangGraph: la opción predeterminada para producción
LangGraph alcanzó la versión v1.2.5 (lanzada el 12 de junio de 2026) y se ha convertido en el marco de trabajo que otros equipos adoptan discretamente como estándar. Es una biblioteca de orquestación de bajo nivel de LangChain Inc que modela su agente como un grafo con estado. Su característica principal es la durabilidad: ejecución persistente que sobrevive a fallos, puntos de control (checkpointing) y aprobaciones humanas en cualquier nodo, integradas de forma nativa y no como soluciones comunitarias.
Ese poder tiene un costo. LangGraph presenta la curva de aprendizaje más pronunciada de este análisis comparativo. Usted piensa en términos de nodos, aristas y esquemas de estado, y su API no abstrae sus indicaciones (prompts) ni su arquitectura —lo cual es precisamente su propósito. Al combinarlo con LangSmith, obtiene una visibilidad profunda para depuración en cada paso del proceso.
Puntos fuertes
- Ejecución duradera y con estado, líder en su categoría
- Soporte nativo para intervención humana en el ciclo y puntos de control
- Observabilidad profunda mediante LangSmith
- 34 800 estrellas en GitHub y amplia adopción en entornos productivos
Compromisos
- Curva de aprendizaje más pronunciada de todas
- Verboso para agentes sencillos
- Integración más estrecha con el ecosistema LangChain
Caso de uso ideal: agentes productivos de larga duración y con estado que deben reanudarse limpiamente tras un fallo. Lenguaje: Python (3.10+), con una versión hermana en JavaScript/TypeScript.
CrewAI: roles y equipos, rápido
CrewAI alcanzó la versión 1.14.7 (11 de junio de 2026) y, con 53 600 estrellas en GitHub, posee la comunidad más grande entre todas las bibliotecas especializadas en agentes aquí analizadas. Su metáfora es la estructura organizacional: cada agente recibe un rol, un objetivo y una historia de fondo; las tareas se asignan a los agentes y se ejecutan dentro de un «equipo». Soporta procesos secuenciales, jerárquicos y consensuados, y es independiente del modelo subyacente, funcionando con OpenAI, Anthropic y modelos locales mediante Ollama.
El diseño basado en roles constituye verdaderamente el modelo mental más intuitivo para la colaboración entre múltiples agentes, razón por la cual CrewAI se difunde tan rápidamente. El reverso de la moneda: la misma abstracción que facilita la creación de equipos sencillos puede volverse restrictiva cuando se requiere un control determinista y granular sobre la ruta de ejecución. Para esos casos, los equipos recurren cada vez más a marcos basados en grafos.
Caso de uso ideal: tuberías de contenido, asistentes de investigación y flujos de trabajo empresariales donde un pequeño equipo de agentes especializados intercambia tareas entre distintos roles. Lenguaje: Python (3.10–3.13). Curva de aprendizaje: suave.
Microsoft Agent Framework: sucesor de AutoGen
Esta es la consolidación más importante del año. Tras dos años de desarrollo paralelo en dos repositorios con más de 50 000 estrellas combinadas, Microsoft fusionó AutoGen y y Semantic Kernel en el Microsoft Agent Framework, que se lanzó oficialmente en su versión 1.0 en abril de 2026 y actualmente se encuentra en la versión 1.8.1 (9 de junio de 2026), marcada como «Producción/Estable». Incorpora la sencilla orquestación multiagente de AutoGen y añade las funciones empresariales de Semantic Kernel —estado de sesión, seguridad de tipos, middleware y telemetría—, además de flujos de trabajo basados en grafos.
El detalle estratégico es relevante: tanto AutoGen como Semantic Kernel ahora están en modo de mantenimiento, recibiendo únicamente correcciones de errores y parches de seguridad, pero sin nuevas inversiones en funcionalidades. Si comienza desde cero, debe hacerlo con el Microsoft Agent Framework, no con AutoGen. Su característica distintiva es ser un marco verdaderamente bilingüe —aproximadamente la mitad del códigobase está escrito en Python y la otra mitad en C#—, con soporte nativo para .NET e integración directa con Azure AI Foundry y Copilot Studio.
Caso de uso ideal: agentes empresariales en entornos Microsoft/Azure, especialmente equipos mixtos de Python y .NET. Lenguaje: Python y .NET (C#). Curva de aprendizaje: moderada; más exigente si se adopta toda la pila empresarial.
SDK de Agentes de OpenAI: ligero e independiente del proveedor
No se deje engañar por su nombre: el SDK de agentes de OpenAI (paquete openai-agents, versión 0.17.5, 11 de junio de 2026, licencia MIT) es independiente del proveedor y funciona con más de 100 modelos, no solo con los de OpenAI. Es un marco deliberadamente ligero para flujos de trabajo multiagente: agentes configurables con instrucciones, herramientas, salvaguardias y transferencias de tareas, además de historial de sesión automático y trazabilidad integrada.
En 2026 incorporó las funciones que las empresas llevaban tiempo esperando. La actualización de abril de 2026 añadió aislamiento nativo (ejecución aislada para agentes que usan herramientas), un entorno de pruebas integrado para evaluar agentes con modelos punteros y soporte explícito para agentes de largo alcance destinados a tareas autónomas multietapa. Estas características se implementaron primero en Python, seguidas posteriormente por soporte en TypeScript.
Puntos fuertes
- API mínima y legible; rápida de aprender
- Funciona con más de 100 modelos, no exclusivamente con los de OpenAI
- Aislamiento nativo y trazabilidad integrados
- Primitivas sólidas para transferencias de tareas y salvaguardias
Compromisos
- Todavía previo a la versión 1.0; la API podría cambiar
- Menor profundidad de orquestación que LangGraph
- TypeScript va a la zaga de Python en cuanto a nuevas funciones
Caso de uso ideal: equipos que desean un ciclo de agente limpio y moderno con transferencias de tareas, pero que no necesitan control a nivel de grafo. Lenguaje: Python (3.10+); TypeScript en desarrollo.
smolagents: minimalismo que escribe código
smolagents de Hugging Face alcanzó la versión 1.26.0 (29 de mayo de 2026) y mantiene fiel su premisa: toda la lógica del agente cabe aproximadamente en 1 000 líneas de código. Su elemento distintivo es el CodeAgent, que expresa las acciones como código Python en lugar de llamadas a herramientas en formato JSON —lo que permite una composición natural mediante anidamiento de funciones, bucles y condicionales. Para garantizar la seguridad, dicho código se ejecuta en entornos aislados (sandboxes) como E2B, Modal, Docker o Blaxel.
En 27 900 estrellassmolagents supera su tamaño. Es el marco de trabajo que vale la pena leer de principio a fin si quieres comprender realmente cómo funciona un bucle de agente, y es una excelente opción para investigación y herramientas ligeras. No pretende ser una plataforma empresarial de orquestación, y eso es precisamente una ventaja.
Caso de uso ideal: prototipos de investigación, agentes generadores de código y cualquier persona que valore una base de código pequeña y auditables. Lenguaje: Python. Curva de aprendizaje: muy suave.
El resto del panorama que vale la pena conocer
Otros tres merecen figurar en tu lista corta. Pydantic AI (v1.107.0, 10 de junio de 2026, ~17 000 estrellas) aporta ergonomía al estilo de FastAPI y validación estricta con Pydantic a los agentes —desarrollado por el equipo cuya biblioteca de validación ya se incluye en los SDK de OpenAI, Google y Anthropic—. Si tus agentes ejecutan lógica empresarial real y deseas seguridad de tipos de extremo a extremo, es la opción destacada.
Google ADK (v2.2.0, 4 de junio de 2026) es un kit de herramientas centrado en el código y multiplataforma (Python, TypeScript, Go, Java, Kotlin), con un entorno de ejecución de flujos de trabajo basado en grafos; la versión ADK 2.0 introdujo cambios importantes en la API, por lo que debes fijar explícitamente la versión que utilices. LlamaIndex (50 100 estrellas en el repositorio principal) lanzó Workflows 1.0, un sistema basado en eventos y pasos, y su capa AgentWorkflow es la opción natural cuando tu agente se centra fundamentalmente en problemas de recuperación de información. Si combinas agentes con búsquedas en documentos, consulta nuestra explicación sobre generación aumentada con recuperación y la guía complementaria para construir una canalización RAG antes de comprometerte.
Resumen comparativo de 2026
| Marco de trabajo | Versión (mediados de 2026) | Lenguaje(s) | Estrellas en GitHub | Ideal para | Curva de aprendizaje |
|---|---|---|---|---|---|
| LangGraph | 1.2.5 | Python, JS/TS | 34 800 | Agentes productivos duraderos y con estado | Pendiente |
| CrewAI | 1.14.7 | Python | 53 600 | Equipos multiagente basados en roles | Suave |
| Microsoft Agent Framework | 1.8.1 (versión estable) | Python, .NET | 11 400 | Empresarial / Azure, equipos con múltiples lenguajes | Moderado |
| OpenAI Agents SDK | 0.17.5 | Python (TypeScript próximamente) | 27 200 | Agentes ligeros y multimodelo | Suave |
| smolagents | 1.26.0 | Python | 27 900 | Investigación, agentes generadores de código | Muy suave |
| Pydantic AI | 1.107.0 | Python | ~17 000 | Lógica empresarial con seguridad de tipos y validación | Suave |
| Google ADK | 2.2.0 | Python, TypeScript, Go, Java, Kotlin | — | Equipos políglotas centradas en el código | Moderado |
| LlamaIndex (Workflows/AgentWorkflow) | Workflows 1.0 | Python, TypeScript | 50 100 | Agentes intensivos en RAG y basados en documentos | Moderado |
Recomendaciones según caso de uso
¿Vas a desplegar un agente con estado en producción? LangGraph. Ningún otro marco iguala hoy su capacidad de ejecución duradera y reanudabilidad. ¿Vas a implementar un flujo de trabajo multiagente esta semana? CrewAI para colaboración basada en roles, o el OpenAI Agents SDK si prefieres transferencias explícitas y una superficie de API más reducida. ¿Trabajas en el entorno Microsoft/Azure o con .NET? Microsoft Agent Framework, punto final; y migre desde AutoGen, que está congelado.
¿Prototipado o aprendizaje? smolagents: lo suficientemente pequeño como para leerlo en una tarde. ¿Ejecuta lógica empresarial real que no debe corromper silenciosamente los datos? Pydantic AI, por sus garantías de validación. ¿Construye sobre una base de conocimiento? Agentes de LlamaIndex, ya que la recuperación es su especialidad. Si su objetivo final es un producto conversacional y no un agente autónomo, quizás ni siquiera necesite un marco de orquestación: nuestra guía paso a paso sobre cómo construir un chatbot de IA con la API de Claude cubre el camino más ligero. Y para la nueva generación de agentes de programación y terminales, consulte nuestros análisis profundos sobre el agente Hermes y OpenCode.
Preguntas frecuentes
¿Cuál es el mejor marco de agentes de IA en 2026?
No hay un único ganador. Para agentes de producción robustos, LangGraph (v1.2.5) es la opción predeterminada. Para equipos multiagente rápidos, CrewAI lidera. Para equipos de .NET y Azure, Microsoft Agent Framework es la elección clara. Elija el marco según su entorno de despliegue, no persiguiendo posiciones en tablas comparativas.
¿Sigue manteniéndose AutoGen en 2026?
No se añaden nuevas funciones. Microsoft fusionó AutoGen y Semantic Kernel en Microsoft Agent Framework, que alcanzó disponibilidad general (GA) en abril de 2026 (ahora v1.8.1). El AutoGen original se encuentra en modo de mantenimiento: únicamente correcciones de seguridad y errores; por tanto, los nuevos proyectos deben comenzar directamente con Agent Framework.
¿Necesito un marco o puedo implementar yo mismo un bucle de agente?
Para un solo agente que invoca unas pocas herramientas, un bucle escrito manualmente suele ser suficiente y evita dependencias innecesarias. Los marcos justifican su uso cuando necesita estado persistente, orquestación multiagente, puntos de verificación con intervención humana o trazabilidad en producción. smolagents (~1.000 líneas) representa un buen punto intermedio para estudiar antes de decidir.
¿Qué marco de agentes tiene la curva de aprendizaje más suave?
smolagents y CrewAI son los más fáciles de empezar: puede tener algo funcionando en pocas líneas. El SDK de Agentes de OpenAI y Pydantic AI también son accesibles. LangGraph es el más exigente, pues exige modelar la ejecución como un grafo explícito con estado.
¿Están estos marcos vinculados a proveedores específicos de modelos de lenguaje grande (LLM)?
En su mayor parte, no. CrewAI, el SDK de Agentes de OpenAI (más de 100 modelos), smolagents y Pydantic AI son independientes del modelo y funcionan con OpenAI, Anthropic y modelos locales mediante Ollama o APIs compatibles. Son bibliotecas de orquestación, no están atadas exclusivamente a los modelos de un proveedor.
¿Y qué pasa con los agentes que combinan razonamiento con búsqueda de documentos?
Eso es un problema de generación aumentada con recuperación (RAG). Los agentes de LlamaIndex están diseñados específicamente para ello, y LangGraph también lo maneja bien cuando necesita estado persistente alrededor de los pasos de recuperación. Comience asegurando primero la capa de recuperación antes de añadir control agente encima.
¿Qué marco es el mejor para equipos empresariales de .NET?
Microsoft Agent Framework. Es la única opción aquí con soporte nativo de primera clase para .NET (C#), además de Python, y cuenta con funciones empresariales como estado de sesión, middleware y telemetría, así como integración nativa con Azure AI Foundry y Copilot Studio.
Conclusión final
El veredicto sincero a mediados de 2026: elija según sus restricciones, no según la moda. Si busca una opción segura y predeterminada para trabajos serios en producción, LangGraph ese es el marco adecuado: la ejecución duradera es la característica que distingue una demostración de un sistema real. CrewAI o el OpenAI Agents SDK CrewAI le llevará allí más rápido. Microsoft Agent Framework Microsoft Agent Framework es ahora el único punto de partida sensato para equipos de .NET y Azure, y Pydantic AI y smolagents Pydantic AI y smolagents son especialistas dignos de conocer por su seguridad de tipos y minimalismo, respectivamente.
Lo que ha cambiado desde 2024 es que «marco de agentes» finalmente significa algo concreto y apto para producción. Los marcos mencionados arriba son reales, todos se distribuyen activamente y todos han sido verificados como actualizados a junio de 2026. Esta semana, prototipe con dos de ellos en una tarea pequeña: la opción correcta se hará evidente más rápido que cualquier tabla comparativa —incluida esta— pueda indicarle.
