Agentes de IA: cómo están transformando el trabajo en 2025
Agentes de IA: la frontera en automatización y productividad
Entre las páginas de Dune hay una advertencia que se repite: «No construirás una máquina que imite la mente humana». No es un mandamiento cualquiera, es parte de la Biblia Católica Naranja, el texto sagrado que Frank Herbert imaginó para su universo. Estos últimos años, entre la pandemia, la revolución digital y el lanzamiento de ChatGPT, la ciencia ficción dejó de imaginar un futuro lejano y supersónico. La materia de lo que se construye ya está acá, escribe, piensa y conversa con nosotros.
El año de los Agentes
Hace tan solo unos meses, en septiembre de 2024, Google publicó un documento técnico sobre la Arquitectura y Operación de los Agentes IA. Al comenzar 2025, ya se puede afirmar que este será el año de los agentes. Según palabras del mismo Sam Altman, director ejecutivo de OpenAI, en su blog:
Ahora estamos seguros de que sabemos cómo construir una AGI tal como la hemos entendido tradicionalmente. Creemos que, en 2025, podríamos ver a los primeros agentes de IA «unirse a la fuerza laboral» y cambiar materialmente la producción de las empresas. Seguimos creyendo que poner iterativamente herramientas excelentes en manos de las personas conduce a resultados excelentes y ampliamente distribuidos.
Y estas no son solo palabras: esta semana, OpenAI lanzó Tareas, una función beta de ChatGPT que puede ejecutar tareas programadas de forma autónoma. Esta innovación permite la planificación y automatización de acciones futuras, desde recordatorios puntuales hasta tareas recurrentes como la generación de reuniones informativas semanalmente de noticias o rutinas personalizadas. Aunque inicialmente va a estar limitada a los usuarios Plus, Pro y Teams, Tareas representa el primer paso de OpenAI hacia una nueva generación de agentes de IA con capacidad de operación asincrónica.
Pero, ¿qué es un agente de IA? O, más bien, ¿cuánto falta para que domine el mundo?.
El whitepaper de Google
Agentes, escrito por Julia Wiesinger, Patrick Marlow y Vladimir Vuskovic, equipo de ensueño de IA de Google, es un documento técnico que explica el funcionamiento de los agentes de IA generativa. ¿Cuál es la novedad? Estas aplicaciones amplían las capacidades de los modelos de lenguaje a partir del uso de herramientas que le permiten interactuar con el mundo real. Un agente es, entonces, una nueva capa de abstracción cuya novedad es su arquitectura cognitiva, compuesta por tres componentes: el modelo de lenguaje, las herramientas (extensiones, funciones y almacenes de datos) y la capa de orquestación.
El modelo (modelo)
El modelo es el componente central en la toma de decisiones del agente. Aunque generalmente se trata de un LLM (Modelo de Lenguaje Grande), también puede consistir en uno o varios modelos de lenguaje de diferentes tamaños, ya sean pequeños o grandes. Lo importante es que estos modelos sean capaces de seguir razonamientos basados en instrucciones y marcos lógicos, como ReAct, Cadena de Pensamiento o Árbol de Pensamientos. El modelo puede ser de propósito general, multimodal o estar ajustado según las necesidades específicas de la arquitectura del agente. Si bien no se entrena inicialmente con configuraciones particulares, puede optimizarse mediante ejemplos que demuestren sus capacidades en diferentes contextos.
Las herramientas (Herramientas)
Las herramientas funcionan como un puente entre el modelo y el mundo exterior, lo que permite que el agente interactúe con datos y servicios externos. Estas pueden tomar diversas formas, incluyendo API web estándar con métodos como GET, POST, PATCH y DELETE. Gracias a estas herramientas, los agentes pueden acceder y procesar información del mundo real, lo que les permite trabajar con sistemas más especializados como RAG (Generación Aumentada por Recuperación). En el caso específico de los modelos de Google, los principales tipos de herramientas con las que pueden interactuar se dividen en tres categorías: Extensiones, Funciones y Almacenes de datos.
La capa de orquestación (Capa de orquestación)
La capa de orquestación es un proceso cíclico responsable de gestionar la memoria, el estado, el razonamiento y la planificación del agente. Para ello, utiliza marcos de ingeniería de prompts, lo que permite que el agente interactúe de manera más efectiva con su entorno y complete sus tareas. Este ciclo continúa hasta que el agente alcance su objetivo o llegue a un punto final definido.
Estos tres componentes (el modelo, las herramientas y la capa de orquestación) trabajan en conjunto para permitir que el agente logre sus objetivos, interactuando con el mundo y tomando decisiones con información actualizada. El documento técnico desarrolla con mayor detalle los aspectos de la arquitectura y proporciona una visión completa de cómo estos elementos se integran para crear agentes de IA efectivos.
Aplicaciones en el mundo laboral
La diferencia de las máquinas pensantes de Dune, estos agentes no deberían ser cajas negras misteriosas. La implementación exitosa depende de procesos claros y trazables donde podamos monitorear cada decisión, entender el razonamiento y documentar las interacciones, siempre con la seguridad y las buenas prácticas en foco. Sin puntos ciegos ni zonas grises.
Imagina poder aprovechar estos agentes para potenciar el análisis de datos en tiempo real, automatizar procesos complejos e integrar múltiples sistemas. Un agente puede monitorear el rendimiento de las campañas publicitarias y ajustar los parámetros automáticamente, conectar tu CRM con herramientas financieras para generar reportes personalizados, o analizar patrones en el servicio al cliente para optimizar la atención. El potencial es especialmente relevante para las empresas que manejan grandes volúmenes de datos o necesitan mantener sus operaciones actualizadas las 24 horas del día, los 7 días de la semana.
Es ahora
En este momento, los agentes de IA son una realidad que ya está transformando empresas. Con marcos como LangChain y plataformas como Vertex AI o Replit, su implementación es cada vez más accesible y segura. La ventaja competitiva estará del lado de quienes sepan adaptarse e implementarlos de manera estratégica.
¿Te interesa dar el primer paso? En Paisanos tenemos el talento y la experiencia para ayudar a integrar estas tecnologías en tu empresa de manera responsable y transparente. Y sí, también nos aseguramos de que no lean Duna (por las dudas).
Recursos adicionales
- Introducción a los agentes
- Cree y despliegue agentes de IA generativos mediante lenguaje natural con Vertex AI Agent Builder