Un agente de IA puede entenderse como un sistema autónomo que puede realizar tareas o tomar decisiones por sí mismo, basándose en sus objetivos y en la información que recibe.
Un agente de IA tendrá principalmente tres componentes principales: percepción, cerebro y acción.
Estos tres componentes trabajan juntos: la percepción recoge información, el cerebro decide qué hacer y la acción ejecuta el plan. Este proceso permite a los agentes de IA realizar una gran variedad de tareas, desde responder preguntas hasta controlar sistemas complejos.
El diagrama ilustra el flujo de trabajo general de un agente de IA, que suele constar de dos componentes básicos: intraejecución e interacción.
Traducción realizada con la versión gratuita del traductor DeepL.com

El componente de intraejecución se centra en los procesos dentro de un agente de IA y comprende tres módulos principales: percepción, cerebro y acción, como se ha explicado anteriormente. El flujo de trabajo comienza con la entrada del usuario, que pasa por una herramienta de formateo de entrada como parte del módulo de percepción.
A continuación, el cerebro se encarga del razonamiento y la planificación, y utiliza un LLM para analizar y deducir información e idear estrategias para objetivos específicos.
Esto da lugar a subtareas que luego ejecuta el módulo de acción, que puede incluir la llamada a herramientas externas. El proceso se repite, moviéndose entre el cerebro y los módulos de acción, hasta que se alcanza un resultado final. El agente también interactúa con su memoria y su entorno.
Tomemos un ejemplo de la vida real para ver cómo funcionan los agentes de IA. Supongamos que necesitas unas zapatillas Nike para correr de menos de 500 dólares y que el color debe ser azul. El agente de IA descompondría en datos estructurados la petición del usuario de zapatillas Nike para correr por menos de 500 dólares en color azul. A continuación, utilizaría el razonamiento y la planificación para identificar modelos de zapatillas relevantes, recopilar detalles y evaluar las opciones en función de los criterios. El agente ejecutaría subtareas como consultar las API de comercio electrónico y revisar los comentarios de los clientes, iterando entre su cerebro y los módulos de acción hasta recomendar la zapatilla óptima. En todo momento, el agente aprovecharía su memoria y su entorno para cumplir los requisitos del usuario de forma eficiente.
Traducción realizada con la versión gratuita del traductor DeepL.com