Cómo conectar GEMINI CLI con n8n

Desde que salió al mercado, GEMINI CLI se ha tratado casi única y exclusivamente para programación, sin embargo, cualquiera puede sacarle partido en su ordenador, sobre todo si lo conectamos con otras herramientas como n8n, y hacemos que ambos trabajen juntos.
Por si no conoces GEMINI CLI, se trata de un agente de Inteligencia Artificial, creado por Google, que nos permite realizar consultas y tareas directamente en nuestro ordenador, a través de la línea de comandos, independientemente del Sistema Operativo que utilicemos en nuestro ordenador.
Los usos que más se han comentado para este tipo de agentes, son orientados a programación, ya que puede escribir nuevo código, refactorizar, analizar, corregir bugs... Pero podemos hacer mucho más que esto, gracias a los servidores MCP.
MCP, o Model Context Protocol, es un protocolo, creado por Anthropic (Creadores de Claude), que permite dotar de herramientas a los agentes de IA de una forma muy sencilla.
Existen multitud de servidores (podéis ver algunos en el repositorio oficial de MCP, en GitHub), algunos oficiales, y otros creados por la comunidad, que nos permiten conectar este tipo de agentes con herramientas diversas, entre las cuales se incluyen Make, Zappier o mi preferida en cuanto a automatizaciones: n8n.
El objetivo de conectar GEMINI CLI con n8n es el de poder usar workflows como herramientas disponibles para nuestro agente, lo que nos abre un mundo de posibilidades, pudiendo decirle a GEMINI que ejecute flujos en situaciones concretas, tanto en modo ejecución normal y corriente, como a través de webhooks (en caso que tengamos que pasar información al flujo para su correcta ejecución).

Como ejemplo simple, pero que viene a explicar perfectamente el objetivo de fusionar estas dos herramientas, podríamos dotar a nuestro agente de la capacidad de enviar correos electrónicos, pudiendo darle una instrucción como por ejemplo: "Realiza un análisis de los documentos que tienes en esta carpeta. Genera un archivo ZIP que contenga todos los archivos y envía un correo a direccion@email.com con el asunto 'Análisis de la documentación', que en el cuerpo del mensaje incluya el análisis que has realizado, y como archivo adjunto, envía el ZIP que has creado."
Llegar a esta interacción tan simple, nos llevará un poco de trabajo al principio: Definir el flujo en n8n y hacer las pruebas pertinentes para que, una vez obtengamos el formato de envío de datos correcto entre GEMINI CLI y n8n, decirle a GEMINI CLI que recuerde hacerlo siempre de esa forma. Así, nuestro agente actualizará su memoria interna a largo plazo y a partir de entonces, siempre hará uso de la herramienta de la forma en la que es necesario para que todo funcione correctamente.
Este ejemplo quizá sea un poco básico para todo lo que puede darnos la combinación de GEMINI CLI + n8n, pero si pensamos un poco, el límite es nuestra imaginación. Desde mantener actualizada una página web o un perfil en una red social, simplemente utilizando lenguaje natural con nuestro ordenador, hasta mantener actualiada una base de datos, obtener un resumen de las noticias más destacadas del día, saber qué tan contentos han estado hoy los clientes que han contactado con nosotros... Sólo tenemos que hacer una automatización y dársela como herramienta a GEMINI CLI, gracias a la conexión entre ambos, que logramos usando el servidor MCP.
Para muchos, esto será una violación clara a la privacidad, pero nada más lejos de la realidad ya que, según la política de privacidad de Google, todo lo que se genera a través de GEMINI CLI, es privado y no se utiliza más que para generar las respuestas por lo que, aunque no es tan seguro como una red local, sí es cierto que podemos interactuar sin miedo a que nuestros datos terminen donde no deben.
Como dije antes, existen servidores MCP para otras herramientas de automatización que son oficiales. El de n8n, a día de hoy, está desarrollado por la comunidad, lo que puede dar lugar a algo de incertidumbre a la hora de usarlo pero siempre podéis descargar el servidor desde su GitHub (el enlace lo tenéis en el listado que os puse anteriormente en esta entrada) y pedirle a GEMINI que analice el código en búsqueda de posibles violaciones de seguridad o lo que se os ocurra.
En lo personal, mezclar agentes locales de IA con este tipo de herramientas, me da la sensación de estar manejando un ordenador con un sistema operativo del futuro.
Puedo hablar con él en lenguaje natural y ordenarle que haga cosas mientras yo ejecuto otras tareas o simplemente me tomo un café, lo que sin lugar a dudas, es hacia donde se van a encaminar los sistemas operativos en no demasiado tiempo.
Si te ha resultado interesante, dejadme un comentario en mi perfil en LinkedIn. ¡Estaré encantado de leerte!