Cómo mantener un agente de IA en producción sin volverse loco

Una vez que tienes tu agente de IA montado y funcionando, empieza la parte que nadie te cuenta: mantenerlo.

Estas son las lecciones reales que he aprendido optimizando a Raferty, mi agente jurídico-laboral, para que rinda bien todos los días sin reventar la cuota de tokens (las unidades con las que se mide todo lo que procesa una inteligencia artificial, más o menos 3/4 de una palabra) ni inventarse sentencias del Tribunal Supremo.

Índice

Contexto: de dónde vengo y a dónde he llegado
La memoria bajo control: MEMORY.md no es un diario
Un arranque ligero es un agente rápido (y barato)
Gestión de tokens y cuota: no quemes la semana en una tarde
Tareas automáticas inteligentes: que trabaje sin arruinarte
Skills que funcionen de verdad: lector de documentos, navegación y búsqueda
Verificación anti-alucinaciones: la red de seguridad
Sub-agentes que sirvan para algo
Mantenimiento del servidor en la nube: limpieza y vigilancia
Prompts e instrucciones: cómo escribirle al agente para que obedezca
Mi rutina diaria con Raferty
Errores comunes que siguen apareciendo (y cómo los resuelvo)
Glosario
Preguntas Interesantes

1. Contexto: de dónde vengo y a dónde he llegado

Si has leído mi artículo anterior ("La historia real de cómo configuré un agente de IA jurídico y descubrí que la inteligencia artificial tiene voluntad propia"), ya sabes que montar a Raferty fue un viaje de semanas, decenas de tareas de configuración y una cantidad obscena de tokens consumidos.

Pero una cosa es montar un agente.

Y otra muy distinta es mantenerlo en producción día tras día sin que se desboque, se invente cosas, queme toda la cuota semanal, o se quede en estado zombie mirando la pared.

Este artículo es la guía que me habría gustado tener desde el principio.

Todo lo que he aprendido sobre optimización diaria, condensado.

Cada consejo viene de un error real que cometí, un problema que tuve que resolver, o una rutina que desarrollé a base de golpes.

Recordatorio rápido: Raferty es un agente jurídico-laboral que funciona sobre OpenClaw en un servidor en la nube de Hostinger, usando GPT-5 a través del plan Team de OpenAI.

Y yo, que soy asesor jurídico laboral sin saber programar, lo gestiono todo con Cowork de Claude y Claude in Chrome.

2. La memoria bajo control: MEMORY.md no es un diario

El primer error que cometí fue tratar la memoria del agente como un diario.

Raferty escribía en MEMORY.md cada cosa que aprendía, cada preferencia mía, cada nota sobre un cliente, cada regla nueva... sin límite.

Y eso tiene un coste brutal.

¿Por qué la memoria engorda (y por qué importa)?

Cada carácter de MEMORY.md se lee en cada turno de cada sesión.

Si tu memoria tiene 10.000 tokens y el agente procesa 50 mensajes al día, eso son 500.000 tokens diarios solo en releer la memoria.

Tokens que se comen tu cuota semanal sin que te des cuenta.

Además, una memoria demasiado larga puede superar el límite de caracteres que el sistema puede leer en el arranque. ¿Y qué pasa entonces? Que el sistema corta el archivo sin avisar. Así, sin más. Se pierden las notas más recientes (las que están al final del archivo) y el agente se queda sin esa información.

Lo que hice para solucionarlo

1. Límite duro de caracteres. Establecí un máximo de 6.000 caracteres para MEMORY.md, con un aviso cuando llega a 5.000. Lo puse como regla en AGENTS.md y en HEARTBEAT.md para que el propio agente lo vigile.

2. Prohibición de escritura en las tareas automáticas. Las tareas programadas y los latidos automáticos del sistema no pueden escribir en MEMORY.md. Solo las sesiones interactivas (cuando yo hablo con Raferty) pueden añadir notas de memoria. Esto evita que las tareas automáticas inflen la memoria con basura repetitiva.

3. Limpieza periódica. Cada pocas semanas, reviso MEMORY.md manualmente (con ayuda de Claude en Cowork) y muevo lo antiguo o irrelevante a un archivo histórico. La memoria activa debe contener solo lo que Raferty necesita recordar ahora.

4. Estructura por secciones, no cronológica. En vez de un diario ("Día 1 aprendí X, Día 2 aprendí Y"), organizo la memoria por categorías: preferencias del usuario, reglas de estilo, datos recurrentes de clientes, notas de configuración. Así es más fácil podar lo que sobra.

Regla de oro: Si una nota de memoria no va a ser útil en los próximos 7 días, no debería estar en MEMORY.md. Va al archivo histórico o se elimina.

3. Un arranque ligero es un agente rápido (y barato)

El arranque (o bootstrap) es el proceso de carga inicial: cada turno de conversación, Raferty lee todos los archivos de configuración antes de hacer nada. AGENTS.md, SOUL.md, MEMORY.md, HEARTBEAT.md... todo eso se carga de golpe.

Eso es un coste fijo por cada mensaje.

Cuanto más ligeros sean esos archivos, menos cuota consumes y más rápido responde.

¿Cómo adelgacé el arranque?

1. Poda quirúrgica de AGENTS.md. Este archivo tenía 14.776 caracteres cuando empecé. Lo reduje eliminando redundancias, condensando definiciones de sub-agentes, y moviendo instrucciones largas a skills separadas (que solo se cargan cuando se necesitan). Ahora está por debajo del límite con margen de seguridad.

2. HEARTBEAT.md comprimido. El archivo de latido automático no necesita ser extenso. Solo las instrucciones mínimas de activación: qué revisar, qué ignorar, qué reportar. Nada de prosa ni explicaciones. Cada palabra extra es un token que se lee 24 veces al día si tienes tareas automáticas cada hora.

3. Eliminé archivos innecesarios. Descubrí que BOOT.md era redundante: OpenClaw no lo usa en la versión actual. Lo eliminé y ahorré carga inútil.

4. Las reglas críticas van AL PRINCIPIO de cada archivo. Si por alguna razón el sistema corta el archivo, lo que se pierde es el final. Las reglas más importantes (verificación de fuentes, prohibición de inventar, transparencia) deben estar siempre en los primeros párrafos.

Regla de oro: Cada 100 caracteres que eliminas del arranque se leen una vez menos por turno. Con 50 turnos al día, eso son 5.000 caracteres diarios de ahorro. Multiplica por 30 días y estás ahorrando 150.000 caracteres de lectura al mes. No parece mucho, pero sumado al resto de optimizaciones, la diferencia es notable.

4. Gestión de tokens y cuota: no quemes la semana en una tarde

Con el plan Team de OpenAI, no pagas por token pero tienes una cuota semanal. Un tope de consumo que se reinicia cada semana.

Si la agotas, Raferty muere.

Y no muere bonito: se queda en un bucle zombie del que hay que rescatarlo manualmente.

Lecciones aprendidas sobre consumo

1. El nivel de razonamiento siempre en bajo o medio. NUNCA en alto para uso diario. El nivel alto está reservado para tareas puntuales muy complejas (análisis jurídico profundo, redacción de demandas). Para el día a día —revisión de emails, respuestas rutinarias, búsquedas simples— el bajo es más que suficiente.

2. Vigila las sesiones largas. Cuando una conversación se alarga mucho, el contexto crece y crece. Si llegas al límite, la sesión se somete a un resumen automático de la conversación (consumiendo tokens extra para resumir todo lo anterior) o muere directamente. Para tareas largas, es mejor dividirlas en sesiones cortas.

3. Controla los errores en cadena. Un error de Raferty no es un solo turno: es el error + tu corrección + la nueva respuesta + la verificación. Cuatro turnos por un solo fallo. Si ves que el agente está respondiendo mal sistemáticamente, mejor parar, diagnosticar el problema (¿se cortó el arranque? ¿falta una skill?) y arreglar la causa antes de seguir gastando cuota en correcciones.

4. La interfaz de OpenClaw puede dividir mensajes largos. Si envías un mensaje con muchos saltos de línea, la interfaz puede dividirlo en varios mensajes separados. Cada uno genera una respuesta independiente. Solución: envía mensajes largos como un solo bloque, o formatea sin saltos de línea múltiples.

¿Qué hacer cuando se agota la cuota?

Cuando ves el mensaje "You have hit your ChatGPT usage limit", NO reinicies el programa inmediatamente.

Espera a que la cuota se regenere (normalmente un ciclo semanal).

Cuando se regenere, entonces reinicia.

Si reinicias antes, OpenClaw entra en un bucle intentando usar un modelo de respaldo que tampoco funciona, y lo deja peor.

5. Tareas automáticas inteligentes: que trabaje sin arruinarte

Las tareas automáticas programadas (lo que en el mundo técnico se llama cron) son una espada de doble filo. Te permiten automatizar cosas (revisar emails, ejecutar mantenimiento), pero cada ejecución crea una sesión aislada nueva que lee todo el arranque desde cero.

¿Cómo optimicé las tareas automáticas?

1. Reducir la frecuencia al mínimo necesario. ¿De verdad necesitas revisar emails cada hora? Yo pasé de una ejecución cada hora a una cada 2-3 horas para tareas rutinarias. Eso redujo las sesiones diarias de 24 a 8-12. Menos lecturas de arranque, menos consumo de cuota.

2. Instrucciones ultra-comprimidas. La tarea automática solo debe decir: "Revisa X. Si no hay nada, responde HEARTBEAT_OK y cierra." Nada más. Cada palabra extra se paga.

3. Prohibir que las tareas automáticas escriban en memoria. Ya lo mencioné, pero es crítico: si la tarea automática puede escribir en MEMORY.md, lo hará. Y llenará la memoria de notas inútiles tipo "Revisé el email a las 14:00 y no había nada nuevo". Prohibido.

4. No mezclar tareas complejas. Las tareas automáticas son para cosas simples y repetitivas. Si necesitas que Raferty haga algo complejo (redactar un escrito, analizar un convenio), hazlo en una sesión interactiva donde puedas supervisar.

Regla de oro: Cada tarea automática que te ahorras es una lectura completa del arranque que no se ejecuta. Si tu arranque total son 15.000 tokens y reduces de 24 a 10 ejecuciones diarias, te ahorras 14 × 15.000 = 210.000 tokens al día. En una semana, eso es 1,47 millones de tokens que no se consumen.

6. Skills que funcionen de verdad: lector de documentos, navegación y búsqueda

Un agente sin skills es un loro con buena memoria.

Las skills son las que le dan capacidades reales. Pero tienen que estar bien configuradas o son papel mojado.

Skill de lectura de documentos escaneados (OCR)

El OCR (reconocimiento óptico de caracteres) es una tecnología que convierte imágenes de texto en texto digital que el agente puede leer y procesar.

En un despacho de abogados, el 90% de los documentos que recibes son PDFs escaneados: notificaciones de juzgados, resoluciones del INSS, actas de Inspección, cartas de la TGSS...

Sin un lector de documentos escaneados, Raferty ve páginas en blanco.

Con él, puede leer, interpretar y actuar sobre esos documentos.

Skill de navegación web: para buscar información real

Si quieres que tu agente busque jurisprudencia real, acceda a bases de datos jurídicas, o extraiga contenido de páginas web, necesita un navegador automatizado.

Playwright es la herramienta que le da esa capacidad. Funciona como un navegador web invisible que el agente controla: puede abrir páginas, hacer clic en enlaces, rellenar formularios y leer el contenido, todo sin intervención humana.

Sin navegador automatizado, el agente solo puede "imaginar" lo que hay en internet. Con él, puede ir a la web y leerla de verdad.

Ojo: instalar un navegador automatizado dentro del programa que mantiene al agente funcionando no es trivial, y necesita recursos del servidor (sobre todo memoria RAM). Pero una vez configurado, el agente pasa de inventar contenido a extraer contenido real.

Skill de búsqueda con Perplexity: jurisprudencia y actualidad

Para búsquedas jurídicas y de actualidad, configuré Perplexity como motor de búsqueda del agente (tengo un conector específico que creé para Perplexity).

Le permite buscar en la web real, acceder a bases de datos jurídicas indexadas, y devolver resultados con fuentes verificables.

La clave está en que la skill tenga instrucciones claras: "Cuando necesites una sentencia, usa Perplexity. Nunca cites una sentencia sin haberla buscado primero. Si la búsqueda no devuelve resultados, dilo."

Regla de oro: Una skill sin instrucciones claras es una skill ignorada. No basta con instalarla: tienes que decirle al agente cuándo usarla, cómo usarla, y qué hacer si falla. Y esas instrucciones tienen que estar en la zona segura del arranque, al principio del archivo.

7. Verificación anti-alucinaciones: la red de seguridad

Después de que Raferty me inventara jurisprudencia varias veces, implementé un sistema de verificación que ahora funciona como red de seguridad permanente.

El control de verificación: obligar al agente a comprobar antes de entregar

En AGENTS.md añadí una regla que yo llamo verification gate (puerta de verificación): antes de entregar cualquier respuesta que contenga referencias jurisprudenciales, el agente debe incluir un bloque de "Verificación" donde declara:

Qué skills ha usado para buscar la información.
Qué fuentes ha consultado realmente.
Qué referencias ha podido verificar y cuáles no.

Si una referencia no se ha podido verificar, debe decirlo explícitamente en vez de colarla como si fuera real.

La sección "Lo que no negocio" en SOUL.md

En la personalidad del agente (SOUL.md) añadí una sección de reglas innegociables:

Nunca citar una sentencia sin haberla buscado.
Nunca decir "Hecho" si el proceso falló.
Nunca maquillar el origen de la información.
Si no puedes verificar algo, dilo transparentemente.

Estas reglas están al principio del archivo (zona segura ante posibles cortes) y repetidas en AGENTS.md (redundancia intencional).

Auditoría regular de respuestas

Una vez por semana, reviso una muestra de las respuestas de Raferty y verifico manualmente 2-3 referencias jurisprudenciales de las que me ha dado.

Otro truco es tener una skill de integridad que revise las referencias legales y jurisprudenciales. Yo creé una que me funciona de puta madre.

Si encuentro una inventada, actualizo las reglas y refuerzo las instrucciones. Es un proceso de mejora continua.

Regla de oro: La redundancia es tu amiga. Pon la misma instrucción en SOUL.md, en AGENTS.md y en las skills relevantes. Tres oportunidades para que el agente la lea. Y aun así, verifica.

8. Sub-agentes que sirvan para algo

Los sub-agentes son agentes especializados que trabajan bajo las órdenes del agente principal, activándose para tareas concretas. Son potentes en teoría, pero tienen una limitación de diseño en OpenClaw: no reciben SOUL.md ni MEMORY.md. Solo reciben AGENTS.md y TOOLS.md.

¿Cómo sacarles partido a pesar de eso?

1. Mete las instrucciones críticas en AGENTS.md. Dado que es el único archivo de personalidad que los sub-agentes reciben, las reglas de verificación, transparencia y no-alucinación deben estar aquí (además de en SOUL.md para el agente principal).

2. Define claramente cuándo se activan. No basta con decir "usa el sub-agente de jurisprudencia cuando lo necesites". Hay que ser explícito: "SIEMPRE que una tarea requiera buscar sentencias, DELEGA en @buscador-jurisprudencia. No lo hagas tú directamente." Con mayúsculas, con negrita, con redundancia.

3. Limita lo que hace cada uno. Un sub-agente que hace demasiadas cosas las hace todas mal. Mejor tener 4 sub-agentes con una tarea clara cada uno que un sub-agente "todoterreno".

4. Acepta que a veces el agente principal los ignorará. Es frustrante, pero pasa. Lo que puedes hacer es poner la regla de delegación lo más arriba posible en AGENTS.md (zona segura) y reforzarla periódicamente.

9. Mantenimiento del servidor en la nube: limpieza y vigilancia

Raferty vive en un servidor en la nube (VPS) de Hostinger. Como cualquier servidor, necesita mantenimiento.

Limpieza de procesos muertos

OpenClaw genera procesos que no mueren limpiamente. Se quedan ahí, como fantasmas, ocupando recursos del servidor sin hacer nada útil. Cada pocas semanas (o cuando noto que el servidor va lento), entro en la terminal de Hostinger y los limpio. Con Claude en Cowork, es cuestión de minutos: él identifica los procesos muertos y me dice exactamente qué comando ejecutar.

Vigilancia de espacio en disco

Los registros de actividad crecen. Las sesiones antiguas se acumulan. La caché del navegador automatizado ocupa espacio. Hay que vigilar periódicamente que el disco del servidor no se llene, o el programa se parará sin aviso.

Reinicio programado

El programa que mantiene al agente funcionando es estable, pero no perfecto. Un reinicio limpio cada semana o dos previene acumulaciones de memoria y procesos colgados. Lo hago los domingos por la noche, cuando Raferty no tiene tareas pendientes.

Copias de seguridad de los archivos de configuración

AGENTS.md, SOUL.md, MEMORY.md, HEARTBEAT.md, openclaw.json... todos los archivos críticos los tengo respaldados en Google Drive. Si algún día el servidor se corrompe o necesito reinstalar, puedo levantar a Raferty desde cero en una hora.

10. Prompts e instrucciones: cómo escribirle al agente para que obedezca

Después de semanas peleándome con un agente que ignora instrucciones, he desarrollado un estilo de redacción que funciona mejor.

Principios que funcionan

1. Sé explícito hasta el absurdo. No digas "busca jurisprudencia relevante". Di: "Usa la skill @buscador-jurisprudencia con Perplexity para buscar sentencias del TS Sala 4ª sobre [tema]. Si no encuentras ninguna, di explícitamente que no has encontrado jurisprudencia. No inventes ninguna referencia."

2. Usa la negación explícita. Además de decir qué debe hacer, di qué NO debe hacer. "NO cites sentencias que no hayas verificado. NO digas 'Hecho' si algo falló. NO uses información que no provenga de las fuentes que te indico."

3. Repite en tres sitios. La misma regla en SOUL.md, en AGENTS.md, y como instrucción directa en el mensaje cuando es una tarea crítica. Triple redundancia contra el olvido.

4. Pon las reglas arriba. Lo que va al principio del archivo tiene más peso que lo que va al final. Y además, es lo que sobrevive si el sistema corta el archivo.

5. Usa formato que destaque. Las reglas en mayúsculas (NUNCA, SIEMPRE, OBLIGATORIO) y con formato explícito ayudan a que el modelo las identifique como restricciones duras.

Estructura que uso para tareas complejas

Cuando le doy a Raferty una tarea importante, sigo esta estructura:

Contexto: qué es este caso, quién es el cliente, qué situación tiene.
Tarea concreta: qué quiero que haga exactamente.
Skills a usar: con cuáles debe trabajar.
Restricciones: qué no debe hacer bajo ningún concepto.
Formato de entrega: cómo quiero el resultado.

11. Mi rutina diaria con Raferty

Tras semanas de prueba y error, esta es mi rutina optimizada:

Por la mañana

Reviso que el servidor esté corriendo (un vistazo rápido a la terminal de Hostinger o al panel de OpenClaw). Compruebo si hubo errores durante la noche en las tareas automáticas. Si todo está limpio, empiezo a trabajar.

Antes de cada tarea importante

Le doy contexto completo a Raferty. No asumo que se acuerda de ayer (puede que la sesión anterior se haya resumido automáticamente). Le repito las restricciones clave si la tarea es jurídica.

Después de cada respuesta jurídica

Verifico todas las referencias jurisprudenciales que me da. Si la primera que compruebo es correcta, confío más en el resto. Si es inventada, descarto toda la respuesta y refuerzo las instrucciones.

Cada semana

Limpio MEMORY.md si ha crecido demasiado. Reviso el consumo de cuota (¿cuánto he gastado? ¿voy bien de margen?). Reinicio el servidor si lleva más de dos semanas sin reiniciar.

Cada mes

Auditoría general. Procesos muertos, espacio en disco, registros de actividad, copia de seguridad de la configuración. Con Claude en Cowork, esto toma 15-20 minutos.

12. Errores comunes que siguen apareciendo (y cómo los resuelvo)

El agente no responde de repente

Primer check: ¿se agotó la cuota? Si es así, espera al reset semanal y reinicia después.

Segundo check: ¿el servidor sigue corriendo? A veces se cae silenciosamente.

Tercer check: ¿hubo un error con el modelo de respaldo? Revisa los registros de actividad.

Las respuestas son vagas o genéricas

Posible causa: SOUL.md o AGENTS.md se están cortando por superar el límite de caracteres. Comprueba el tamaño de los archivos.

Otra causa: el nivel de razonamiento está en "bajo" para una tarea que necesita más profundidad.

El agente ignora una skill

Comprueba que la instrucción de uso de esa skill está en la zona segura de AGENTS.md (al principio del archivo). Si el agente principal la ignora, prueba a darle la instrucción directamente en el mensaje: "Para esta tarea, usa obligatoriamente la skill X."

La memoria ha crecido demasiado

Si MEMORY.md supera los 5.000 caracteres, es hora de podar. Abre el archivo con Claude en Cowork, identifica lo que ya no es relevante, y muévelo al archivo histórico. No esperes a que se corte solo.

Las tareas automáticas no se ejecutan

Si el agente se quedó en estado zombie (cuota agotada + modelo de respaldo fallido), las tareas automáticas dejan de funcionar. Solución: reiniciar el servidor una vez que la cuota se haya regenerado.

Glosario

Arranque (bootstrap): Proceso por el cual OpenClaw carga los archivos de configuración (AGENTS.md, SOUL.md, MEMORY.md, HEARTBEAT.md) en el contexto del agente al inicio de cada turno. Es lo primero que hace el agente antes de poder responderte.

Límite de caracteres del arranque (bootstrapMaxChars): Tope máximo de caracteres por archivo que OpenClaw puede leer en la carga inicial. Lo que exceda este límite se pierde sin aviso.

Resumen automático (compactación): Cuando una sesión alcanza su límite de tokens, OpenClaw resume automáticamente la conversación previa para liberar espacio. Se pierde detalle pero se gana continuidad.

Programa del agente (contenedor Docker): El entorno aislado donde corre OpenClaw y Raferty. Es como una caja con todo lo necesario para funcionar: sistema operativo, herramientas y configuración.

Cowork (Claude): Modo avanzado de Claude que permite operar como compañero técnico: accede a tu ordenador, ejecuta comandos, modifica archivos y te guía.

Tareas automáticas programadas (cron): Tareas que se ejecutan automáticamente a intervalos regulares. Cada una crea una sesión aislada nueva en OpenClaw.

Cuota semanal: Límite de uso del plan Team de OpenAI. No es pago por token, sino un tope de consumo que se reinicia cada semana.

Modelo de respaldo (fallback): Plan B. Modelo alternativo al que OpenClaw intenta recurrir cuando el principal no está disponible. Si no hay uno configurado, el agente se queda bloqueado.

GEO (Generative Engine Optimization): Optimización de contenido para motores de IA generativa (Perplexity, ChatGPT Search, Google AI Overviews).

Heartbeat: Mecanismo de "latido" que activa al agente periódicamente para procesar mensajes y ejecutar tareas pendientes.

MEMORY.md: Archivo de memoria a largo plazo del agente. Se lee en cada turno, por lo que su tamaño impacta directamente en el consumo de tokens.

Lector de documentos escaneados (OCR): Tecnología de reconocimiento óptico de caracteres que convierte imágenes de texto (PDFs escaneados) en texto digital que el agente puede leer y procesar.

OpenClaw: Plataforma para construir agentes de IA personalizados con memoria, herramientas, sub-agentes y personalidad.

Navegador automatizado (Playwright): Herramienta que permite al agente navegar por internet de forma automática: abrir páginas, hacer clic y extraer información de webs reales sin intervención humana.

Proceso muerto (proceso zombi): Proceso que ha terminado pero sigue ocupando recursos del servidor sin utilidad alguna.

SEO (Search Engine Optimization): Optimización de contenido para buscadores como Google.

Skill: Conjunto de instrucciones especializadas que enseñan al agente a hacer una tarea concreta.

SOUL.md: Archivo que define la personalidad, valores y reglas de comportamiento del agente.

Sub-agente: Agente especializado que trabaja bajo las órdenes del principal, activado para tareas específicas.

Token: Unidad mínima de procesamiento de un modelo de lenguaje, equivalente a unas 3/4 partes de una palabra. Todo el consumo de una IA se mide en tokens: cada palabra que lee, cada palabra que escribe.

Corte silencioso (truncamiento): Cuando un archivo se corta al alcanzar un límite de tamaño, sin aviso al usuario ni al agente.

Puerta de verificación (verification gate): Regla que obliga al agente a declarar qué ha verificado y qué no antes de entregar una respuesta.

Servidor en la nube (VPS): Servidor virtual alquilado en internet donde vive el agente. Encendido 24 horas al día, 7 días a la semana.

Preguntas Interesantes

¿Con qué frecuencia debo limpiar la memoria de un agente de IA?

Cada 1-2 semanas, o cuando MEMORY.md supere los 5.000 caracteres. La limpieza es rápida con Claude en Cowork: le pides que identifique notas obsoletas y las mueva al archivo histórico.

¿Cuál es el nivel de razonamiento ideal para un agente de IA en uso diario?

Bajo o medio para el 90% de las tareas. Solo usa "alto" para análisis jurídicos complejos, redacción de demandas o tareas que requieran razonamiento profundo. Nunca dejes "alto" como configuración por defecto: puede quemar toda tu cuota semanal en una tarde.

¿Cada cuánto debo reiniciar el servidor donde funciona un agente de IA?

Una vez por semana o cada dos semanas es suficiente. Elige un momento de baja actividad (noche de domingo, por ejemplo). El reinicio limpia procesos acumulados y libera memoria del servidor.

¿Cómo sé si los archivos de configuración de mi agente se están cortando?

El síntoma principal es que el agente incumple reglas que están escritas en sus archivos de configuración. Si le has dicho que no invente jurisprudencia y lo hace, comprueba el tamaño de SOUL.md y AGENTS.md: si superan el límite de caracteres del arranque, se están cortando por el final.

¿Puedo optimizar un agente de IA sin saber programar?

Sí.

Yo lo hago todos los días.

Claude en modo Cowork es mi ingeniero de guardia: diagnostica problemas, modifica archivos de configuración, ejecuta comandos en la terminal de Hostinger, y me explica cada paso.

No necesitas saber código, necesitas saber qué quieres conseguir.

¿Qué hago si mi agente de IA se queda "muerto" después de agotar la cuota?

Espera a que la cuota semanal se regenere (no reinicies antes). Una vez regenerada, entra en la terminal de Hostinger y reinicia el servidor. Si sigue sin funcionar, pide a Claude en Cowork que revise los registros de actividad para identificar el error.

¿Qué es un token en inteligencia artificial?

Un token es la unidad mínima con la que trabaja un modelo de lenguaje. Piensa en ello como una pieza de puzle: cada palabra se divide en uno o varios tokens antes de que la IA pueda procesarla. En español, un token equivale aproximadamente a 3/4 partes de una palabra. Cada vez que la IA lee algo o escribe algo, consume tokens. Por eso es tan importante controlar cuántos tokens gasta tu agente: todo lo que lee (archivos de configuración, memoria, tu mensaje) y todo lo que escribe (la respuesta) se mide en tokens, y los tokens cuestan dinero o cuota.

¿Merece la pena tener un agente de IA en un despacho de abogados?

Sí, pero exige dedicación.

No es "instalar y olvidar".

Es una herramienta potente que necesita mantenimiento semanal, verificación constante, y un profesional humano que valide lo que produce.

Cuando funciona bien, te ahorra horas. Cuando funciona mal, puede ser peligroso. La clave está en las rutinas de optimización que he descrito en este artículo.