Tienes un problema de negocio acotado que la IA podría resolver: un workflow que necesita retrieval, uso de tools, redacción, clasificación, revisión o ejecución de varios pasos. No necesitas un proveedor que prometa entregar; necesitas un proceso de fábrica pequeño que convierta el problema en un sistema evaluado y operable sin perder el hilo a mitad de camino.
Este es el engagement: acotar el problema, escribir la evaluación, poner un usuario real dentro del flujo, construir contra la evaluación y dejar a tu equipo con los activos operativos que necesita para correr el sistema sin nosotros.
Qué construimos
- Apps de workflow agentico: sistemas que planifican una secuencia acotada de pasos, llaman tools, actualizan registros, piden aprobación y se detienen cuando la siguiente acción pertenece a un humano.
- Herramientas de IA dentro de productos existentes: copilots, colas de revisión, asistentes de redacción, sistemas de triage, búsqueda de conocimiento, soporte, ventas y herramientas internas de operación.
- Infraestructura de tool-calling: contratos tipados para tools, servidores MCP, adaptadores de API, permisos, auditoría, workers de cola y rutas de fallback.
- Retrieval y sistemas de conocimiento: RAG que responde preguntas concretas, rechaza cuando la fuente es débil y mide answerability en vez de solo similitud semántica.
- Agentes con verificadores: loops donde un modelo propone trabajo y otra verificación revisa estructura, grounding, política, costo o reglas de negocio antes de mover algo downstream.
La forma
- Semanas 1–2: Discovery + evaluación. Escribimos el set de evaluación antes del prompt. Si no podemos escribir una evaluación defendible en dos semanas, detenemos el proyecto y te devolvemos el fee de discovery. Lo hemos hecho dos veces en 2024–2025.
- Semana 2: Primer usuario real dentro del sistema. Normalmente alguien de tu equipo. Observamos cómo usa lo que existe hasta ese momento. Las decisiones de arquitectura se toman aquí, no solo en pizarra.
- Semanas 3 a 8 (pequeño) o 3 a 12 (mediano): Build. Incrementos de dos semanas. Demo cada viernes. La evaluación bloquea cada merge.
- Últimas 2 semanas: Handover. Repo, runbook, playbook de guardia, arnés de evaluación, credenciales transferidas. Tu equipo usa el sistema en vivo con nosotros detrás. Luego nos vamos.
Activos operativos
- El Sistema de Producción: Desplegado en tu infraestructura, ejecutándose bajo tus credenciales y completamente bajo tu control.
- El Arnés de Evaluación Automatizado: El gate de release que usamos en cada merge. Tu equipo lo ejecuta en cada PR para detectar drift del modelo, regresiones de prompt, fallas de tools y caídas de calidad antes de que lleguen a producción.
- El Registro Inmutable de Decisiones: El activo contra la pérdida de conocimiento: selección de modelos, tradeoffs de latencia/costo, supuestos descartados y por qué se tomó cada decisión.
- El Mapa de Tools y Permisos: Cada API, modelo, cola, data store y acción externa que el sistema puede tocar, con dueños y límites.
- El Runbook para las 3 A.M.: Alertas, modos de degradación, rutas de escalación y scripts de rollback escritos para el ingeniero de guardia, no para la sala de juntas.
- Garantía Técnica de 30 Días: Los fallos que surjan en el código entregado dentro de los primeros 30 días se resuelven bajo nuestra cuenta.
La aritmética
- Build pequeño: $40–80k, 6–8 semanas. 1 Ingeniero Senior (dedicado) + 1 Arquitecto Líder (tiempo parcial).
- Build mediano: $80–160k, 10–14 semanas. 1 Ingeniero Senior (dedicado) + 1 Diseñador de Producto (dedicado) + 1 Arquitecto Líder (tiempo parcial).
- Discovery solamente: desde $8k, 1–2 semanas, evaluación escrita + reporte de recomendación. El fee se acredita al build si decidimos continuar.
Precio fijo cuando la evaluación está limpia. Tiempo y materiales cuando el problema es genuinamente incierto. Te decimos cuál proponemos en la primera llamada.
Qué no hacemos
- Empezar sin evaluación escrita. Si los criterios de éxito no pueden escribirse, la fábrica no tiene gate.
- Tomar un proyecto donde los mismos tres ingenieros no puedan mantener continuidad desde scope hasta handover.
- Subcontratar. El proceso depende de que la memoria del proyecto se quede con las personas que hacen el trabajo.
- Tratar el prompt como el producto. El producto es el sistema operativo a su alrededor: evaluaciones, flujo, observabilidad, seguridad y handover.
Para quién funciona
- Líderes de ingeniería o producto con un problema real, acotado y presupuesto real.
- Equipos que quieren operar el sistema después del handover, no tercerizar IA permanentemente.
- Empresas donde la función de IA tiene que pasar compras y seguridad en el mismo calendario que el resto del producto.
Trae el problema, el dueño, el rango de presupuesto y la fecha. La primera llamada dura 30 minutos y te diremos ahí mismo si encajamos.