Fábrica de software de IA · Los mismos tres ingenieros, en cada proyecto · 4 a 6 al año
Sistemas de IA en producción que tus ingenieros pueden operar. Construidos sobre una regla: escribir la evaluación antes del prompt.
La mayoría de los proyectos de IA sobreviven al demo y fallan en la primera semana real de operación. Nosotros entregamos sistemas que tu equipo de guardia puede operar a las 3 a. m., con un arnés de evaluación bajo control de tu equipo y probado por un usuario real en la semana 2, cuando la arquitectura todavía es barata de cambiar.
Qué te llevas
Tres activos operativos bajo control de tu equipo antes del handover.
La mayoría de los proyectos terminan con un repo y una buena intención. Los nuestros terminan con tres cosas que tu equipo puede operar sin nosotros.
eval
La evaluación, antes del prompt
Cada build arranca con un dataset de evaluación y umbrales explícitos. Si no podemos escribir una evaluación defendible en los primeros 14 días, cancelamos el proyecto y te devolvemos el fee de discovery. Lo hemos hecho dos veces.
runbook
El runbook que tu equipo de guardia abre a las 3 a. m.
No la diapositiva con flechas. El documento concreto: alertas, escenarios de degradación, cuándo despertar a un humano, cómo hacer rollback. Lo entregamos firmado en la última semana.
ip
IP, datos y la cuenta del modelo, a tu nombre — desde el día uno
Tu repo. Tus credenciales de OpenAI / Anthropic / AWS. Tus dashboards. Cuando entregamos, tu equipo no necesita pedirnos credenciales: ya son suyas y siempre lo fueron.
Lo que enviamos a producción
Tres sistemas en vivo que puedes inspeccionar, no casos de estudio sanitizados.
Microstax, BidGenie, DeOne — sistemas públicos de IA con decisiones de producto, tradeoffs y restricciones operativas visibles. Líderes de producto pueden inspeccionar las decisiones de flujo. Equipos técnicos pueden revisar restricciones, modos de falla y supuestos operativos.
BidGenie
Un flujo de trabajo con IA que convierte RFPs, DDQs y cuestionarios de seguridad en borradores revisables en horas, con aprobación humana en cada paso.
Primeros borradores en horas en vez de días · aprobación humana en cada punto crítico · nada generado por IA sale sin revisar
DeOne
Una plataforma de citas grounded en ciencia — evaluaciones psicométricas, matching multi-dimensional y un coach de IA que entiende ambos lados de la conversación.
50+ dimensiones de matching · coach de IA grounded en psicometría · detección de crisis incluida antes del lanzamiento
Microstax
Un runtime de entornos nativo para agentes — sandboxes de Kubernetes aislados y gobernados para desarrolladores humanos y agentes de IA autónomos.
Spin-up < 60 s · 8+ horas ahorradas por dev por semana · onboarding de 2 semanas a 1 día
Cómo trabajamos
Cuatro reglas operativas.
Cada una ha cerrado una conversación comercial. Cada una ha protegido una entrega.
01
Evaluación antes que prompt. Siempre.
La mayoría escribe el prompt primero. Si parece bien, lo envían. Nosotros no. Escribimos el set de evaluación primero — preguntas reales, respuestas reales, umbrales reales. Esa evaluación decide si un cambio se mergea. Sin evaluación verde, sin merge. El equipo termina dueño de la decisión, no de nuestra opinión.
02
No hacemos PoCs huérfanas. Un usuario real entra al sistema en la semana 2.
Una PoC sin camino a producción suele esconder las decisiones difíciles. Elegimos a un usuario real (habitualmente alguien de tu equipo) y le ponemos en la mano lo que tenemos hasta ese momento. Lo que aprendemos en la semana 2 cambia lo que entregamos en la semana 8. Las decisiones de arquitectura se toman contra una transcripción, no solo en una pizarra.
03
El modelo más barato que pasa la evaluación gana.
Calidad, latencia y costo se evalúan juntos. Frontier cuando es necesario; modelo más pequeño cuando no. Esa decisión la toma la evaluación, no la relación con un proveedor. En builds recientes, las rutas de producción que no necesitaban razonamiento frontier quedaron por debajo de $0.50 / 1M tokens — un recorte del 80%+ frente a un build que va a frontier por defecto. La diferencia no es solo costo: es latencia, throughput y la libertad de re-evaluar cuando el problema cambie.
04
Cero bait-and-switch. El mismo trío principal de principio a fin.
Pagas por ejecución de nivel senior, no por capacitación de juniors. El mismo trío—arquitecto, ingeniero y diseñador—que define tu sistema escribe el código, las evaluaciones y los runbooks. Limitamos nuestros proyectos para proteger este enfoque.
La aritmética
La aritmética. Publicada para que el fit sea claro antes de invertir tiempo técnico.
Tarifa fija o tiempo y materiales, según el riesgo. Te decimos qué modelo proponemos en la primera llamada y por qué.
- Discovery + evaluación
- desde $8k · 1–2 semanas
- Build (pequeño)
- $40–80k · 6–8 semanas
- Build (mediano)
- $80–160k · 10–14 semanas
- Auditoría / revisión
- $15–25k · 3 semanas · precio fijo
Publicamos los precios porque los rangos opacos consumen ciclos de compras antes de que el fit técnico esté claro. Si estos rangos encajan con tu presupuesto, hablaremos de ingeniería en la primera llamada, no de diapositivas de venta.
A qué decimos no
Decimos no cuando no podemos defender el resultado.
Ejemplos concretos del último año:
- "RAG sobre todos nuestros documentos." No hay pregunta concreta, no hay evaluación posible.
- Pruebas de concepto sin planes de despliegue en producción. Diseñamos código para ser operado, no prototipos para ser archivados.
- Un agente que reemplace a humanos en decisiones legales, médicas o financieras.
- Proyectos donde el criterio de éxito es "lo sabremos cuando lo veamos."
- Proyectos donde el prompt se trata como el producto y la operación queda para después.
Si tu proyecto cae fuera de nuestro enfoque, te presentaremos a los equipos más adecuados para ese camino. Esa introducción siempre es gratuita.
Las tres formas
Apps agenticas y herramientas de IA, construidas para producción
Diseñamos y enviamos workflows agenticos acotados, copilots, sistemas de retrieval, herramientas internas de IA y arneses de evaluación que tus ingenieros pueden operar después del handover.
Construcción de aplicaciones agenticas
Cómo lo hacemos →
Revisión de sistemas agenticos
Cómo lo hacemos →
Herramientas de IA para productos existentes
Cómo lo hacemos →
Lo que escribimos
Últimos insights
Ensayos sobre lo que la fábrica nos enseña en producción. Sin “think pieces”.
El mapa de permisos que todo agente necesita antes de llamar tools
Los agentes con tools necesitan un mapa explícito de qué pueden leer, escribir, mutar, escalar y nunca tocar.Usar IA para programar no es lo mismo que construir sistemas de IA
Programar asistido por IA se está volviendo el mínimo común. La ingeniería de sistemas de IA es el verdadero diferenciador. Aquí está la diferencia, y por qué importa.El runbook de IA para las 3 a.m.
La IA en producción falla de formas que un runbook común no cubre. El plan operativo debe incluir drift de calidad, fallas de retrieval, caídas de modelo, picos de costo y escalación humana.
Trae el problema, el dueño, el rango de presupuesto y la fecha.
Esto es lo que cubrimos, en este orden:
- Qué problema concreto resuelve esto, para quién, ahora.
- Cómo se vería la evaluación. ¿Podemos escribirla?
- Qué presupuesto y qué fecha tienes.
- Si encajamos. Si no, a quién te recomendamos.
La llamada es estrictamente técnica: sin presentaciones de ventas ni discovery teatral. Si tu proceso requiere una licitación formal (RFP) antes de un brief técnico, escríbenos por correo.