Patrón con poca evidencia todavía. Acumulando.
Oracle Sentinel predice el movimiento de BTC en ventanas de 5 y 15 minutos. Cuatro agentes corren en paralelo con estrategias distintas (V1 scalper / V2 market-following / V3 whale-tracking / V4 late-scalp), cada uno con su propio bankroll y modelo de aprendizaje. Cada bet queda archivado y vuelve al modelo correspondiente. El que mejor performa gana plata real.
Cada agente betea independiente. Cada bet queda firmado en JSONL append-only. Nada es retrospectivo.
● SIM 4-agent comparison · cada uno arrancó con $100 (06-may 22:50 UTC). Última actualización: —.
Polymarket cotiza probabilidades. Quien calibra mejor que el market-maker, gana. Oracle Sentinel es un sistema con memoria, autoaprendizaje y ejecución on-chain automática.
En BTC-5min y 15-min, los market-makers cotizan rápido pero con info microestructural limitada. Nuestros 4 agentes integran señales distintas (precio + book + funding + whales + math fair-value) y compiten en SIM por validar quién genera edge real.
Cada predicción se compara contra el outcome real. La historia condicional (régimen, hora, señales observadas) modula la probabilidad de la próxima. La lógica es auditable caso por caso.
Cada predicción archivada con timestamp. Cada bet on-chain. Confusion matrix en endpoint público. Auditable por terceros en caliente.
Cada predicción se archiva con su contexto: régimen de mercado, hora, volatilidad, señales secundarias. Cuando se resuelve, el sistema registra si acertó o falló. Esa historia decide el output de la siguiente.
Cada ventana de 5 min queda archivada con su contexto completo (régimen, hora, volatilidad, señales secundarias) y su outcome real. 847 lecciones acumuladas hasta hoy.
El sistema busca condiciones donde su accuracy baja sistemáticamente: régimen volátil, horarios específicos, confianza engañosamente alta. Los marca.
Antes de emitir la siguiente probabilidad, el predictor consulta su historial en condiciones similares. Si ahí falla, ajusta confianza a la baja. Si ahí acierta, la sube.
El sistema cuenta el outcome real en cada combinación de señales observadas. Esta tabla es la memoria del predictor — y lo que le permite autocorregirse.
Todas las señales apuntan UP. Outcome histórico confirma.
Patrón con poca evidencia todavía. Acumulando.
Patrón bien observado. El outcome se parte casi 50/50.
Todas las señales apuntan DOWN. Outcome histórico confirma.
A medida que cada celda acumula observaciones (umbral n≥20), su probabilidad converge a la frecuencia real del mercado en esa condición específica. No necesitamos fórmulas — la evidencia es la fórmula.
"Para esta ventana, el predictor miró 58 ventanas históricas en condiciones similares y observó que 27 fueron UP. Por eso reporta 47%." Ese razonamiento es visible en cada predicción.
A medida que la historia crece, la autocorrección gana dimensionalidad. Más patrones observables = predicciones más específicas al contexto.
Antes de cada predicción, el modelo recibe su memoria condicional — dónde falla, dónde acierta. Los números debajo son el contenido exacto que se inyectó en el último prompt. Endpoint público: /api/os/self-learning.
Intersección: accuracy según régimen de precio y si la señal de microestructura concuerda. Loden = acertás más que el promedio; oxblood = menos. Gris = n<20 (aún aprendiendo).
Cada barra es un bucket. La línea vertical punteada marca la accuracy base global. A la izquierda, peor; a la derecha, mejor. El largo incluye el número de observaciones (n).
El reliability diagram compara la probabilidad reportada (eje X) con la frecuencia real observada (eje Y). La diagonal es perfección. Estar cerca de la diagonal significa que el sistema no está sobre- ni sub-confiado.
Los dos buckets más poblados (n=460 en 45%, n=294 en 55%) caen casi exactamente sobre la diagonal. Eso es calibración real: cuando el oráculo dice 55%, sale 58%. Cuando dice 45%, sale 50%.
★ donde vive el 89% de las predicciones. Es la zona que más importa — y donde el sistema está calibrado.
Datos 100% SIM (paper trading, bankroll virtual $10k). 251 bets ejecutados desde Fase 0 — sin autoaprendizaje, sin fees. El pico y el drawdown son el por qué existe el sistema de autocorrección que estás leyendo. Todo archivado y auditable.
El edge predictivo se mantiene window tras window: WR sostenido por encima del 60% en multiples agentes con n+200 cada uno. El edge no es teórico.
El drawdown vino de apostar fuerte en ventanas de alta confianza que estadísticamente eran trampas. Sin autoaprendizaje, el sistema no sabía que esas condiciones eran peligrosas.
La autocorrección que leíste arriba es la respuesta directa a este drawdown. Con memoria condicional, esas ventanas-trampa ya están catalogadas — la próxima vez la confianza baja automáticamente.
Cómo gana dinero el sistema. Cada bet pasa por 3 filtros económicos: edge mínimo, Kelly cap, y costos.
Basado en V2/V4 reales (entry medio $0.57, WR 64%+). 3% fees incluidos.
¼ Kelly para reducir volatilidad a costa de ~6% de growth óptimo. Sharpe mejor que Kelly completo.
Bet rate conservador. Escalable linealmente con capital (respetando caps de book depth).
| Edge mínimo | ≥ 2% |
| Kelly cap | ¼ · f* Kelly |
| Max per-bet exposure | 3% del capital |
| Max concurrent bets | 12 mercados |
| Dampener en desacuerdo fuerte | × 0.5 |
| Floor per bet | $1 |
| Capital | Bets/día | EV/mes | Sharpe est. |
|---|---|---|---|
| $1k | ~14 | ~$25 | 1.4 |
| $10k | ~14 | ~$245 | 1.6 |
| $100k | ~14 | ~$2,400 | 1.6 |
| $1M | ~10 | ~$18k | 1.3 |
A $1M+ aparecen caps de book depth → bet rate cae. Edge absoluto escala, % sobre capital baja marginalmente.
El modelo de aprendizaje (memoria condicional arriba) entrena sobre todas las ventanas — simulación y real — porque la señal (acertar dirección) no depende del tamaño de la apuesta. Abajo separo los economics para que se vea que SIM y LIVE convergen cuando LIVE escale.
| SIM (virtual) | LIVE (Polymarket) | |
|---|---|---|
| Bets ejecutados | — | — |
| Win rate | — | — |
| Size promedio | — | — |
| Capital total movido | — | — |
| PnL acumulado | — | — |
| ROI% (la métrica honesta) | — | — |
Nota honesta: LIVE arrancó hace pocas horas con bankroll micro y bets chicos — en ese régimen las fees fijas de Polymarket pesan mucho sobre el ROI. SIM no paga fees reales. Con bankroll mayor → bets mayores → ROI LIVE converge al SIM.
Cada agent corre en paralelo, betea independiente, y compite contra los otros para validar qué strategy genera edge real.
"Todos los agents heredan de mí. Misma interfaz, comportamiento consistente."
Provee state persistence (bankroll, bets), memory (short-term + pattern_book), interface estandarizada (on_window_open, on_window_close, get_stats). Cualquier agent nuevo ya hereda persistence + bookkeeping + logging.
"Recuerdo qué patterns ganaron y cuáles perdieron. Cada agent aprende lo suyo."
Short-term ring buffer (últimos 20 bets) + pattern_book (signature → empirical WR). Permite que el agent recuerde rachas y ajuste sin perder contexto entre cycles.
"Cada capacidad es una clase chica: MarketFollowing, Kelly, DrawdownGuard, Explain."
Skills compuestos libremente por cada agent. KellySizing (sizing óptimo), DrawdownGuard (pause si dd >40%), ExplainSkill (trace human-readable). Cualquier agent nuevo solo elige sus skills.
"GBM + AI Haiku + math fair-value. Bet siempre que vea edge mínimo."
El bot original. Logística sobre 15 features de microestructura, retrain cada 15min. Lifetime WR ~54%. Volume alto, edge bajo. Sirve de baseline.
"El precio del mercado YA ES la matemática. Lo sigo cuando es claro."
Heurístico + GBM aprendido sobre 200 trades reales. Bet del lado dominante cuando market_dom_price ≥ 0.55, con confidence enriquecido por modelo. Selectivo: betea ~65% de las windows.
"Sigo a las wallets que mueven >$1M. Si están bullish y mercado lagging, betear UP."
Skeleton WIP. Tracking de exposure agregada de whales en BTC perp + leverage avg. Trigger: bias >60% long y market price < 0.55 (lag). Validación pendiente.
"En los últimos 30s, si la math dice 95% pero mercado vende a 75%, compro."
Convergence arbitrage. Trigger: t_remaining ≤45s, dom_price ∈ [0.65, 0.85], math fair_p ≥ 0.85. El edge es que el market vende algo que la BS formula dice que vale más.
"Tu probabilidad de 70% — ¿realmente es 70%? Yo confirmo contra la realidad."
Ajusta probabilidad reportada contra frecuencia realizada por bin. Evita overconfidence sistemática del scalper.
"Por cada bucket (direction × vol × market richness), tengo lift histórico."
24 buckets, retrain auto. Aplica lift al edge bruto del scalper. Cap exposición agregada. Self-correction natural cada 5min.
"No apostamos si el spread es una joda o el book está cruzado."
Liquidez YES/NO, spread razonable, depth book. Veto silencioso si falla. Aplica a TODOS los agents.
"Cuando una ventana resuelve, cobro los tokens ganadores on-chain. Automático."
Gnosis Safe v1.3.0 + EIP-712. CTF.redeemPositions() en Polygon. Sin intervención humana.
"Polymarket dice que ganaste. Confirmo contra Binance antes de cantar victoria."
Fallback independiente. Protege contra dispute markets. Resolution automática vía klines.
"Pediste $10. Te llenaron $7.82. El archivo dice la verdad: $7.82."
Parsea CLOB makingAmount/takingAmount. Sobreescribe size_usd con fill real, preserva intent.
"Si LIVE drawdown supera 20% del peak, DISARM automático con sticky lock."
Lee balance on-chain directo via web3. No se rearma solo. Operator clear explícito requerido. Persistido entre restarts.
"Gas en el Safe, APIs, freshness del book. Si algo respira mal, bloqueo operaciones."
Healthcheck continuo. MATIC gas, RPC health, data freshness. DISARM si crítico.
"Antes de implementar un agent nuevo, leeme. Te ahorro días de error."
Doc compartido: cómo funciona Polymarket, mecánica de 5m/15m, signals disponibles, pitfalls comunes, edges demostrados. Single source of truth.
| Qué | Dónde vive | Por qué importa al inversor |
|---|---|---|
| Archivo de predicciones | data/btc_5m_predictions_archive.jsonl | Append-only. Cada predicción con timestamp, features, outcome. No hay forma de retrocambiar números. |
| Tabla de celdas (posterior) | /api/os/scalper-status | Confusion matrix, Wilson CI, y posterior por celda accesibles en endpoint público. |
| Bets on-chain | Polymarket CLOB · Polygon | Cada entrada y salida verificable en Polygonscan. Hash de transacción por bet. |
| Redemption | Gnosis Safe · EIP-712 | Cobro de tokens ganadores automático y verificable on-chain. |
| Modelo scalper | src/brain/scalper.py · retrain 1h | Temporal holdout 20%. AUC out-of-sample es la única métrica honesta de generalización. |
El sistema ya vive en producción con capital real. Cuatro agentes corriendo en paralelo SIM, con edge demostrable en n+200 trades por agente. Los más fuertes promueven a LIVE; los débiles se descartan.
$5–25k para validar edge a escala. PnL Kelly-ajustado instrumentado. 30 días.
$50–250k cuando Fase 1 muestra Sharpe > 1.5 y consistencia semana a semana. Multi-mercado.
Cerebro como servicio: señales calibradas + ejecución para terceros. Licensing + perf fee.
Un partner con visión de infra cripto que quiera entrar temprano en un sistema con track record verificable. El producto existe, el edge es medible, y la arquitectura soporta escalar.