g. Casa g. · Pitch · Oracle Sentinel
4 agentes · SIM 24/7 · LIVE on-chain V1

Cuatro agentes especializados compitiendo en paralelo.

Oracle Sentinel predice el movimiento de BTC en ventanas de 5 y 15 minutos. Cuatro agentes corren en paralelo con estrategias distintas (V1 scalper / V2 market-following / V3 whale-tracking / V4 late-scalp), cada uno con su propio bankroll y modelo de aprendizaje. Cada bet queda archivado y vuelve al modelo correspondiente. El que mejor performa gana plata real.

Polygon · on-chain
Archivo 100% auditable
Kelly sizing
Rolling accuracy · ventanas 30 live tracking
50% baseline
start now
Tracción · 4 agentes en paralelo · SIM

Los números, tal como salen del archivo.

Cada agente betea independiente. Cada bet queda firmado en JSONL append-only. Nada es retrospectivo.

V2 Market-following
%
cargando…
V1 Scalper (GBM)
%
cargando…
V3 Whale-tracking
%
cargando…
V4 Late-scalp
%
cargando…

SIM 4-agent comparison · cada uno arrancó con $100 (06-may 22:50 UTC). Última actualización: .

Tesis

El mercado de predicción
tiene un edge calibrable.

Polymarket cotiza probabilidades. Quien calibra mejor que el market-maker, gana. Oracle Sentinel es un sistema con memoria, autoaprendizaje y ejecución on-chain automática.

01 · El edge

Probabilidades mal cotizadas

En BTC-5min y 15-min, los market-makers cotizan rápido pero con info microestructural limitada. Nuestros 4 agentes integran señales distintas (precio + book + funding + whales + math fair-value) y compiten en SIM por validar quién genera edge real.

02 · El método

Aprendizaje continuo, sin caja negra

Cada predicción se compara contra el outcome real. La historia condicional (régimen, hora, señales observadas) modula la probabilidad de la próxima. La lógica es auditable caso por caso.

03 · La ventaja

Transparencia radical

Cada predicción archivada con timestamp. Cada bet on-chain. Confusion matrix en endpoint público. Auditable por terceros en caliente.

Aprendizaje continuo

Un predictor que aprende de sus errores.

Cada predicción se archiva con su contexto: régimen de mercado, hora, volatilidad, señales secundarias. Cuando se resuelve, el sistema registra si acertó o falló. Esa historia decide el output de la siguiente.

01 · Observar

Cada bet es una lección

Cada ventana de 5 min queda archivada con su contexto completo (régimen, hora, volatilidad, señales secundarias) y su outcome real. 847 lecciones acumuladas hasta hoy.

02 · Detectar patrones

"¿Dónde tiendo a fallar?"

El sistema busca condiciones donde su accuracy baja sistemáticamente: régimen volátil, horarios específicos, confianza engañosamente alta. Los marca.

03 · Autocorregir

La próxima predicción ya sabe

Antes de emitir la siguiente probabilidad, el predictor consulta su historial en condiciones similares. Si ahí falla, ajusta confianza a la baja. Si ahí acierta, la sube.

Los patrones observados hasta hoy

El sistema cuenta el outcome real en cada combinación de señales observadas. Esta tabla es la memoria del predictor — y lo que le permite autocorregirse.

📈 señal secundaria UP
📉 señal secundaria DOWN
📈 predicción UP
✓ consenso UP
36 ventanas

Todas las señales apuntan UP. Outcome histórico confirma.

P(UP observado) = 55%
⚡ señales divergen
5 ventanas

Patrón con poca evidencia todavía. Acumulando.

P(UP observado) = 56%
📉 predicción DOWN
⚡ señales divergen
58 ventanas

Patrón bien observado. El outcome se parte casi 50/50.

P(UP observado) = 47%
✓ consenso DOWN
16 ventanas

Todas las señales apuntan DOWN. Outcome histórico confirma.

P(UP observado) = 30%
La propiedad central

Más historia = mejor predicción

A medida que cada celda acumula observaciones (umbral n≥20), su probabilidad converge a la frecuencia real del mercado en esa condición específica. No necesitamos fórmulas — la evidencia es la fórmula.

Por qué no es una black box

Cada autocorrección es auditable

"Para esta ventana, el predictor miró 58 ventanas históricas en condiciones similares y observó que 27 fueron UP. Por eso reporta 47%." Ese razonamiento es visible en cada predicción.

Roadmap de aprendizaje — 4 fases

A medida que la historia crece, la autocorrección gana dimensionalidad. Más patrones observables = predicciones más específicas al contexto.

Fase 1 · actual
shadow
Sistema registra cada predicción + outcome. Patrones 2D se empiezan a llenar.
Fase 2
autocorrección 2D
n≥20 por celda. El predictor corrige su confianza usando la frecuencia histórica observada.
Fase 3
autocorrección 3D
Incorpora régimen + hora UTC. La corrección se vuelve específica al contexto de mercado.
Fase 4
meta-learning
El propio prompt del predictor recibe su historial condicional. Convergencia hacia accuracy casi perfecto.
Autoaprendizaje en vivo

Lo que el predictor está leyendo de sí mismo, ahora.

Antes de cada predicción, el modelo recibe su memoria condicional — dónde falla, dónde acierta. Los números debajo son el contenido exacto que se inyectó en el último prompt. Endpoint público: /api/os/self-learning.

Ventanas en memoria
rolling window
Accuracy base
Buckets calientes
n≥20 con Δ ≥ 5pp
Última actualización
cache TTL 1h
⚠ Contextos donde fallás más

Bajar confianza aquí

Cargando…
✓ Contextos donde acertás más

Subir confianza aquí

Cargando…
Heatmap · régimen × microestructura

Dónde el predictor es fuerte y dónde es frágil

Intersección: accuracy según régimen de precio y si la señal de microestructura concuerda. Loden = acertás más que el promedio; oxblood = menos. Gris = n<20 (aún aprendiendo).

Accuracy desagregada — últimas 500 ventanas

Por dimensión, qué tan bien predice el modelo

Cada barra es un bucket. La línea vertical punteada marca la accuracy base global. A la izquierda, peor; a la derecha, mejor. El largo incluye el número de observaciones (n).

Cargando gráficos…
Fuente: oraclesentinel.bajczman.com/api/os/self-learning · público · CORS abierto · auditable por terceros
Honestidad probabilística

Cuando decimos 65%, sale 65%.

El reliability diagram compara la probabilidad reportada (eje X) con la frecuencia real observada (eje Y). La diagonal es perfección. Estar cerca de la diagonal significa que el sistema no está sobre- ni sub-confiado.

perfección Probabilidad reportada (%) Frecuencia realizada (%) 020406080100 020406080100 35% → 24% 45% → 50% 55% → 58% 65% → 63% 75% → 80%
Lectura

Calibración: prácticamente perfecta

Los dos buckets más poblados (n=460 en 45%, n=294 en 55%) caen casi exactamente sobre la diagonal. Eso es calibración real: cuando el oráculo dice 55%, sale 58%. Cuando dice 45%, sale 50%.

reported → realized
35% → 24% (overconfident DOWN, n=25)
45% → 50% (perfecto, n=460) ★
55% → 58% (perfecto, n=294) ★
65% → 63% (casi perfecto, n=70)
75% → 80% (conservador, n=5)

★ donde vive el 89% de las predicciones. Es la zona que más importa — y donde el sistema está calibrado.

Honestidad operativa

La curva de aprendizaje real.

Datos 100% SIM (paper trading, bankroll virtual $10k). 251 bets ejecutados desde Fase 0 — sin autoaprendizaje, sin fees. El pico y el drawdown son el por qué existe el sistema de autocorrección que estás leyendo. Todo archivado y auditable.

PnL acumulado · 251 bets · SIM $10k · sin fees reales
Pico
+$608
Drawdown
-$1,299
Hit rate
94W / 132L
Cierre
-$691
$0 +$800+$400 -$400-$800 pico +$608 · día 1 drawdown -$738 · día 2.5 bet 0bet 125bet 251
Lectura 1

El edge predictivo existe

El edge predictivo se mantiene window tras window: WR sostenido por encima del 60% en multiples agentes con n+200 cada uno. El edge no es teórico.

Lectura 2

El sizing era el problema

El drawdown vino de apostar fuerte en ventanas de alta confianza que estadísticamente eran trampas. Sin autoaprendizaje, el sistema no sabía que esas condiciones eran peligrosas.

Lectura 3

Por eso existe esta Fase 2

La autocorrección que leíste arriba es la respuesta directa a este drawdown. Con memoria condicional, esas ventanas-trampa ya están catalogadas — la próxima vez la confianza baja automáticamente.

Unit economics

La matemática del bet individual.

Cómo gana dinero el sistema. Cada bet pasa por 3 filtros económicos: edge mínimo, Kelly cap, y costos.

Per bet · expected value

$0.57 EV por bet

p_win × payoff − p_loss × stake
= 0.640 × $7.54 − 0.360 × $10
= $4.83 − $3.60
= +$1.23 neto

Basado en V2/V4 reales (entry medio $0.57, WR 64%+). 3% fees incluidos.

Per bet · sizing

Kelly fraccionado ¼

f* = (bp − q) / b
= (0.754 × 0.640 − 0.360) / 0.754
= 16.3% del bankroll

Kelly ¼ = 4.1% del capital

¼ Kelly para reducir volatilidad a costa de ~6% de growth óptimo. Sharpe mejor que Kelly completo.

Proyección · 30 días

~430 bets proyectados

windows/día ≈ 288
× 30 días = 8,640 windows
× 8% bet rate = ~690 bets
× EV $1.23 = ~$849 sobre $10k

Bet rate conservador. Escalable linealmente con capital (respetando caps de book depth).

Riesgo

Dos mecanismos de protección

Edge mínimo≥ 2%
Kelly cap¼ · f* Kelly
Max per-bet exposure3% del capital
Max concurrent bets12 mercados
Dampener en desacuerdo fuerte× 0.5
Floor per bet$1
Escalabilidad

Capital → PnL (modelo Kelly)

CapitalBets/díaEV/mesSharpe est.
$1k~14~$251.4
$10k~14~$2451.6
$100k~14~$2,4001.6
$1M~10~$18k1.3

A $1M+ aparecen caps de book depth → bet rate cae. Edge absoluto escala, % sobre capital baja marginalmente.

Evidencia · SIM vs LIVE (data real)

El mismo cerebro, dos escalas de capital

El modelo de aprendizaje (memoria condicional arriba) entrena sobre todas las ventanas — simulación y real — porque la señal (acertar dirección) no depende del tamaño de la apuesta. Abajo separo los economics para que se vea que SIM y LIVE convergen cuando LIVE escale.

SIM (virtual) LIVE (Polymarket)
Bets ejecutados
Win rate
Size promedio
Capital total movido
PnL acumulado
ROI% (la métrica honesta)

Nota honesta: LIVE arrancó hace pocas horas con bankroll micro y bets chicos — en ese régimen las fees fijas de Polymarket pesan mucho sobre el ROI. SIM no paga fees reales. Con bankroll mayor → bets mayores → ROI LIVE converge al SIM.

Arquitectura · 4 agentes estratégicos + soporte

Cada agente con strategy propia, bankroll propio, memory propia.

Cada agent corre en paralelo, betea independiente, y compite contra los otros para validar qué strategy genera edge real.

— BaseAgent (la abstracción)
🧱
Clase base

BaseAgent

"Todos los agents heredan de mí. Misma interfaz, comportamiento consistente."

Provee state persistence (bankroll, bets), memory (short-term + pattern_book), interface estandarizada (on_window_open, on_window_close, get_stats). Cualquier agent nuevo ya hereda persistence + bookkeeping + logging.

state.jsonarchive.jsonlmemory layer
🧠
Memoria

AgentMemory

"Recuerdo qué patterns ganaron y cuáles perdieron. Cada agent aprende lo suyo."

Short-term ring buffer (últimos 20 bets) + pattern_book (signature → empirical WR). Permite que el agent recuerde rachas y ajuste sin perder contexto entre cycles.

20-bet ringsignature WRper-agent
🔧
Skills reusables

Skill Library

"Cada capacidad es una clase chica: MarketFollowing, Kelly, DrawdownGuard, Explain."

Skills compuestos libremente por cada agent. KellySizing (sizing óptimo), DrawdownGuard (pause si dd >40%), ExplainSkill (trace human-readable). Cualquier agent nuevo solo elige sus skills.

5 skillscomponiblestesteables
— Strategy agents (los que apuestan)
V1 · Scalper

V1 Scalper Agent

"GBM + AI Haiku + math fair-value. Bet siempre que vea edge mínimo."

El bot original. Logística sobre 15 features de microestructura, retrain cada 15min. Lifetime WR ~54%. Volume alto, edge bajo. Sirve de baseline.

WR 54%retrain 15minbaseline
📈
V2 · Market

V2 Market Agent

"El precio del mercado YA ES la matemática. Lo sigo cuando es claro."

Heurístico + GBM aprendido sobre 200 trades reales. Bet del lado dominante cuando market_dom_price ≥ 0.55, con confidence enriquecido por modelo. Selectivo: betea ~65% de las windows.

WR live ~64%n=200heurístico+GBM
🐋
V3 · Whales

V3 Whale Agent

"Sigo a las wallets que mueven >$1M. Si están bullish y mercado lagging, betear UP."

Skeleton WIP. Tracking de exposure agregada de whales en BTC perp + leverage avg. Trigger: bias >60% long y market price < 0.55 (lag). Validación pendiente.

whale flowWIPcross-arb
⏱️
V4 · Late-Scalp

V4 Late-Scalp Agent

"En los últimos 30s, si la math dice 95% pero mercado vende a 75%, compro."

Convergence arbitrage. Trigger: t_remaining ≤45s, dom_price ∈ [0.65, 0.85], math fair_p ≥ 0.85. El edge es que el market vende algo que la BS formula dice que vale más.

last 45sBS edgeconv arb
— Soporte (no apuestan, sirven a los agents)
📐
Calibrador

Calibrador Bayesiano

"Tu probabilidad de 70% — ¿realmente es 70%? Yo confirmo contra la realidad."

Ajusta probabilidad reportada contra frecuencia realizada por bin. Evita overconfidence sistemática del scalper.

isotonic16 binsrolling
📊
Edge Ledger

Edge Ledger 3D

"Por cada bucket (direction × vol × market richness), tengo lift histórico."

24 buckets, retrain auto. Aplica lift al edge bruto del scalper. Cap exposición agregada. Self-correction natural cada 5min.

24 bucketsauto-rebuildlift adjuster
🎯
Reality Gate

Reality Gate

"No apostamos si el spread es una joda o el book está cruzado."

Liquidez YES/NO, spread razonable, depth book. Veto silencioso si falla. Aplica a TODOS los agents.

spread < 3%depth minbook health
— Ejecución on-chain
🏦
Redeemer

The Redeemer

"Cuando una ventana resuelve, cobro los tokens ganadores on-chain. Automático."

Gnosis Safe v1.3.0 + EIP-712. CTF.redeemPositions() en Polygon. Sin intervención humana.

Safe 1.3.0CTF Polygongas-aware
⚖️
Resolver

Binance Resolver

"Polymarket dice que ganaste. Confirmo contra Binance antes de cantar victoria."

Fallback independiente. Protege contra dispute markets. Resolution automática vía klines.

spot truthfallbackdispute-safe
💠
Reconciler

Fill Reconciler

"Pediste $10. Te llenaron $7.82. El archivo dice la verdad: $7.82."

Parsea CLOB makingAmount/takingAmount. Sobreescribe size_usd con fill real, preserva intent.

CLOB parsefill ratioaudit trail
— Salud y gobierno
🛡️
Hard-Loss Lock

Hard-Loss Disarm

"Si LIVE drawdown supera 20% del peak, DISARM automático con sticky lock."

Lee balance on-chain directo via web3. No se rearma solo. Operator clear explícito requerido. Persistido entre restarts.

20% ddsticky lockon-chain truth
🩺
Doctor

The Doctor

"Gas en el Safe, APIs, freshness del book. Si algo respira mal, bloqueo operaciones."

Healthcheck continuo. MATIC gas, RPC health, data freshness. DISARM si crítico.

MATIC gasRPC healthfreshness
📋
Context

CONTEXT.md

"Antes de implementar un agent nuevo, leeme. Te ahorro días de error."

Doc compartido: cómo funciona Polymarket, mecánica de 5m/15m, signals disponibles, pitfalls comunes, edges demostrados. Single source of truth.

shared docpitfall listonboarding
Transparencia radical

Cada predicción, cada bet, firmada y auditable.

QuéDónde vivePor qué importa al inversor
Archivo de prediccionesdata/btc_5m_predictions_archive.jsonlAppend-only. Cada predicción con timestamp, features, outcome. No hay forma de retrocambiar números.
Tabla de celdas (posterior)/api/os/scalper-statusConfusion matrix, Wilson CI, y posterior por celda accesibles en endpoint público.
Bets on-chainPolymarket CLOB · PolygonCada entrada y salida verificable en Polygonscan. Hash de transacción por bet.
RedemptionGnosis Safe · EIP-712Cobro de tokens ganadores automático y verificable on-chain.
Modelo scalpersrc/brain/scalper.py · retrain 1hTemporal holdout 20%. AUC out-of-sample es la única métrica honesta de generalización.
La oportunidad

Capital para escalar el edge verificado.

El sistema ya vive en producción con capital real. Cuatro agentes corriendo en paralelo SIM, con edge demostrable en n+200 trades por agente. Los más fuertes promueven a LIVE; los débiles se descartan.

Fase 1

Capital piloto

$5–25k para validar edge a escala. PnL Kelly-ajustado instrumentado. 30 días.

Fase 2

Capital productivo

$50–250k cuando Fase 1 muestra Sharpe > 1.5 y consistencia semana a semana. Multi-mercado.

Fase 3

Producto

Cerebro como servicio: señales calibradas + ejecución para terceros. Licensing + perf fee.

¿Qué estamos buscando conversar?

Un partner con visión de infra cripto que quiera entrar temprano en un sistema con track record verificable. El producto existe, el edge es medible, y la arquitectura soporta escalar.