Oracle Sentinel · Casa g.

Tracción · 4 agentes en paralelo · SIM

Los números, tal como salen del archivo.

Cada agente betea independiente. Cada bet queda firmado en JSONL append-only. Nada es retrospectivo.

V2 Market-following

—%

cargando…

V1 Scalper (GBM)

—%

cargando…

V3 Whale-tracking

—%

cargando…

V4 Late-scalp

—%

cargando…

● SIM 4-agent comparison · cada uno arrancó con $100 (06-may 22:50 UTC). Última actualización: —.

Tesis

El mercado de predicción
tiene un edge calibrable.

Polymarket cotiza probabilidades. Quien calibra mejor que el market-maker, gana. Oracle Sentinel es un sistema con memoria, autoaprendizaje y ejecución on-chain automática.

01 · El edge

Probabilidades mal cotizadas

En BTC-5min y 15-min, los market-makers cotizan rápido pero con info microestructural limitada. Nuestros 4 agentes integran señales distintas (precio + book + funding + whales + math fair-value) y compiten en SIM por validar quién genera edge real.

02 · El método

Aprendizaje continuo, sin caja negra

Cada predicción se compara contra el outcome real. La historia condicional (régimen, hora, señales observadas) modula la probabilidad de la próxima. La lógica es auditable caso por caso.

03 · La ventaja

Transparencia radical

Cada predicción archivada con timestamp. Cada bet on-chain. Confusion matrix en endpoint público. Auditable por terceros en caliente.

Aprendizaje continuo

Un predictor que aprende de sus errores.

Cada predicción se archiva con su contexto: régimen de mercado, hora, volatilidad, señales secundarias. Cuando se resuelve, el sistema registra si acertó o falló. Esa historia decide el output de la siguiente.

01 · Observar

Cada bet es una lección

Cada ventana de 5 min queda archivada con su contexto completo (régimen, hora, volatilidad, señales secundarias) y su outcome real. 847 lecciones acumuladas hasta hoy.

02 · Detectar patrones

"¿Dónde tiendo a fallar?"

El sistema busca condiciones donde su accuracy baja sistemáticamente: régimen volátil, horarios específicos, confianza engañosamente alta. Los marca.

03 · Autocorregir

La próxima predicción ya sabe

Antes de emitir la siguiente probabilidad, el predictor consulta su historial en condiciones similares. Si ahí falla, ajusta confianza a la baja. Si ahí acierta, la sube.

Los patrones observados hasta hoy

El sistema cuenta el outcome real en cada combinación de señales observadas. Esta tabla es la memoria del predictor — y lo que le permite autocorregirse.

📈 señal secundaria UP

📉 señal secundaria DOWN

📈 predicción UP

✓ consenso UP

36 ventanas

Todas las señales apuntan UP. Outcome histórico confirma.

P(UP observado) = 55%

⚡ señales divergen

5 ventanas

Patrón con poca evidencia todavía. Acumulando.

P(UP observado) = 56%

📉 predicción DOWN

⚡ señales divergen

58 ventanas

Patrón bien observado. El outcome se parte casi 50/50.

P(UP observado) = 47%

✓ consenso DOWN

16 ventanas

Todas las señales apuntan DOWN. Outcome histórico confirma.

P(UP observado) = 30%

La propiedad central

Más historia = mejor predicción

A medida que cada celda acumula observaciones (umbral n≥20), su probabilidad converge a la frecuencia real del mercado en esa condición específica. No necesitamos fórmulas — la evidencia es la fórmula.

Por qué no es una black box

Cada autocorrección es auditable

"Para esta ventana, el predictor miró 58 ventanas históricas en condiciones similares y observó que 27 fueron UP. Por eso reporta 47%." Ese razonamiento es visible en cada predicción.

Roadmap de aprendizaje — 4 fases

A medida que la historia crece, la autocorrección gana dimensionalidad. Más patrones observables = predicciones más específicas al contexto.

Fase 1 · actual

shadow

Sistema registra cada predicción + outcome. Patrones 2D se empiezan a llenar.

Fase 2

autocorrección 2D

n≥20 por celda. El predictor corrige su confianza usando la frecuencia histórica observada.

Fase 3

autocorrección 3D

Incorpora régimen + hora UTC. La corrección se vuelve específica al contexto de mercado.

Fase 4

meta-learning

El propio prompt del predictor recibe su historial condicional. Convergencia hacia accuracy casi perfecto.

Autoaprendizaje en vivo

Lo que el predictor está leyendo de sí mismo, ahora.

Antes de cada predicción, el modelo recibe su memoria condicional — dónde falla, dónde acierta. Los números debajo son el contenido exacto que se inyectó en el último prompt. Endpoint público: /api/os/self-learning.

—

Ventanas en memoria

—

rolling window

Accuracy base

—

Buckets calientes

—

n≥20 con Δ ≥ 5pp

Última actualización

—

cache TTL 1h

⚠ Contextos donde fallás más

Bajar confianza aquí

Cargando…

✓ Contextos donde acertás más

Subir confianza aquí

Cargando…

Heatmap · régimen × microestructura

Dónde el predictor es fuerte y dónde es frágil

Intersección: accuracy según régimen de precio y si la señal de microestructura concuerda. Loden = acertás más que el promedio; oxblood = menos. Gris = n<20 (aún aprendiendo).

Accuracy desagregada — últimas 500 ventanas

Por dimensión, qué tan bien predice el modelo

Cada barra es un bucket. La línea vertical punteada marca la accuracy base global. A la izquierda, peor; a la derecha, mejor. El largo incluye el número de observaciones (n).

Cargando gráficos…

Fuente: oraclesentinel.bajczman.com/api/os/self-learning · público · CORS abierto · auditable por terceros

Honestidad probabilística

Cuando decimos 65%, sale 65%.

El reliability diagram compara la probabilidad reportada (eje X) con la frecuencia real observada (eje Y). La diagonal es perfección. Estar cerca de la diagonal significa que el sistema no está sobre- ni sub-confiado.

Lectura

Calibración: prácticamente perfecta

Los dos buckets más poblados (n=460 en 45%, n=294 en 55%) caen casi exactamente sobre la diagonal. Eso es calibración real: cuando el oráculo dice 55%, sale 58%. Cuando dice 45%, sale 50%.

reported → realized
35% → 24% (overconfident DOWN, n=25)
45% → 50% (perfecto, n=460) ★
55% → 58% (perfecto, n=294) ★
65% → 63% (casi perfecto, n=70)
75% → 80% (conservador, n=5)

★ donde vive el 89% de las predicciones. Es la zona que más importa — y donde el sistema está calibrado.

Honestidad operativa

La curva de aprendizaje real.

Datos 100% SIM (paper trading, bankroll virtual $10k). 251 bets ejecutados desde Fase 0 — sin autoaprendizaje, sin fees. El pico y el drawdown son el por qué existe el sistema de autocorrección que estás leyendo. Todo archivado y auditable.

PnL acumulado · 251 bets · SIM $10k · sin fees reales

Pico

+$608

Drawdown

-$1,299

Hit rate

94W / 132L

Cierre

-$691

Lectura 1

El edge predictivo existe

El edge predictivo se mantiene window tras window: WR sostenido por encima del 60% en multiples agentes con n+200 cada uno. El edge no es teórico.

Lectura 2

El sizing era el problema

El drawdown vino de apostar fuerte en ventanas de alta confianza que estadísticamente eran trampas. Sin autoaprendizaje, el sistema no sabía que esas condiciones eran peligrosas.

Lectura 3

Por eso existe esta Fase 2

La autocorrección que leíste arriba es la respuesta directa a este drawdown. Con memoria condicional, esas ventanas-trampa ya están catalogadas — la próxima vez la confianza baja automáticamente.

Unit economics

La matemática del bet individual.

Cómo gana dinero el sistema. Cada bet pasa por 3 filtros económicos: edge mínimo, Kelly cap, y costos.

Per bet · expected value

$0.57 EV por bet

p_win × payoff − p_loss × stake
= 0.640 × $7.54 − 0.360 × $10
= $4.83 − $3.60
= +$1.23 neto

Basado en V2/V4 reales (entry medio $0.57, WR 64%+). 3% fees incluidos.

Per bet · sizing

Kelly fraccionado ¼

f* = (bp − q) / b
= (0.754 × 0.640 − 0.360) / 0.754
= 16.3% del bankroll

Kelly ¼ = 4.1% del capital

¼ Kelly para reducir volatilidad a costa de ~6% de growth óptimo. Sharpe mejor que Kelly completo.

Proyección · 30 días

~430 bets proyectados

windows/día ≈ 288
× 30 días = 8,640 windows
× 8% bet rate = ~690 bets
× EV $1.23 = ~$849 sobre $10k

Bet rate conservador. Escalable linealmente con capital (respetando caps de book depth).

Riesgo

Dos mecanismos de protección

Edge mínimo	≥ 2%
Kelly cap	¼ · f* Kelly
Max per-bet exposure	3% del capital
Max concurrent bets	12 mercados
Dampener en desacuerdo fuerte	× 0.5
Floor per bet	$1

Escalabilidad

Capital → PnL (modelo Kelly)

Capital	Bets/día	EV/mes	Sharpe est.
$1k	~14	~$25	1.4
$10k	~14	~$245	1.6
$100k	~14	~$2,400	1.6
$1M	~10	~$18k	1.3

A $1M+ aparecen caps de book depth → bet rate cae. Edge absoluto escala, % sobre capital baja marginalmente.

Evidencia · SIM vs LIVE (data real)

El mismo cerebro, dos escalas de capital

El modelo de aprendizaje (memoria condicional arriba) entrena sobre todas las ventanas — simulación y real — porque la señal (acertar dirección) no depende del tamaño de la apuesta. Abajo separo los economics para que se vea que SIM y LIVE convergen cuando LIVE escale.

	SIM (virtual)	LIVE (Polymarket)
Bets ejecutados	—	—
Win rate	—	—
Size promedio	—	—
Capital total movido	—	—
PnL acumulado	—	—
ROI% (la métrica honesta)	—	—

Nota honesta: LIVE arrancó hace pocas horas con bankroll micro y bets chicos — en ese régimen las fees fijas de Polymarket pesan mucho sobre el ROI. SIM no paga fees reales. Con bankroll mayor → bets mayores → ROI LIVE converge al SIM.

Arquitectura · 4 agentes estratégicos + soporte

Cada agente con strategy propia, bankroll propio, memory propia.

Cada agent corre en paralelo, betea independiente, y compite contra los otros para validar qué strategy genera edge real.

— BaseAgent (la abstracción)

🧱

Clase base

BaseAgent

"Todos los agents heredan de mí. Misma interfaz, comportamiento consistente."

Provee state persistence (bankroll, bets), memory (short-term + pattern_book), interface estandarizada (on_window_open, on_window_close, get_stats). Cualquier agent nuevo ya hereda persistence + bookkeeping + logging.

state.jsonarchive.jsonlmemory layer

🧠

Memoria

AgentMemory

"Recuerdo qué patterns ganaron y cuáles perdieron. Cada agent aprende lo suyo."

Short-term ring buffer (últimos 20 bets) + pattern_book (signature → empirical WR). Permite que el agent recuerde rachas y ajuste sin perder contexto entre cycles.

20-bet ringsignature WRper-agent

🔧

Skills reusables

Skill Library

"Cada capacidad es una clase chica: MarketFollowing, Kelly, DrawdownGuard, Explain."

Skills compuestos libremente por cada agent. KellySizing (sizing óptimo), DrawdownGuard (pause si dd >40%), ExplainSkill (trace human-readable). Cualquier agent nuevo solo elige sus skills.

5 skillscomponiblestesteables

— Strategy agents (los que apuestan)

⚡

V1 · Scalper

V1 Scalper Agent

"GBM + AI Haiku + math fair-value. Bet siempre que vea edge mínimo."

El bot original. Logística sobre 15 features de microestructura, retrain cada 15min. Lifetime WR ~54%. Volume alto, edge bajo. Sirve de baseline.

WR 54%retrain 15minbaseline

📈

V2 · Market

V2 Market Agent

"El precio del mercado YA ES la matemática. Lo sigo cuando es claro."

Heurístico + GBM aprendido sobre 200 trades reales. Bet del lado dominante cuando market_dom_price ≥ 0.55, con confidence enriquecido por modelo. Selectivo: betea ~65% de las windows.

WR live ~64%n=200heurístico+GBM

🐋

V3 · Whales

V3 Whale Agent

"Sigo a las wallets que mueven >$1M. Si están bullish y mercado lagging, betear UP."

Skeleton WIP. Tracking de exposure agregada de whales en BTC perp + leverage avg. Trigger: bias >60% long y market price < 0.55 (lag). Validación pendiente.

whale flowWIPcross-arb

⏱️

V4 · Late-Scalp

V4 Late-Scalp Agent

"En los últimos 30s, si la math dice 95% pero mercado vende a 75%, compro."

Convergence arbitrage. Trigger: t_remaining ≤45s, dom_price ∈ [0.65, 0.85], math fair_p ≥ 0.85. El edge es que el market vende algo que la BS formula dice que vale más.

last 45sBS edgeconv arb

— Soporte (no apuestan, sirven a los agents)

📐

Calibrador

Calibrador Bayesiano

"Tu probabilidad de 70% — ¿realmente es 70%? Yo confirmo contra la realidad."

Ajusta probabilidad reportada contra frecuencia realizada por bin. Evita overconfidence sistemática del scalper.

isotonic16 binsrolling

📊

Edge Ledger

Edge Ledger 3D

"Por cada bucket (direction × vol × market richness), tengo lift histórico."

24 buckets, retrain auto. Aplica lift al edge bruto del scalper. Cap exposición agregada. Self-correction natural cada 5min.

24 bucketsauto-rebuildlift adjuster

🎯

Reality Gate

"No apostamos si el spread es una joda o el book está cruzado."

Liquidez YES/NO, spread razonable, depth book. Veto silencioso si falla. Aplica a TODOS los agents.

spread < 3%depth minbook health

— Ejecución on-chain

🏦

Redeemer

The Redeemer

"Cuando una ventana resuelve, cobro los tokens ganadores on-chain. Automático."

Gnosis Safe v1.3.0 + EIP-712. CTF.redeemPositions() en Polygon. Sin intervención humana.

Safe 1.3.0CTF Polygongas-aware

⚖️

Resolver

Binance Resolver

"Polymarket dice que ganaste. Confirmo contra Binance antes de cantar victoria."

Fallback independiente. Protege contra dispute markets. Resolution automática vía klines.

spot truthfallbackdispute-safe

💠

Reconciler

Fill Reconciler

"Pediste $10. Te llenaron $7.82. El archivo dice la verdad: $7.82."

Parsea CLOB makingAmount/takingAmount. Sobreescribe size_usd con fill real, preserva intent.

CLOB parsefill ratioaudit trail

— Salud y gobierno

🛡️

Hard-Loss Lock

Hard-Loss Disarm

"Si LIVE drawdown supera 20% del peak, DISARM automático con sticky lock."

Lee balance on-chain directo via web3. No se rearma solo. Operator clear explícito requerido. Persistido entre restarts.

20% ddsticky lockon-chain truth

🩺

Doctor

The Doctor

"Gas en el Safe, APIs, freshness del book. Si algo respira mal, bloqueo operaciones."

Healthcheck continuo. MATIC gas, RPC health, data freshness. DISARM si crítico.

MATIC gasRPC healthfreshness

📋

Context

CONTEXT.md

"Antes de implementar un agent nuevo, leeme. Te ahorro días de error."

Doc compartido: cómo funciona Polymarket, mecánica de 5m/15m, signals disponibles, pitfalls comunes, edges demostrados. Single source of truth.

shared docpitfall listonboarding

Transparencia radical

Cada predicción, cada bet, firmada y auditable.

Qué	Dónde vive	Por qué importa al inversor
Archivo de predicciones	data/btc_5m_predictions_archive.jsonl	Append-only. Cada predicción con timestamp, features, outcome. No hay forma de retrocambiar números.
Tabla de celdas (posterior)	/api/os/scalper-status	Confusion matrix, Wilson CI, y posterior por celda accesibles en endpoint público.
Bets on-chain	Polymarket CLOB · Polygon	Cada entrada y salida verificable en Polygonscan. Hash de transacción por bet.
Redemption	Gnosis Safe · EIP-712	Cobro de tokens ganadores automático y verificable on-chain.
Modelo scalper	src/brain/scalper.py · retrain 1h	Temporal holdout 20%. AUC out-of-sample es la única métrica honesta de generalización.

La oportunidad

Capital para escalar el edge verificado.

El sistema ya vive en producción con capital real. Cuatro agentes corriendo en paralelo SIM, con edge demostrable en n+200 trades por agente. Los más fuertes promueven a LIVE; los débiles se descartan.

Fase 1

Capital piloto

$5–25k para validar edge a escala. PnL Kelly-ajustado instrumentado. 30 días.

Fase 2

Capital productivo

$50–250k cuando Fase 1 muestra Sharpe > 1.5 y consistencia semana a semana. Multi-mercado.

Fase 3

Producto

Cerebro como servicio: señales calibradas + ejecución para terceros. Licensing + perf fee.

¿Qué estamos buscando conversar?

Un partner con visión de infra cripto que quiera entrar temprano en un sistema con track record verificable. El producto existe, el edge es medible, y la arquitectura soporta escalar.

Conversemos → Ver cómo aprende

Los números, tal como salen del archivo.

El mercado de prediccióntiene un edge calibrable.

Probabilidades mal cotizadas

Aprendizaje continuo, sin caja negra

Transparencia radical

Un predictor que aprende de sus errores.

Cada bet es una lección

"¿Dónde tiendo a fallar?"

La próxima predicción ya sabe

Los patrones observados hasta hoy

Más historia = mejor predicción

Cada autocorrección es auditable

Roadmap de aprendizaje — 4 fases

Lo que el predictor está leyendo de sí mismo, ahora.

Bajar confianza aquí

Subir confianza aquí

Dónde el predictor es fuerte y dónde es frágil

Por dimensión, qué tan bien predice el modelo

Cuando decimos 65%, sale 65%.

Calibración: prácticamente perfecta

La curva de aprendizaje real.

El edge predictivo existe

El sizing era el problema

Por eso existe esta Fase 2

La matemática del bet individual.

$0.57 EV por bet

Kelly fraccionado ¼

~430 bets proyectados

Dos mecanismos de protección

Capital → PnL (modelo Kelly)

El mismo cerebro, dos escalas de capital

Cada agente con strategy propia, bankroll propio, memory propia.

BaseAgent

AgentMemory

Skill Library

V1 Scalper Agent

V2 Market Agent

V3 Whale Agent

V4 Late-Scalp Agent

Calibrador Bayesiano

Edge Ledger 3D

Reality Gate

The Redeemer

Binance Resolver

Fill Reconciler

Hard-Loss Disarm

The Doctor

CONTEXT.md

Cada predicción, cada bet, firmada y auditable.

Capital para escalar el edge verificado.

Capital piloto

Capital productivo

Producto

¿Qué estamos buscando conversar?

El mercado de predicción
tiene un edge calibrable.