Control plane online · v0.3 · PWA compute + memory

La capa de cómputo que conecta tus dispositivos

cadencIA convierte navegadores, móviles y nodos propios en una red de workers web-safe coordinada por Cloudflare. Primero jobs reales, memoria local conectada a scrapers y modelos ligeros; después, nodos nativos y cómputo cooperativo más profundo.

Abrir Worker PWA Ver control plane

PWA

Worker visible

Jobs

web_safe

Memoria

scraper-ready

Wasm

Fallback universal

cadencia ~ hive · live

→ cadencia assistant --distribute "resume este contexto"

✓ Detect · WebGPU/Wasm · batería · visibilidad

✓ Pair · heartbeat PWA · claimToken temporal

✓ Route · requires · modelos · memoria

✓ Complete · resultToken · embedding opcional

✓ Job completed · web_safe · foreground · control plane global

Swarm real

Así aparece la red viva

Cada nodo es un dispositivo real que publica capacidades: navegador PWA, PC, móvil, nodo nativo, scraper local o provider como ML Trainer. Los pulsos representan jobs, memoria y resultados pasando por el control plane.

live

Nodo nativo / desktop Worker PWA móvil Provider local ML Trainer Job o resultado

01 Control plane

Lo que ya sostiene la red CadencIA

Primero jobs reales y capacidades medibles; después vendrá el P2P profundo.

Control plane global

Core

Cloudflare Worker + Durable Objects mantienen presencia, cola de jobs, leases, resultados temporales y rate limits. Los dispositivos no necesitan estar en la misma WiFi.

Heartbeat Swarm Registry Job Coordinator Result tokens

Workers PWA y nodos nativos

La PWA detecta WebGPU/Wasm, carga modelos ligeros y reclama jobs web-safe en foreground. El nodo nativo queda reservado para trabajo durable, memoria local y tareas más largas.

PWA foreground WebGPU/Wasm Rust node Modelos cargados

Routing por capacidades

Cada job declara requisitos y cada worker anuncia capacidad real: runtime, modelo cargado, foreground, tokens y tiempo máximo. Si no encaja, el job espera o cae a otro camino.

requires leases models_available foreground

Memoria local, scrapers y fallback cloud

MiniLM en navegador indexa snippets y resultados importados desde scrapers locales. Los nodos nativos custodiarán la memoria durable; el Gateway decidirá cloud fallback dentro de cupos.

MiniLM Scraper connector Vector store local Cuotas

Ejemplo de provider local

ML Trainer entra como capacidad viva del nodo

Un PC o servidor local puede entrenar modelos grandes/custom con ML Trainer y publicarlos hacia CadencIA como proveedor compatible con OpenAI. El Gateway sigue gobernando permisos, cupos y fallback; el nodo solo anuncia que esa capacidad existe y está lista.

fine-tuning local modelos custom chat/completions embeddings no provider keys en el nodo

cadencia-node

ML Trainer local

OpenAI /v1

Gateway con cuotas

02 Job flow

El ciclo de vida de un job distribuido

Del Assistant al mejor dispositivo visible y vuelta por el control plane global.

El Assistant crea el job

El navegador emisor envía prompt, modelo y requisitos web_safe al endpoint público.

Token de resultado

La API devuelve jobId y resultToken temporal para consultar solo ese resultado.

Filtro de capacidades

El scheduler compara runtime, foreground, modelo cargado, tokens y lease máximo.

Claim del worker

Una PWA visible con Aceptar jobs web reclama el trabajo usando su claimToken.

Ejecución local

El receptor usa regla local, Transformers.js o WebLLM ya cargado; no descarga modelos después de reclamar.

Complete y polling

El resultado vuelve al coordinator y el Assistant lo lee con el resultToken.

SCORING ENGINE

Cada nodo emite un Health Vector

La red no asigna tareas al azar. Combina runtime, memoria, batería, visibilidad, modelos cargados, benchmark e historial para decidir quién procesa qué.

// Node fitness function

Score

= w₁ · TFLOPS
+ w₂ · Battery%
+ w₃ · 1 / Latency
+ w₄ · Stability

wₓ ajustables por tipo de job · web_safe, embeddings, LLM ligero, fallback cloud

03 Producto

La red es la infraestructura, no el espectáculo

La UI debe enseñar qué dispositivo está vivo, qué acepta y por qué recibe o no un job.

Mapa de capacidades

El dashboard muestra navegador local, workers registrados, modelos disponibles y estado foreground para que el usuario entienda la red sin leer logs.

Memoria operativa

Embeddings locales, telemetría y datos de scrapers convierten resultados, errores, documentos y benchmarks en señales reutilizables para el siguiente routing.

Economía de cupos

Los modelos cloud entran como fallback gobernado por presupuesto, proveedor y organización; el nodo no custodia llaves ni decide gasto solo.

Antes de prometer ciencia ficción,
cadencIA mide lo que ya puede ejecutar.

El navegador ya puede ser worker web-safe. El teléfono puede aceptar jobs si está visible. El PC puede cargar modelos ligeros. La memoria puede alimentarse de scrapers locales sin exponer llaves ni forzar dispositivos pequeños. CadencIA ordena esas capacidades para que Cadences gaste menos, preserve más privacidad y use el hardware que ya existe.

Ver GitHub Habla con el equipo

04 Roadmap

De workers locales a colmena útil

Bootstrap desde dispositivos reales: PWA, nodos nativos y equipos propios antes de prometer cómputo distribuido masivo.

Q2 2026 En curso

Phase 0 · Centinelas

Workers PWA reales coordinados por Cloudflare: health, benchmark, modelos web, memoria local, conector scraper y jobs web_safe distribuidos desde el Assistant.

Worker PWA emparejable
Assistant distribuye cómputo
Memoria + scraper connector

Q3 2026 Próximo

Phase 1 · Alpha cerrada

Nodos autenticados en cadences.app aceptan jobs pequeños, memoria durable, fuentes scraper/documento y routing híbrido a modelos cloud dentro de cupos baratos o gratuitos.

Identidad de nodo
Memoria durable por scope
Triage local + fallback cloud

Q4 2026 Planificado

Phase 2 · Memoria del enjambre

Los nodos generan embeddings de telemetría, resultados y capacidades. El scheduler aprende qué dispositivo conviene para cada tipo de trabajo.

Índice local de embeddings
Búsqueda híbrida de eventos
Trust score basado en historial

2027 Planificado

Phase 3 · Cómputo cooperativo

Inferencia distribuida opt-in para tareas concretas. Primero modelos ligeros y medianos, con verificación de resultados antes de escalar a sharding complejo.

Scheduler multi-dispositivo
Verificación de outputs
Federación de hives locales