Hive online · v0.1 · bootstrap

El superordenador que ya tienes en casa

cadencIA fragmenta modelos de IA gigantes en una colmena P2P de móviles, PCs y NPUs domésticas. Sin centros de datos. Sin facturas eléctricas billonarias. Solo el calor que ya disipa tu hardware.

P2P
Mesh dinámica
INT4
KV cache
BFT
Consenso
Wasm
Runtime universal
cadencia ~ hive · live
cadencia infer --model llama3-70b "explain RAFT"

Sharding · 12 layers → 4 alpha · 8 beta nodes

Routing · WebRTC mesh · 5ms local cluster

KV cache · INT4 quantized · −80% bandwidth

Consensus · Merkle hash OK · 0 byzantine

Response assembled · 247 tokens · 1.2s · 0 datacenters used
Live mesh

Así late la colmena

Cada nodo es un dispositivo real (móvil, PC, NPU). Los pulsos azules son tensores viajando entre shards en tiempo real.

live
Nodo alpha (PC / NPU) Nodo beta (móvil) Tensor en tránsito
01 Sala de máquinas

Cuatro pilares que sostienen la colmena

No es un paper académico: es la fisiología del sistema nervioso distribuido.

01

Mesh P2P dinámica

Core

Red elástica sobre WebRTC con DHT modificada. La distancia es lógica, no geográfica: si hay pocos nodos, España y Nueva Zelanda son adyacentes.

WebRTC Kademlia Gossip protocol UDP cifrado
02

Inference sharding híbrido

Pipeline parallelism por capas + cross-node attention. MLP a nodos beta (móviles), atención a nodos alpha con RAM y corriente. KV cache cuantizado a INT4.

Pipeline parallel MLP shard KV cache INT4 Speculative decoding
03

BFT + zero-trust

Árboles de Merkle dinámicos firman cada tensor. Slashing criptográfico para nodos tóxicos. Fragmentación = anonimización: ningún nodo ve el prompt completo.

Merkle proofs Slashing TEE Trust score
04

Runtime universal

Mismo kernel Wasm en iOS, Android, Windows y Linux. WebGPU habla directo con NPU del móvil o Tensor Cores de NVIDIA sin reescribir nada.

WebAssembly WebGPU NPU Sandbox
02 Pipeline flow

El ciclo de vida de un prompt

De tu pulgar a 12 dispositivos repartidos por el mundo y vuelta — sin pasar por AWS.

01

Tokenización local

Tu dispositivo convierte el prompt en tokens y lo cifra de extremo a extremo.

02

Segmentación

El orquestador local divide el modelo en 12 shards consultando la tabla de nodos cercanos.

03

Inyección P2P

Los shards viajan por túneles WebRTC. Broadcast a 3 nodos: gana el más rápido.

04

Cascada de cómputo

Nodo A capas 1-5 → Nodo B capas 6-10 → Nodo C bloque final. KV cache compartido en INT4.

05

Consenso Merkle

El ensamblador valida hashes parciales. Si un nodo mintió, slashing inmediato.

06

De-tokenización

La respuesta vuelve al usuario. Latencia objetivo: < 1.5s en cluster local.

SCORING ENGINE

Cada nodo emite un Health Vector

La colmena no asigna tareas al azar. Una función de aptitud combina TFLOPS, batería, latencia y estabilidad histórica para decidir quién procesa qué — y los pesos cambian según la tarea.

// Node fitness function
Score
= w₁ · TFLOPS
+ w₂ · Battery%
+ w₃ · 1 / Latency
+ w₄ · Stability
wₓ ajustables por tipo de tarea · inferencia LLM → w₃ domina
03 Mundo Acordeón

El metaverso es la interfaz, no el producto

Cada operación tensorial se proyecta como una mecánica de juego. La latencia se ve. El consenso se juega. El cómputo se construye.

Proyección MDS

Las latencias entre nodos no son euclídeas. Un algoritmo de fuerzas colapsa la matriz de distancias en un mapa 2D/3D donde "cerca" significa "rápido".

Sincronización CRDT

Sin servidor central, la misma tecnología que mueve Figma garantiza que tu ciudad y la del vecino convergen sin importar el orden de los paquetes.

Economía del vatio

Recompensa = ∫ (Task_Complexity · Uptime) · Efficiency_Factor. Si tu móvil se calienta, tu factor cae. Incentiva hardware sano, no minería ciega.

Mientras OpenAI paga refrigeración,
cadencIA usa el calor que ya disipas.

La energía está pagada. Las NPUs están ociosas. Las redes domésticas son autopistas con baches — no las tratamos como tuberías perfectas, las diseñamos para sobrevivir a la pérdida constante de paquetes. Eso es el modelo de procesamiento más sostenible y democrático que existe.

04 Roadmap

De semilla en la nube a colmena 100% edge

Bootstrap controlado: nuestros nodos centinela arrancan la red, la comunidad la hereda.

Q2 2026 En curso

Phase 0 · Centinelas

Despliegue de nodos semilla en AWS/Azure que actúan como "jugadores fantasma". Soportan el 90% del cómputo inicial.

  • Orquestador local v0.1
  • Wasm runtime POC
  • Mesh con 3 regiones
Q3 2026 Próximo

Phase 1 · Alpha pública

Apertura a 500 dispositivos reales. Pipeline parallelism con Llama-3 8B fragmentado en 4 nodos.

  • Cliente iOS / Android
  • KV cache INT4
  • Trust score v1
Q4 2026 Planificado

Phase 2 · Mundo Acordeón

Capa visual gamificada. CRDTs sincronizando estado. Proyección MDS de latencias.

  • Editor de ciudad
  • Créditos verificables
  • Speculative decoding
2027 Planificado

Phase 3 · Centinelas off

Los nodos cloud se apagan. Infraestructura 100% comunitaria. Modelos de 70B operando sobre la colmena.

  • Cross-node attention
  • BFT al completo
  • Federación de hives