El superordenador que ya tienes en casa
cadencIA fragmenta modelos de IA gigantes en una colmena P2P de móviles, PCs y NPUs domésticas. Sin centros de datos. Sin facturas eléctricas billonarias. Solo el calor que ya disipa tu hardware.
✓ Sharding · 12 layers → 4 alpha · 8 beta nodes
✓ Routing · WebRTC mesh · 5ms local cluster
✓ KV cache · INT4 quantized · −80% bandwidth
✓ Consensus · Merkle hash OK · 0 byzantine
Así late la colmena
Cada nodo es un dispositivo real (móvil, PC, NPU). Los pulsos azules son tensores viajando entre shards en tiempo real.
Cuatro pilares que sostienen la colmena
No es un paper académico: es la fisiología del sistema nervioso distribuido.
Mesh P2P dinámica
CoreRed elástica sobre WebRTC con DHT modificada. La distancia es lógica, no geográfica: si hay pocos nodos, España y Nueva Zelanda son adyacentes.
Inference sharding híbrido
Pipeline parallelism por capas + cross-node attention. MLP a nodos beta (móviles), atención a nodos alpha con RAM y corriente. KV cache cuantizado a INT4.
BFT + zero-trust
Árboles de Merkle dinámicos firman cada tensor. Slashing criptográfico para nodos tóxicos. Fragmentación = anonimización: ningún nodo ve el prompt completo.
Runtime universal
Mismo kernel Wasm en iOS, Android, Windows y Linux. WebGPU habla directo con NPU del móvil o Tensor Cores de NVIDIA sin reescribir nada.
El ciclo de vida de un prompt
De tu pulgar a 12 dispositivos repartidos por el mundo y vuelta — sin pasar por AWS.
Tokenización local
Tu dispositivo convierte el prompt en tokens y lo cifra de extremo a extremo.
Segmentación
El orquestador local divide el modelo en 12 shards consultando la tabla de nodos cercanos.
Inyección P2P
Los shards viajan por túneles WebRTC. Broadcast a 3 nodos: gana el más rápido.
Cascada de cómputo
Nodo A capas 1-5 → Nodo B capas 6-10 → Nodo C bloque final. KV cache compartido en INT4.
Consenso Merkle
El ensamblador valida hashes parciales. Si un nodo mintió, slashing inmediato.
De-tokenización
La respuesta vuelve al usuario. Latencia objetivo: < 1.5s en cluster local.
Cada nodo emite un Health Vector
La colmena no asigna tareas al azar. Una función de aptitud combina TFLOPS, batería, latencia y estabilidad histórica para decidir quién procesa qué — y los pesos cambian según la tarea.
+ w₂ · Battery%
+ w₃ · 1 / Latency
+ w₄ · Stability
El metaverso es la interfaz, no el producto
Cada operación tensorial se proyecta como una mecánica de juego. La latencia se ve. El consenso se juega. El cómputo se construye.
Proyección MDS
Las latencias entre nodos no son euclídeas. Un algoritmo de fuerzas colapsa la matriz de distancias en un mapa 2D/3D donde "cerca" significa "rápido".
Sincronización CRDT
Sin servidor central, la misma tecnología que mueve Figma garantiza que tu ciudad y la del vecino convergen sin importar el orden de los paquetes.
Economía del vatio
Recompensa = ∫ (Task_Complexity · Uptime) · Efficiency_Factor. Si tu móvil se calienta, tu factor cae. Incentiva hardware sano, no minería ciega.
Mientras OpenAI paga refrigeración,
cadencIA usa el calor que ya disipas.
La energía está pagada. Las NPUs están ociosas. Las redes domésticas son autopistas con baches — no las tratamos como tuberías perfectas, las diseñamos para sobrevivir a la pérdida constante de paquetes. Eso es el modelo de procesamiento más sostenible y democrático que existe.
De semilla en la nube a colmena 100% edge
Bootstrap controlado: nuestros nodos centinela arrancan la red, la comunidad la hereda.
Phase 0 · Centinelas
Despliegue de nodos semilla en AWS/Azure que actúan como "jugadores fantasma". Soportan el 90% del cómputo inicial.
- Orquestador local v0.1
- Wasm runtime POC
- Mesh con 3 regiones
Phase 1 · Alpha pública
Apertura a 500 dispositivos reales. Pipeline parallelism con Llama-3 8B fragmentado en 4 nodos.
- Cliente iOS / Android
- KV cache INT4
- Trust score v1
Phase 2 · Mundo Acordeón
Capa visual gamificada. CRDTs sincronizando estado. Proyección MDS de latencias.
- Editor de ciudad
- Créditos verificables
- Speculative decoding
Phase 3 · Centinelas off
Los nodos cloud se apagan. Infraestructura 100% comunitaria. Modelos de 70B operando sobre la colmena.
- Cross-node attention
- BFT al completo
- Federación de hives