Descifrando el Algoritmo de X

Guía Maestra de Ingeniería: Desde el Home Mixer hasta la IA Grok

Bienvenidos a una nueva entrega de la serie. Hoy nos sumergimos en las entrañas de X (antes Twitter) para entender cómo funciona su sistema de recomendación en tiempo real [1]. Con la liberación del código bajo la licencia Apache 2.0, el equipo de xAI ha permitido que analicemos una arquitectura que combina Rust (62.9%) para el rendimiento y Python (37.1%) para el aprendizaje automático [2, 3].

1. La Arquitectura Maestra: El "Home Mixer"

El sistema de recomendación no es un bloque monolítico, sino una tubería (pipeline) orquestada por un componente central llamado Home Mixer [2, 4].

graph TD A[Usuario solicita Feed] --> B[Home Mixer] B --> C[Query Hydration: Engagement e Historial] C --> D[Fuentes de Candidatos] D --> E[Thunder: In-Network] D --> F[Phoenix: Out-of-Network] E --> G[Filtrado y Scoring] F --> G G --> H[Selección Top K] H --> I[Feed Personalizado]

Este motor procesa dos fuentes principales de contenido [5, 6]:

In-Network (Thunder): Publicaciones de personas que ya sigues. Se almacenan en memoria para respuestas de sub-milisegundos [7, 8].
Out-of-Network (Phoenix): Publicaciones de cuentas que no sigues, descubiertas mediante similarity search (búsqueda de similitud) con embeddings [5, 9].

2. Phoenix: El Cerebro Transformer

El corazón de la clasificación es Phoenix, que utiliza un modelo de lenguaje basado en la arquitectura de Grok-1 [10, 11]. Lo más innovador es que el sistema ha eliminado casi todas las reglas manuales y heurísticas en favor de una red neuronal que aprende directamente de las secuencias de interacción del usuario [12, 13].

¿Cómo se calcula tu puntuación de relevancia?

X no predice solo si te "gustará" un post. Predice la probabilidad de más de 15 acciones diferentes [4, 14]. El Weighted Scorer combina estas probabilidades en una fórmula final [15, 16]:

    Fórmula de Scoring:

    Final Score = Σ (peso de la acción × probabilidad predicha de esa acción) [12, 17]

Señal Positiva (Suma puntos)	Señal Negativa (Resta puntos)
Likes, Retweets, Respuestas [14, 18]	Bloqueos, Menciones de "No me interesa" [17, 18]
Clics en el perfil, Tiempo de lectura (Dwell time) [14, 19]	Reportes de spam o contenido violento [17, 18]
Ver un video, Seguir al autor [14, 18]	Silenciar (Mute) al autor [17, 18]

3. La Evolución de Grok: El Motor Detrás de la IA

Desde el lanzamiento inicial de Grok-1 con 314 mil millones de parámetros y arquitectura Mixture-of-Experts (MoE) [20, 21], la tecnología ha avanzado exponencialmente:

Grok-1.5: Introdujo una ventana de contexto de 128,000 tokens y capacidades mejoradas de razonamiento lógico y matemático [22, 23].
Grok 4.20 Beta: El modelo actual de bandera con una ventana de contexto masiva de 2,000,000 de tokens y capacidades multi-agente [24].

Comparativa de Capacidades de Razonamiento

Benchmark	Grok-1 [23]	Grok-1.5 [23]	GPT-4 (Ref.) [23]
MATH	23.9%	50.6%	52.9%
GSM8K (Mates)	62.9%	90.0%	92.0%
HumanEval (Código)	63.2%	74.1%	67.0%

4. Seguridad y Gestión de Riesgos

xAI ha desarrollado un marco de gestión de riesgos (RMF) para evitar el uso malicioso de sus modelos más avanzados [25, 26]. Se evalúan riesgos como el desarrollo de armas biológicas o ataques cibernéticos a través de benchmarks específicos [27, 28].

Circuit Breakers: Ingeniería de representación para interrumpir salidas peligrosas [29].
Deception Test (MASK): Evalúa si el modelo miente bajo presión [30, 31].
WMDP (Weapons of Mass Destruction Proxy): Mide el conocimiento peligroso en bioseguridad y ciberseguridad [32, 33].

5. Costos y API: Construyendo con Grok

Para los desarrolladores, xAI ofrece una API flexible. Recientemente, los precios de las herramientas de agente bajaron hasta un 50% [34].

Modelo	Contexto	Precio (Entrada / Salida) x 1M Tokens
Grok-4.20-multi-agent	2,000,000 [24]	$2.00 / $6.00 [35]
Grok-4-fast	2,000,000 [35]	$0.20 / $0.50 [35]
Batch API (Asíncrono)	-	50% de descuento [36, 37]

🎨 Prompts Sugeridos para Generar Imágenes del Blog

Utiliza estos prompts en Grok Imagine o Midjourney para ilustrar tu post:

"A futuristic 3D visualization of a social media algorithm, digital streams of data flowing through a transparent neural network shaped like an 'X', cybernetic aesthetic, high detail, 8k."
"Illustration of a robotic conductor leading an orchestra of data servers, neon blue and black colors, representing the Home Mixer orchestration layer."
"Minimalist conceptual art of a 'Mixture of Experts' architecture: eight glowing geometric minds collaborating inside a large digital brain, tech-vibe."

Referencias y Enlaces Oficiales

Repositorio del Algoritmo (GitHub): https://github.com/xai-org/x-algorithm [38]
Repositorio de Grok-1 (GitHub): https://github.com/xai-org/grok-1 [39]
Documentación y API de xAI: https://console.x.ai [40, 41]
Blog de Noticias xAI: https://x.ai/blog [20, 22]
Estado de los Servicios: https://status.x.ai [42]