Descifrando el Algoritmo de X

Guía Maestra de Ingeniería: Desde el Home Mixer hasta la IA Grok

Bienvenidos a una nueva entrega de la serie. Hoy nos sumergimos en las entrañas de X (antes Twitter) para entender cómo funciona su sistema de recomendación en tiempo real [1]. Con la liberación del código bajo la licencia Apache 2.0, el equipo de xAI ha permitido que analicemos una arquitectura que combina Rust (62.9%) para el rendimiento y Python (37.1%) para el aprendizaje automático [2, 3].

1. La Arquitectura Maestra: El "Home Mixer"

El sistema de recomendación no es un bloque monolítico, sino una tubería (pipeline) orquestada por un componente central llamado Home Mixer [2, 4].

graph TD A[Usuario solicita Feed] --> B[Home Mixer] B --> C[Query Hydration: Engagement e Historial] C --> D[Fuentes de Candidatos] D --> E[Thunder: In-Network] D --> F[Phoenix: Out-of-Network] E --> G[Filtrado y Scoring] F --> G G --> H[Selección Top K] H --> I[Feed Personalizado]

Este motor procesa dos fuentes principales de contenido [5, 6]:

2. Phoenix: El Cerebro Transformer

El corazón de la clasificación es Phoenix, que utiliza un modelo de lenguaje basado en la arquitectura de Grok-1 [10, 11]. Lo más innovador es que el sistema ha eliminado casi todas las reglas manuales y heurísticas en favor de una red neuronal que aprende directamente de las secuencias de interacción del usuario [12, 13].

¿Cómo se calcula tu puntuación de relevancia?

X no predice solo si te "gustará" un post. Predice la probabilidad de más de 15 acciones diferentes [4, 14]. El Weighted Scorer combina estas probabilidades en una fórmula final [15, 16]:

Fórmula de Scoring:
Final Score = Σ (peso de la acción × probabilidad predicha de esa acción) [12, 17]
Señal Positiva (Suma puntos) Señal Negativa (Resta puntos)
Likes, Retweets, Respuestas [14, 18] Bloqueos, Menciones de "No me interesa" [17, 18]
Clics en el perfil, Tiempo de lectura (Dwell time) [14, 19] Reportes de spam o contenido violento [17, 18]
Ver un video, Seguir al autor [14, 18] Silenciar (Mute) al autor [17, 18]

3. La Evolución de Grok: El Motor Detrás de la IA

Desde el lanzamiento inicial de Grok-1 con 314 mil millones de parámetros y arquitectura Mixture-of-Experts (MoE) [20, 21], la tecnología ha avanzado exponencialmente:

Comparativa de Capacidades de Razonamiento

Benchmark Grok-1 [23] Grok-1.5 [23] GPT-4 (Ref.) [23]
MATH 23.9% 50.6% 52.9%
GSM8K (Mates) 62.9% 90.0% 92.0%
HumanEval (Código) 63.2% 74.1% 67.0%

4. Seguridad y Gestión de Riesgos

xAI ha desarrollado un marco de gestión de riesgos (RMF) para evitar el uso malicioso de sus modelos más avanzados [25, 26]. Se evalúan riesgos como el desarrollo de armas biológicas o ataques cibernéticos a través de benchmarks específicos [27, 28].

5. Costos y API: Construyendo con Grok

Para los desarrolladores, xAI ofrece una API flexible. Recientemente, los precios de las herramientas de agente bajaron hasta un 50% [34].

Modelo Contexto Precio (Entrada / Salida) x 1M Tokens
Grok-4.20-multi-agent 2,000,000 [24] $2.00 / $6.00 [35]
Grok-4-fast 2,000,000 [35] $0.20 / $0.50 [35]
Batch API (Asíncrono) - 50% de descuento [36, 37]

🎨 Prompts Sugeridos para Generar Imágenes del Blog

Utiliza estos prompts en Grok Imagine o Midjourney para ilustrar tu post:

Referencias y Enlaces Oficiales