Guía Maestra de Ingeniería: Desde el Home Mixer hasta la IA Grok
Bienvenidos a una nueva entrega de la serie. Hoy nos sumergimos en las entrañas de X (antes Twitter) para entender cómo funciona su sistema de recomendación en tiempo real [1]. Con la liberación del código bajo la licencia Apache 2.0, el equipo de xAI ha permitido que analicemos una arquitectura que combina Rust (62.9%) para el rendimiento y Python (37.1%) para el aprendizaje automático [2, 3].
El sistema de recomendación no es un bloque monolítico, sino una tubería (pipeline) orquestada por un componente central llamado Home Mixer [2, 4].
Este motor procesa dos fuentes principales de contenido [5, 6]:
El corazón de la clasificación es Phoenix, que utiliza un modelo de lenguaje basado en la arquitectura de Grok-1 [10, 11]. Lo más innovador es que el sistema ha eliminado casi todas las reglas manuales y heurísticas en favor de una red neuronal que aprende directamente de las secuencias de interacción del usuario [12, 13].
X no predice solo si te "gustará" un post. Predice la probabilidad de más de 15 acciones diferentes [4, 14]. El Weighted Scorer combina estas probabilidades en una fórmula final [15, 16]:
| Señal Positiva (Suma puntos) | Señal Negativa (Resta puntos) |
|---|---|
| Likes, Retweets, Respuestas [14, 18] | Bloqueos, Menciones de "No me interesa" [17, 18] |
| Clics en el perfil, Tiempo de lectura (Dwell time) [14, 19] | Reportes de spam o contenido violento [17, 18] |
| Ver un video, Seguir al autor [14, 18] | Silenciar (Mute) al autor [17, 18] |
Desde el lanzamiento inicial de Grok-1 con 314 mil millones de parámetros y arquitectura Mixture-of-Experts (MoE) [20, 21], la tecnología ha avanzado exponencialmente:
| Benchmark | Grok-1 [23] | Grok-1.5 [23] | GPT-4 (Ref.) [23] |
|---|---|---|---|
| MATH | 23.9% | 50.6% | 52.9% |
| GSM8K (Mates) | 62.9% | 90.0% | 92.0% |
| HumanEval (Código) | 63.2% | 74.1% | 67.0% |
xAI ha desarrollado un marco de gestión de riesgos (RMF) para evitar el uso malicioso de sus modelos más avanzados [25, 26]. Se evalúan riesgos como el desarrollo de armas biológicas o ataques cibernéticos a través de benchmarks específicos [27, 28].
Para los desarrolladores, xAI ofrece una API flexible. Recientemente, los precios de las herramientas de agente bajaron hasta un 50% [34].
| Modelo | Contexto | Precio (Entrada / Salida) x 1M Tokens |
|---|---|---|
| Grok-4.20-multi-agent | 2,000,000 [24] | $2.00 / $6.00 [35] |
| Grok-4-fast | 2,000,000 [35] | $0.20 / $0.50 [35] |
| Batch API (Asíncrono) | - | 50% de descuento [36, 37] |
Utiliza estos prompts en Grok Imagine o Midjourney para ilustrar tu post: