Data & Martech Director en MIO One

Sin "first-party data" limpio, no hay IA que valga

Comparte

lunes, 25 de mayo 2026

El falso alivio de abril de 2025: El fin de las cookies de terceros no fue el apocalipsis, fue un aviso.

Cuando Google confirmó en abril de 2025 que mantendría las cookies de terceros en Chrome, muchos equipos de marketing respiraron aliviados. Quizás demasiado aliviados.

Safari y Firefox las bloquean por defecto desde hace años, las tasas de consentimiento siguen cayendo, la regulación europea no para de endurecerse y el consumidor exige cada vez más control sobre sus datos. La amenaza no desapareció, simplemente cambió de forma. Y mientras muchas marcas miraban la fecha de deprecación de Google como si fuera el único reloj que importaba, el modelo entero seguía deteriorándose en silencio.

Pero lo más interesante no es ese deterioro. Es que, mientras el sector discutía durante dos años cómo seguir midiendo en un mundo sin cookies, la conversación de fondo cambió. La IA generativa y predictiva entró en cada stack de marketing, en cada plataforma de medios, en cada producto SaaS que usamos a diario.

Y de repente la pregunta dejó de ser "¿cómo medimos sin cookies?" para convertirse en otra mucho más incómoda: “¿con qué datos vamos a entrenar todo lo que viene?”

El problema dejó de ser la medición. Ahora es el combustible

El debate cookieless importó, sobre todo, porque amenazaba la capacidad de medir. Sin cookies no hay atribución; y sin atribución, no hay optimización. Un problema serio, pero finito.

La IA cambia el orden de magnitud. Los datos ya no solo sirven para medir lo que pasó: alimentan los modelos que deciden qué pasa a continuación. Audience modeling, predicción de churn, generación creativa, mix marketing modeling, optimización en plataforma, scoring de leads, personalización en tiempo real — todos son casos en los que el first-party data ha dejado de ser una capa de medición para convertirse en input directo del producto.

Quien tiene datos propios, entrena modelos propios. Quien depende de datos de terceros, alquila inteligencia ajena. Y en un mercado donde cada plataforma grande va a llegar con su propia IA empaquetada, la diferencia entre marcas no va a estar en quién usa mejores herramientas — esas se van a parecer cada vez más entre sí — sino en quién las alimenta con datos de calidad.

Garbage in, garbage out: la regla de oro que el marketing sigue ignorando.

Pero la lectura honesta es otra. La gran mayoría de equipos y empresas entienden el valor de usar sus propios datos. Ese no es el problema, el problema es que cuando lo hacen los modelos no funcionan, y nadie quiere admitir por qué.

Quien haya pasado por el ejercicio reconoce los síntomas:

Un CRM con duplicados, campos vacíos y formatos inconsistentes entre países.
Eventos web etiquetados con criterios distintos según la propiedad, la agencia que los implementó y el año en que se desplegaron.
La misma persona con tres o cuatro identificadores distintos repartidos entre la plataforma de email, el ecommerce, el programa de fidelización y el CRM, sin nada que los una.
Consentimiento mal mapeado al dato: tienes el dato, sabes que el usuario aceptó algo en algún momento, pero no puedes decir con seguridad qué aceptó, ni si te permite activarlo en este canal concreto.

Un modelo de propensión entrenado sobre todo esto no es inteligencia artificial. Es ruido caro, presentado en un dashboard bonito.

Consentimiento: la puerta de entrada al dato activable

Si hay un área donde las marcas españolas tienen deberes pendientes es en la gestión del consentimiento. No en el sentido legal estricto, que la mayoría cumple mínimamente, sino en el estratégico. Se sigue tratando el consentimiento como punto final de un trámite, no como punto de partida de una relación.

El banner que ocupa toda la pantalla en móvil, con el botón de aceptar en verde y el de rechazar en gris diminuto, es una decisión de diseño con consecuencias de negocio. Las tasas de consentimiento impactan directamente sobre el volumen de datos activables. Las marcas que entienden el GDPR como oportunidad y no como traba diseñan experiencias de captación que el usuario percibe como un intercambio justo. Las demás siguen tratando el formulario como un problema de compliance, y se quedan sin dato.

Y a partir de ahora hay una segunda capa, menos visible pero igual de relevante: el consentimiento no solo determina cuánto dato consigues, determina si ese dato es utilizable en un modelo. Si no puedes trazar qué dato se recogió con qué consentimiento, cuándo y para qué finalidad, no puedes meterlo en un modelo sin asumir un riesgo regulatorio que ningún equipo legal va a aceptar. El AI Act llega encima del GDPR, no en su lugar. El listón sube.

Qué significa "dato listo para IA"

Tener datos no es lo mismo que tener datos útiles. Antes del primer caso de uso con IA conviene entender qué se está pidiendo de verdad cuando un equipo dice que su first-party data está listo. Cuatro criterios, ninguno opcional:

Unificado. Una identidad por cliente, no cuatro. Los IDs del CRM, del ecommerce, de la app y del programa de fidelización tienen que poder resolverse a una misma persona, idealmente con un sistema que se mantenga vivo cuando entren nuevas fuentes.

Limpio. Schema consistente entre países y propiedades, valores normalizados, duplicados resueltos, campos críticos con tasas de cumplimentación que se puedan auditar. No es glamuroso, pero es el 80% del trabajo real.

Gobernado. Cada dato lleva consigo su origen, su fecha y el consentimiento bajo el cual se recogió. Si esa trazabilidad no existe, no es un problema de gobierno del dato — es un problema de uso del dato, porque hay cosas que directamente no podrás hacer con él.

Activable. El dato vive donde los modelos y las plataformas lo consumen: un CDP, un warehouse conectado, una plataforma de medios. No en un Excel que alguien actualiza los lunes. Si el último kilómetro no existe, el resto del trabajo no se monetiza.

La diferencia entre tener datos y tener datos útiles es la misma que entre tener petróleo crudo y tener gasolina. Ambos son hidrocarburos. Solo uno mueve el coche.

Por dónde empezar

La pregunta práctica no es si hay que hacerlo, sino por dónde empezar, y la respuesta sigue siendo la misma de siempre: por la auditoría. Lo que cambia ahora es la pregunta que se le hace al dato. Ya no basta con "¿qué datos tengo y dónde están?". Ahora hay que añadir: "¿este dato puede entrar en un modelo? ¿Bajo qué consentimiento? ¿Con qué calidad? ¿Activable desde dónde?".

A partir de ahí, dos o tres casos de uso con IA concretos y medibles. No un proyecto de transformación que tarde dos años y nunca llegue a producción, sino casos pequeños y rápidos — un scoring de leads, una personalización de creatividad en una campaña concreta, un modelo de churn para un segmento — que demuestren valor en semanas y generen adhesión interna para el siguiente paso.

El siguiente paso es ya hablar de procesos internos y de transformación real. Sin un impacto directo en la operativa la IA no es más que un juguete caro, sin retorno de inversión. Pero este tema da para otro artículo.

Las marcas que aceleren ahora no llegarán a 2027 con más datos que las demás. Llegarán con datos que su IA pueda usar sin avergonzarse. Y esa es la diferencia que va a marcar el mercado.

El aviso ya sonó. Y no era sobre las cookies.