Obtener datos históricos de Twitter desde el inicio de la red social es una tarea compleja, pero no imposible. Hay varias opciones disponibles, algunas ofrecen solo los datos en bruto, otras ofrecen análisis importantes de Twitter sobre toda la información histórica recopilada.

Entonces, revisa este artículo para obtener todos los datos que necesitas sobre tweets del pasado y cómo acceder a ellos de la mejor manera.  

  1. Qué Son los Datos Históricos de Twitter
  2. Datos Históricos de Twitter - ¿Por Qué Son Tan Importantes?
  3. ¿Twitter Guarda Su Historial?
  4. Comprar Datos de Twitter
  5. Cómo Acceder al Historial de Búsqueda de Twitter Desde 2006
  6. ¿Cómo Obtener Datos Históricos de Twitter?
  7. La Forma Más Fácil de Acceder a Tweets Antiguos y Datos Históricos de Twitter
  8. Estudio de Caso de Datos Históricos de Twitter
  9. Las Métricas de Twitter para Rastrear Dentro de un Informe Histórico de Twitter
  10. ¿Qué Datos Históricos de Twitter Necesitas?
  11. ¿Sigue Siendo Twitter una Plataforma Relevante en Redes Sociales?
  12. Conclusiones - Datos Históricos de Twitter Sin Límites

llamada a la acción

Qué Son los Datos Históricos de Twitter

Los datos históricos de Twitter incluyen todos los tweets y retweets que alguna vez se han publicado, junto con valiosos insights sobre ellos. Mientras Twitter ofrece APIs que pueden ayudarte a obtener todos los tweets históricos en datos en bruto, herramientas como BrandMentions te ofrecen no solo todos los tweets publicados sino también métricas y análisis sobre ellos.

Según una estadística reciente, se transmiten alrededor de medio billón de tweets cada día. Eso es mucho. Pero, ¿debería importarnos? Mucho sí. No solo por la gran cantidad de información que se publica en Twitter, sino también por el impacto cultural, económico y social que ha tenido desde su creación. 

Normalmente, los tweets aparecen en orden cronológico inverso, con los más recientes en la parte superior de tu feed y los más antiguos desplazados hacia abajo.

Todo trata de estar en el ahora, lo que ha hecho de Twitter no solo una fuente de noticias muy influyente sino también a menudo la herramienta preferida de los propios creadores de noticias.

Datos Históricos de Twitter - ¿Por Qué Son Tan Importantes?

Para muchas agencias y expertos, analizar datos históricos de Twitter (y otras redes sociales) se ha vuelto muy importante para entender los mercados y tomar decisiones basadas en ellos.

Entonces, ¿qué tipo de insights puedes obtener de los datos históricos? Aquí algunas posibilidades:

  • puedes entender mejor cómo funciona Twitter y su algoritmo y qué puede ser efectivo (o no) como estrategia de marketing;
  • puedes encontrar ejemplos de campañas exitosas o virales del pasado que puedes usar como inspiración para las tuyas;
  • puedes entender la evolución de una campaña o empresa en un contexto más amplio;
  • puedes estudiar comunidades o redes;
  • puedes identificar los distintos niveles de influencia de tweets o personas;
  • los oficiales pueden usarlo como un medio alternativo de comunicación e información durante desastres naturales;
  • los investigadores pueden estudiar cómo se desarrollan y cambian tendencias políticas o sociales a lo largo del tiempo, etc.

No solo las noticias pueden beneficiarse de Twitter, también puede ser útil para fines de marketing y relaciones públicas, proporcionando a tu audiencia contenido valioso incluso antes de que se conviertan en clientes. El límite de caracteres también puede ser una bendición disfrazada, ya que te obliga a crear anuncios cortos y memorables, como un llamado a un webinar que conduce tu negocio o un libro electrónico gratuito.

Twitter también puede ayudarte a averiguar rápidamente de qué están hablando los competidores de tu cliente, para asegurarte que tu cliente esté al día con las tendencias de la industria y participe en la conversación más amplia.

Sin embargo, Twitter te permite conectarte con profesionales o influencers que podrían estar interesados en trabajar con tu cliente.

¿Twitter Guarda Su Historial?

Según el propio blog de Twitter, los datos de Twitter se almacenan en una infraestructura compleja compuesta por:

  • Apache Hadoop
  • Manhattan (el backend para Tweets, Mensajes Directos, cuentas de Twitter)
  • Graph and Flock (para grafos)
  • Blogstore (para imágenes, videos y archivos grandes)
  • Redis y Twemcache (para almacenar en caché usuarios, cronologías y tweets)
  • MySQL/PostgreSQL para gestionar el lado publicitario

El enfoque simple y directo permite a los usuarios publicar con mucha más frecuencia que en otras plataformas y Twitter ha crecido exponencialmente desde su lanzamiento en 2006. ¡Imagínate la velocidad a la que se comparte información en Twitter!

Los tweets y hashtags se convierten en tendencias cada día y la cantidad de información generada es asombrosa. Lo que puede llevarte a preguntarte: ¿a dónde va toda esa información?

Esto es para decir que, aunque la herramienta ofrece una experiencia fluida (y algunos dirían adictiva), hay mucho trabajo detrás de ella.

Para fines de investigación, obtener grandes cantidades de datos históricos no es algo tan sencillo.

Comprar Datos de Twitter

La forma más fácil y sin complicaciones de obtener datos de Twitter en formato bruto, así como análisis, es usar una plataforma dedicada como BrandMentions. Así, puedes acceder a todos los datos y entenderlos fácilmente, sin importar si eres un desarrollador, un marketer digital o un dueño de negocio. Acceso completo a los datos, fácil de comprender para cualquier tipo de negocio o profesional.

Si eres técnico y sabes algo sobre cómo extraer datos vía APIs, puedes optar por recuperar datos desde la API pública de Twitter. API es la abreviación de “Interfaz de Programación de Aplicaciones” y en este caso es una manera para que tu software acceda a la plataforma Twitter (a diferencia del sitio web de Twitter, que es cómo los humanos acceden a Twitter).

Para investigación académica principalmente, también puedes intentar encontrar un conjunto de datos que ya haya sido recopilado y satisfaga tus requerimientos de investigación.

También puedes comprar datos históricos de Twitter directamente desde Twitter, usando el producto empresarial Historical PowerTrack. El costo depende tanto de la duración del período de tiempo como del número de tweets. Frecuentemente, el costo está impulsado por la duración del período, por lo que periodos más cortos podrían ser más asequibles. Sin embargo, si estás interesado en datos históricos de años, los costos aumentarán también.

Por lo tanto, cuando se trata de obtener datos y análisis de tweets antiguos, BrandMentions es probablemente la plataforma con la mejor relación costo-beneficio para absolutamente cualquiera. Si tienes habilidades técnicas y de programación, también puedes probar las APIs de Twitter.

llamada a la acción

Cómo Acceder al Historial de Búsqueda de Twitter Desde 2006

Si tu interés es en casos muy específicos, Twitter lo puso disponible para todos hace años. Puedes buscar en el archivo de tweets fácilmente y gratis usando los comandos avanzados “UNTIL” y “SINCE” en el recuadro de búsqueda y el formato AAAA-MM-DD.

También puedes combinar ambos comandos y usarlos junto con hashtags. Por ejemplo, si quisieras encontrar tweets etiquetados con #pandemic en los años antes del comienzo de la pandemia actual de COVID, podrías usar la búsqueda avanzada de Twitter y escribir algo como: #pandemic since:2015-01-01 until:2019-08-31

Cómo Acceder al Historial de Búsqueda de Twitter desde 2006

Pero, ¿qué pasa si estás interesado en un hashtag o tema significativamente más popular y quieres más flexibilidad para manejar los datos resultantes?

Afortunadamente, hoy en día hay varias opciones, tanto gratuitas como de pago. Opciones de Twitter mismo incluyen APIs Historical PowerTrack y Búsqueda de Archivo Completo, 2 APIs de Twitter que proporcionan acceso a cualquier Tweet disponible públicamente, empezando con el primer Tweet difundido, en marzo de 2006. Ambos productos muestran datos históricos y escanean el archivo completo de tweets, generando un conjunto de tweets que coinciden con tu consulta.

Sin embargo, cada API de búsqueda de Twitter está basada en arquitecturas diferentes, resultando en diferencias significativas en los resultados. Así que sigue leyendo para entender mejor el proceso de extracción de datos de Twitter. 

¿Cómo Obtener Datos Históricos de Twitter?

Si tu interés es en datos históricos a gran escala, hoy en día hay varias opciones. Twitter mismo recomienda 2 alternativas gratuitas: Historical PowerTrack y Full-Archive Search. 

Historical PowerTrack (HPT) opera a gran escala. Permite hasta 1,000 reglas y genera un archivo separado para cada intervalo de 10 minutos (suponiendo que haya al menos un tweet de interés en ese intervalo). Esto significa que, en efecto, un día completo de tweets podría generar hasta 144 archivos separados. Si revisas un año entero, estarías mirando potencialmente más de 50,000 archivos. Por lo tanto, las tareas pueden tardar horas o incluso días en generarse (dependiendo de la duración del período analizado).

API historical power track

Full-Archive Search (FAS), por otro lado, ofrece sus resultados similar a lo que una búsqueda de Google devolvería. Esto significa que no obtienes la lista completa de resultados de una vez, sino una pequeña fracción por página y luego puedes desplazarte a tu propio ritmo por el resto. El máximo de tweets que puedes ver por página es 500, después de lo cual necesitas hacer otra solicitud. Entonces, si buscas un hashtag particular en un período de 30 días y obtienes 5,000 resultados, tendrás que hacer un total de 10 solicitudes. La compensación con FAS, comparado con HPT, es que solo acepta una regla por solicitud.

API búsqueda de archivo completo

También existen alternativas de terceros que van un paso más allá y ofrecen un análisis profundo de los datos.

BrandMentions es una plataforma de escucha social que ofrece insights y reportes de datos históricos de Twitter que pueden remontarse hasta el primer tweet. Por lo tanto, obtienes no solo el conjunto bruto de datos de Twitter sino también un análisis de esos datos, paneles que pueden compartirse y reportes en Excel y PDF con “insights más profundos”. Tendrás la posibilidad de buscar tweets antiguos, sin importar el tiempo, así como acceso a datos de tweets en tiempo real. La herramienta cubre menciones pasadas y futuras, por lo que debería ser una solución completa para cualquier entidad interesada en los datos históricos de la red social. 

Datos de Twitter de BrandMentions

También hay otras herramientas de pago que ofrecen esta posibilidad. Crimson Hexagon tiene un enfoque diferente, ya que ofrece conjuntos de datos creados consultando contra un conjunto ya existente de tweets históricos.

Otros proveedores, como DiscoverText o Soda Analytics tienen un enfoque más académico e incluyen funciones como la medición de la confiabilidad entre codificadores, que son particularmente relevantes para investigadores.

llamada a la acción

La Forma Más Fácil de Acceder a Tweets Antiguos y Datos Históricos de Twitter

Para ahora, podrías estar pensando que acceder a datos históricos de Twitter es muy difícil porque implica conocimiento de APIs. Pero, en realidad, hay una forma fácil de extraer toda la información histórica relevante de Twitter.

Puedes usar BrandMentions para este trabajo, ya que básicamente hará todo el trabajo por ti.

Con BrandMentions, literalmente todos los datos históricos de Twitter están a unos pocos clics de distancia.

Entonces, estos son los pasos que debes seguir:

Paso 1. Obtén una prueba gratuita de BrandMentions (hay una prueba gratuita que extrae tweets históricos de los últimos 30 días o una versión de pago que ofrece datos de más de 10 años).

Paso 2. Añade la marca/término/hashtag que te interesa obtener datos históricos. Puedes añadir uno o varios. La app extraerá automáticamente los datos de los últimos 30 días.

brandmentions añadir palabras clave

Paso 3. Haz clic en el botón Extraer Datos Históricos para acceder a datos de Twitter de hace más de 10 años.

brandmentions datos históricos

No solo obtendrás todos los tweets antiguos, sino que también obtendrás valiosos conocimientos sobre ellos. Podrás analizar la evolución a lo largo del tiempo, ver KPIs como alcance, interacción, el sentimiento de los tweets y muchas otras métricas. Y, sin sonar demasiado cursi, todo esto lo consigues con solo unos pocos clics.

brandmentions insights de twitter

Obtener los datos es el primer paso. Organizarlo dentro de informes y análisis es el siguiente paso y tal vez el más importante. La capacidad de BrandMentions para ofrecer tales conocimientos valiosos sobre datos históricos de Twitter es probablemente una de las mayores características que tiene para ofrecer.

Estudio de Caso de Datos Históricos de Twitter

Hay muchas razones por las que obtener acceso a información histórica de tweets es una mina de oro. Sin embargo, aquí hay solo tres de ellas:

  • Entender el pasado
  • Entender la evolución
  • Permitir la previsión

¿Y qué mejor manera de entender esto que mirando un estudio de caso que recopila datos históricos reales?

Usando BrandMentions, hemos extraído todos los datos históricos de Twitter para "#taycan".

Para quienes no lo saben, Taycan es un coche completamente eléctrico fabricado por el fabricante alemán Porsche desde 2019.

Al extraer el conjunto completo de datos para #taycan podemos entender fácilmente la historia de la marca, su evolución y podemos hacer algunas predicciones sobre su futuro.

Se ha extraído toda la información desde el primer tweet que contenía el hashtag Taycan, 8 de junio de 2018, hasta el 27 de enero de 2021.

Como puedes ver en la captura de pantalla a continuación tomada de la aplicación BrandMentions, se ha extraído cada tweet que contiene #taycan.

brandmentions históricos de taycan

Para tener una muestra del tipo de conocimientos que obtendrás junto con el conjunto bruto de tweets históricos, puedes consultar este panel público compartido que agrega datos para el #taycan. El panel puede ser accedido por cualquiera, en cualquier momento y se actualiza constantemente para que puedas ver la evolución histórica así como los datos en tiempo real.

Desde el número de interacciones hasta el alcance, los principales influenciadores, la distribución por país y idioma o el tono de los tweets, puedes encontrar todo allí.

panel de brandmentions

llamada a la acción

Profundicemos un poco más en los datos para ver qué más podemos encontrar.

Primero que nada, podemos acceder al primer tweet que usó nuestro hashtag analizado, fechado el 8 de junio de 2018, 8:58 PM, hora de Bélgica.

Poco después de que este primer tweet vio la luz, siguieron muchos otros tweets. En un par de minutos aparecieron muchos otros tweets y retweets. Ya era noticia y las cosas iban en grande.

menciones de taycan

En la primera semana después del primer tweet, del 8 al 15 de junio de 2018, aparecieron no menos de 567 tweets. Esto se correlaciona muy bien con la cantidad de datos aparecidos en otras redes sociales, noticias y blogs también.

primera semana de taycan

Tras este primer período, las cosas comenzaron a desacelerarse, como se puede ver en la disminución del número de tweets. Sin embargo, lo que es muy interesante de analizar es un pico que tuvo lugar el 9 de septiembre de 2019. Es muy fácil detectarlo cuando miras el conjunto completo de datos. Seguro que hubiera sido mucho más difícil si no tuviéramos acceso al gran contexto.

pico de taycan en septiembre

El 4 de septiembre de 2019 fue el gran lanzamiento de Taycan. Dependiendo de la zona horaria en la que te encuentres, puede que veas los tweets reportados el 3 de septiembre de 2019.
El nuevo coche eléctrico debutó a nivel mundial con tres eventos simultáneos en Alemania, China y Canadá. A continuación, está el primer tweet de ese día por parte del equipo de Porsche.

Solo por el día del lanzamiento, puedes obtener muchos conocimientos, como la distribución del país de los tweets u otros hashtags relacionados. Todos estos datos son súper importantes para cualquier comercializador, gerente de producto o dueño de negocio, ya que ofrecen una mejor comprensión de todo el contexto.

datos de taycan

El pico más reciente fue el 20 de enero de 2021. A solo un clic de distancia, BrandMentions te permite consultar los tweets de ese día, exportarlos o obtener insights sobre ellos.

A pocos clics descubres que en enero de 2020, el fabricante alemán anunció que lanzaría un modelo más ligero, con tracción trasera y mejoras en el rendimiento. La facilidad con la que consigues todos estos datos en una industria que se mueve tan rápido es indiscutible.

taycan 20 de enero

Este estudio de caso es solo un breve ejemplo de cómo puedes beneficiarte de tener acceso a un conjunto completo de datos históricos de tweets. Puedes probarlo por ti mismo y convencerte, si aún no lo estás, de que a veces la "realidad" no es una función del evento como evento, sino de la relación de ese evento con eventos pasados y futuros.

llamada a la acción

Las Métricas de Twitter para Seguir en un Informe Histórico de Twitter

A menudo, evaluar y hacer seguimiento de tus resultados resulta ser uno de los pasos más importantes en el proceso de dirigir un negocio. Lo mismo ocurre cuando se trata de datos de Twitter. Cualquier informe histórico de Twitter debe agregar datos que te den suficientes conocimientos para entender qué pasó en el pasado y así puedas diseñar una mejor estrategia para el futuro.

BrandMentions ofrece no solo todos los datos históricos de Twitter que necesitas (desde el primer tweet), sino también informes completos que incluyen:

  • Número total de tweets
  • Alcance total de los tweets recopilados
  • Número total de interacciones
  • Número total de retweets
  • Número total de tweets positivos
  • Número total de tweets negativos
  • Distribución de tweets y retweets
  • Principales Influenciadores de Twitter
  • Rendimiento global e individual de los tweets
  • Ubicación de los tweets
  • Número de tweets y retweets por día de la semana
  • Representación por idioma
  • Hashtags en tendencia
  • Contexto de las menciones
  • Crecimiento mes a mes
  • Evolución de los tweets

informes de brandmentions

¿Qué Datos Históricos de Twitter Necesitas?

Por supuesto, antes de sumergirte en un mar de tweets, vale la pena aclarar primero por qué quieres hacerlo y en qué medida. Entonces, hazte preguntas como:

  • ¿Necesito tweets actuales/recientes o tweets más antiguos/históricos?
  • ¿Necesito una cantidad determinada de ellos o bastan algunos ejemplos?
  • ¿Necesitaré cubrir un intervalo de tiempo específico o mis tweets deben reflejar una variedad de períodos?
  • ¿Necesito la “población” completa de tweets sobre un tema o es suficiente una muestra?
  • ¿Qué presupuesto tengo para adquirir datos de Twitter?
  • ¿En qué medida tendrás que compartir los tweets usados para el análisis con tu audiencia?

Basándote en las respuestas a estas preguntas, deberías tener una idea bastante clara de cómo proceder.

¿Sigue Siendo Twitter una Plataforma de Redes Sociales Relevante?

De todas las redes sociales que tienden a agruparse, Twitter puede haber sido la que más ha permanecido fiel a su diseño original.

Twitter comenzó y sigue siendo una plataforma de “microposts” que te permite publicar y ver las publicaciones de otros.

La particularidad es que estas publicaciones, llamadas tweets, pueden tener un máximo de 280 caracteres. Antes eran 140, pero eso cambió en 2017. De hecho, es uno de los únicos cambios significativos que Twitter ha hecho a su plataforma. A pesar del límite de caracteres, aún puedes compartir enlaces, fotos, GIFs o videos, lo que facilita compartir contenido multimedia, noticias o investigaciones. Otra diferencia, quizás más significativa, entre Twitter y sus “hermanos” en redes sociales es que todo es, por defecto, público. Aún existe la opción de hacer tu cuenta privada, pero debes hacerlo activamente.

Los usuarios de Twitter tienen un 38% más de probabilidades de publicar opiniones sobre marcas y productos que otros usuarios de redes sociales.

Hubo algunos otros cambios a lo largo de los años, pero la mayoría fueron simplemente ajustes sobre lo que podías ver y cómo podías personalizar tu contenido. En 2014, Twitter añadió recomendaciones sobre tweets, temas y cuentas.

En 2015, añadieron una sección titulada “Mientras estabas ausente”, que resumía tweets seleccionados publicados mientras un usuario no estaba activo. Dos años más tarde se renombró a “En caso de que te lo hayas perdido”, junto con una explicación de cómo los tweets eran puntuados por un modelo de relevancia. El algoritmo tomó en cuenta la novedad, relevancia (basada en palabras clave), compromiso (basado en número de retweets y favoritos) y otros factores relacionados con seguidores, ubicación y uso de medios. Más recientemente, en 2019, Twitter introdujo Temas para permitir a los usuarios seguir conversaciones más amplias. Seguir un Tema agrega tweets, usuarios, eventos y anuncios relacionados al feed.

El 71% de usuarios de Twitter dice que usan la red para obtener sus noticias.

Varias protestas en los últimos años tuvieron éxito en buena parte gracias al uso de Twitter entre los manifestantes. Claro, sin embargo, no siempre es tan serio con Twitter, y la plataforma tiene una historia conocida de ser el lugar de origen de muchos memes.

Pero incluso más allá de eso, ha proporcionado a todos una plataforma única donde cualquiera puede ser reportero o crítico cultural, llevando a un universo de puntos de vista diversos, amplificados de forma orgánica. Cuando un avión de US Airways aterrizó de emergencia en el río Hudson en 2009, fue un usuario común de Twitter el que empezó a correr la voz, antes de que muchos medios se enteraran.

Limitaciones en la Extracción de Datos Históricos de Twitter

Independientemente de la solución que elijas, es útil tener en cuenta algunas posibles limitaciones al decidir el proveedor:

  • No todos los proveedores pueden permitirte exportar conjuntos de datos brutos desde su plataforma. Alternativamente, algunos pueden establecer un límite en la cantidad de datos que puedes exportar por día. Asegúrate de verificar esto de antemano si la manipulación de datos brutos es importante para ti.
  • Las soluciones ofrecidas por algunos proveedores son esencialmente una “caja negra”, lo que significa que no tienes acceso al algoritmo usado ni a cómo se aplican o definen ciertos filtros.
  • El costo suele estar determinado por la duración del período de tiempo consultado o la cantidad de datos recuperados. Si el costo es un factor, asegúrate primero de identificar claramente tus necesidades y solo realizar las búsquedas estrictamente relevantes para ti (en lugar de lanzar una “red” más amplia).

De hecho, existe la opción de que encuentres un conjunto de datos ya existente que se ajuste a tus intereses. En particular, sitios académicos y de investigación pueden tener bibliotecas que contienen y construyen continuamente colecciones sobre varios temas de interés público (incluidos los relacionados con instituciones estatales y organizaciones de noticias).

llamada a la acción

Conclusiones - Datos Históricos de Twitter Sin Límites

Uno de los activos más importantes cuando hablamos de datos, es probablemente el contexto. Algunos incluso podrían asumir que el contexto lo es todo. Da forma al significado en toda comunicación. Sin contexto no puedes comunicarte de manera efectiva. Cuando tu mensaje se entrega en un contexto, pero se recibe en otro, probablemente conduce a malentendidos. Y esta es tal vez una de las ventajas más importantes que aportan los datos históricos: una imagen clara y completa del contexto.

Obtener datos históricos sin límite de tiempo no es una tarea fácil. Sin embargo, se vuelve mucho más fácil si utilizas los recursos o herramientas correctas. Puedes usar cualquiera de los métodos descritos arriba para obtener tus datos históricos de Twitter, pero recomendamos una herramienta como BrandMentions que también ofrece información valiosa sobre los datos, y no solo información en bruto.

Esperamos que este artículo arroje algo de luz sobre cómo extraer y analizar datos históricos de Twitter. Elige la versión adecuada para ti pero no olvides la importancia del contexto y la visión. ¡Feliz monitoreo!

Cornelia es una orgullosa especialista en marketing digital en BrandMentions. Cuando no está documentando para el próximo estudio de caso increíble, probablemente esté en algún lugar probando un nuevo deporte extremo como el ala delta. Además, es una viajera entusiasta, amante de los deportes extremos y aspirante a cantante de percusión.