ir al contenido

La metodología detrás del proyecto de encuestas Breakthrough

El gran avance es un proyecto de CNN, la Universidad de Georgetown, la Universidad de Míchigan, SSRS (enlace: www.ssrs.com) y Verasight (enlace: https://www.verasight.io/).

La metodología detrás del proyecto de encuestas Breakthrough

Cada semana, se le pide a 1,000 estadounidenses que compartan lo que han visto, leído o escuchado sobre los principales candidatos presidenciales en sus propias palabras. Los resultados se basan en trabajos similares en las elecciones presidenciales de 2016 y 2020, y ofrecen una ventana única sobre cómo la gente de todo el país experimenta esta histórica campaña de este año.

Las entrevistas para este proyecto comenzaron el 21 de junio, justo antes del debate presidencial de CNN entre el presidente Joe Biden y el expresidente Donald Trump, y se prolongarán hasta el domingo después del día de las elecciones.

Los resultados de la encuesta se recopilan en línea de viernes a lunes cada semana, en inglés, entre una muestra nacional de aproximadamente 1,000 adultos por semana a través del sondeo omnibus del panel de opiniones de SSRS y el panel verificado de Verasight. Los resultados de las dos encuestas se combinan utilizando la metodología Encipher Hybrid de SSRS para mezclar muestras de probabilidad y no probabilidad.

A los participantes de la encuesta se les pregunta sobre los candidatos de los partidos principales: "¿Qué, si algo, has oído, leído o visto en los últimos días sobre Donald Trump?" y "¿Qué, si algo, has oído, leído o visto en los últimos días sobre Kamala Harris?". También se les pregunta lo mismo sobre el candidato independiente Robert F. Kennedy, Jr. La pregunta sobre Harris se agregó a la encuesta el 19 de julio, poco antes de que Biden anunciara su decisión de no buscar la reelección. También se ha preguntado lo mismo sobre Biden desde el inicio del proyecto.

El orden en que se hacen las preguntas se randomiza, para que no todos los respondientes sean preguntados sobre los candidatos en el mismo orden. Las respuestas exactas a estas preguntas se codifican en función de la preprocessing tradicional de texto para el análisis de frecuencia de palabras, modelado de temas para el análisis de temas y aprendizaje profundo para el análisis de sentimiento. La base de código se desarrolla conjuntamente por Lisa Singh de la Universidad de Georgetown con la entrada de su equipo de investigación y el equipo técnico del Instituto de Datos Masivos y Josh Pasek, Michael Traugott y Ceren Budak de la Universidad de Michigan.

A medida que avanza la campaña, las palabras asociadas con temas individuales pueden cambiar, lo que podría dar lugar a cambios en la posición relativa de esos temas en los resultados más antiguos. Esos cambios son necesarios para que las comparaciones actuales sean válidas. Para desarrollar temas, se identifican palabras de temas manualmente y se amplían con palabras y temas identificados mediante una combinación de Noiseless Latent Dirichlet Allocation (NLDA) y Guided Topic-Noise Model (GTM). El sentimiento se codifica utilizando RoBERTa preentrenado en tweets en inglés y ajustado con SemEva.

El equipo de investigación que realiza el análisis de los resultados de The Breakthrough y gestiona la realización de la encuesta son: Jennifer Agiesta, Ariel Edwards-Levy, Edward Wu y Dana Elobaid de CNN; Lisa Singh, Le Bao, Yanchen Wang y Mohamed Ahmed de la Universidad de Georgetown; Josh Pasek, Michael Traugott y Ceren Budak de la Universidad de Michigan; Akilah Evans-Pigford, Hope Wilson, Cameron McPhee y varios miembros del equipo de Métodos Avanzados y Ciencia de Datos de SSRS; y Peter K. Enns, Gretchen Streett, Amelia Goranson y Jake Rothschild de Verasight.

El análisis de los resultados de la encuesta proporciona información sobre la percepción del público de diversas figuras políticas, incl

Lea también:

Comentarios

Más reciente