Rastrear la interacción: redes y big data
Tracking Interaction: Networks and Big Data
RAUL ANTHONY OLMEDO NERI
Universidad Nacional Autónoma de México, México
Resumen
El presente trabajo presenta la vinculación conceptual entre el big data y la metodología del Análisis de Redes Sociales (ARS), con la finalidad de reconocer sus ventajas y desventajas alrededor del estudio de fenómenos sociales que se presentan en Internet y que tienen una fuerte carga relacional en cuanto a los usuarios y los contenidos. Se hace una reflexión metodológica a partir del análisis visual de la red formada alrededor del hashtag #LeyOlimpiaNacional antes y durante su aprobación en México. Entre los resultados se destaca que este tipo de análisis se amplía a partir de la minería de datos y la cantidad de información que puede ser recolectada para fines de investigación. Finalmente, se puntualizan las ventajas y retos para el empleo de esta metodología para investigadores en ciencias sociales.
Palabras clave: internet; metodología; minería de datos; datos accidentales; redes.
Abstract
This work presents the conceptual link between big data and the Social Network Analysis (ARS) methodology, in order to recognize its advantages and disadvantages around the study of social phenomena that occur on the Internet and that have a strong relational load in terms of users and content. A methodological reflection is made based on the visual analysis of the network formed around the hashtag #LeyOlimpiaNacional before and during its approval in Mexico. Among the results, it stands out that this type of analysis is expanded from data mining and the amount of information that can be collected for research purposes. Finally, the advantages and challenges for the use of this methodology for researchers in social sciences are pointed out.
Keywords: internet; methodology; data mining; accidental data; networks.
Ante los vertiginosos cambios en la sociedad contemporánea, las ciencias sociales han entrado en un proceso de reflexión para actualizar sus paradigmas teóricos y metodológicos; esto es parte de un contexto de crisis presente en la ciencia contemporánea (Prigogine, 1994). La difuminación entre las fronteras de las ciencias sociales puede ser considerada una oportunidad que permitiría reconocer el carácter transversal y complejo de los fenómenos que se instalan en la vida cotidiana, mismos que ya no podrían ser vistos ni validados desde una sola e inamovible perspectiva (Giménez, 2011). Los nuevos contextos y fenómenos derivados de la incorporación de Internet y las plataformas sociodigitales en las prácticas cotidianas han contribuido a esa reflexión, por lo que en este trabajo se expone, desde la experiencia en investigación, una metodología que se consolida progresivamente en los estudios sociales sobre Internet: el Análisis de Redes Sociales (ARS). Se emplea el término “plataformas sociodigitales” para aludir a Facebook, Twitter, Instagram, TikTok y en general a cualquier espacio donde se desarrollen procesos de interacción (entre personas) e interactividad (personas con el contenido), todas ellas mediadas por el carácter transversal de la comunicación. Estas plataformas sociodigitales poseen una esencia técnica y operativa, por lo que solo cobran sentido a través de la participación del sujeto, convertido en usuario, que allí se presenta y representa. Estos espacios, pues, no son redes sociales, sino que a través de la intervención del individuo se replican, amplían o modifican las redes sociales que dicha persona ha construido a través de su devenir histórico (Olmedo Neri, 2011).
Hablar de la metodología ARS implica reconocer las formas en que Internet se convierte en un lugar de interacción social. En él, la comunicación adquiere una relevancia medular no solamente porque esta ciencia ha centrado buena parte de su historia en el análisis del pacto que tiene con la tecnología (Sfez, 1995), sino porque dentro de Internet se reconoce la relevancia de la comunicación como proceso social desde el cual se pueden explicar otros fenómenos (Craig, 1999).
Así, el ARS se articula en este trabajo desde una perspectiva comunicacional, para así entender que los procesos de interacción social en Internet tienen una esencia comunicativa que no desvaloriza su propiedad interdisciplinaria en tanto objeto de estudio, sino que la amplía al identificar, analizar y explicar estos fenómenos desde una perspectiva propia (Miège, 2015; Craig, 1999; Vizer, 2016). De esta manera, el objetivo que guía este trabajo es mostrar las potencialidades metodológicas del ARS, con la finalidad de reconocer las ventajas y retos sobre su uso en estudios interdisciplinarios sobre Internet.
Cabe mencionar que el objetivo antes mencionado descansa en la experiencia obtenida de los análisis sobre el uso de Internet y plataformas sociodigitales por parte de movimientos sociales en México y América Latina. La sistematización de la experiencia adquirida en los procesos de investigación es poco trabajada como un objeto de estudio o como recurso útil en dicho proceso, lo que reduce su potencial relevancia experiencial para quienes se inician en la investigación académica. Por tanto, sistematizar la experiencia obtenida en la investigación supone un recurso útil para evidenciar los alcances de análisis que pueden ser factibles para objetos de estudio complejos, convergentes y de reciente concreción.
La experiencia permite mostrar los usos, alcances y limitaciones del ARS para su consideración como una metodología factible para la investigación de Internet desde la comunicación y las ciencias sociales. En este sentido, el trabajo presenta un estado de la cuestión alrededor del big data como contexto que permite redimensionar Internet como un espacio donde confluyen intereses privados, públicos y sociales (García Calderón y Olmedo Neri, 2019). En esa confluencia de intereses, el espacio digital se consolida como un lugar donde existe una cantidad inconmensurable de datos accidentales, es decir, aquella información que solo a través de la creatividad adquiere un valor más allá del directamente atribuido y que puede ser usada para explorar objetos de estudio que no están directa o evidentemente relacionados.
Posteriormente, se hace un ejemplo del uso de ARS como metodología para reconocer sus potencialidades, ventajas y alcances. Para ello se hace un análisis de la información obtenida alrededor del hashtag #LeyOlimpiaNacional, el cual se utilizó en Twitter a partir de la aprobación de la Ley Olimpia a un alcance nacional en México; dicha ley es el resultado de la organización y presión política de una parte del movimiento feminista por crear un marco normativo que tipificara y sancionara la violencia digital y mediática contra las mujeres, particularmente con la difusión de contenido sexual sin consentimiento o como medio de extorsión hacia ellas (Senado de la República, 2020).
Finalmente, se hace una reflexión que da cuenta de la utilidad del ARS para recolectar y procesar información derivada de la interacción que yace en Internet.
Big Data. Un nuevo contexto para la investigación
En la sociedad actual existe un cambio fundamental que influye en las investigaciones, particularmente en las ciencias sociales: la abundancia de datos, información y conocimiento. Actualmente existe una tendencia por mirar todo a través de los datos, desplazando los sujetos que los crean y los contextos donde se generan; esto diezma la utilidad de conocerlos y entenderlos dentro de la realidad social al limitar la mirada en el producto y no en el productor. Innerarity (2011) insiste que este proceso lleva a la saturación de datos, lo cual termina volviéndose un ruido que obstaculiza la creación y difusión del conocimiento. Así, se produce tanto una sociedad del conocimiento como una del desconocimiento, justamente porque la cantidad de datos dificulta su análisis y, por ende, la posibilidad de utilizarlos de manera oportuna para la toma de decisiones. Esta saturación de datos ha sido denominada big data.
Las diferentes definiciones del concepto de big data reconocen la gran cantidad de datos, los requerimientos técnicos operativos para su sistematización y su utilidad para la toma de decisiones o investigación como elementos sustanciales de este paradigma (Camargo-Vega, Camargo-Ortega y Joyanes-Aguilar, 2015). Sea por la facilidad para obtener datos para los investigadores o por la ampliación de los objetos de estudio para las ciencias sociales y naturales, el big data adquiere una relevancia teórica, metodológica y empírica que contribuye a la interdisciplinariedad y la complejidad del conocimiento (Felt, 2016; Innerarity, 2011; Ovadia, 2013).
Desde las ciencias sociales, el big data se ha convertido en un objeto de estudio del que han surgido varias interpretaciones sobre sus efectos positivos y negativos en la sociedad. Estas perspectivas resultan de la crítica que surge alrededor de la producción de los datos, de su control y de los mecanismos y ética de su recolección, así como de las finalidades que atienden en el contexto del capitalismo contemporáneo (Cheney-Lippold, 2017; Han, 2018; Neyland, 2019; Yehya, 2017). Para García Calderón y Olmedo Neri (2019) se ha pasado del Big Brother al Big Data como resultado de una doble consecuencia interna “tanto para el individuo en su intento por adaptarse al nuevo mundo virtual, como para el sistema capitalista en su proceso de transición al capitalismo cognitivo” (p. 90). Así, el big data mantiene la vigilancia, pero no por coacción, sino bajo una nueva lógica donde el individuo, convertido en usuario, se vuelve en víctima y cómplice (Han, 2018).
A pesar de estas perspectivas críticas, la inmensa cantidad de información y datos que se producen, difunden y recopilan en Internet permiten ampliar las fronteras analíticas de las propias ciencias sociales. Por tanto, más que pensar en el dato por sí mismo, es necesario contextualizarlo con el objetivo de reconocer la utilidad que posee y, también, los intereses que lo motivan. Lo anterior no solo ha traído retos analíticos, sino que también ha implicado una serie de modificaciones en los paradigmas para entender el mundo social; la comunicación no escapa a estos procesos de reflexión.
De manera específica, el big data se articula mediante tres reglas operativas y analíticas: la existencia de datos accidentales, a mayor cantidad de datos es posible mejorar los resultados, y los datos son imperfectos. Los datos accidentales son fundamentales en la investigación sobre fenómenos sociales que se desarrollan en Internet. Estos son aquellos datos que no tienen un primer uso específico, pero que pueden ser empleados para analizar o representar otros problemas con los que están relacionados directa o indirectamente. Mediante la creatividad del investigador, estos datos adquieren otro valor con el cual adquieren el carácter accidental. De ahí que este tipo de datos sean un resultado no pensado pero posible, una especie de serendipia informativa en la investigación social. En otras palabras, son datos cuyo uso puede contribuir al análisis de fenómenos que de los que se carecen datos directos y confiables o, en su caso, ampliar el objeto al que le son inherentes pero en el que no se habían considerado.
En lo referente a la alta cantidad de datos para un mejor resultado, se considera funcional para los estudios de carácter mixto en Internet. No se busca el dato puro, que en este contexto de inmensa producción es imposible, sino que se apuesta a la recolección de grandes cantidades de información para reducir el potencial error a un margen factible para la investigación. Por ende, una mayor cantidad de información permite el acercamiento a resultados de interés y de potencial tendencia.
Cabe mencionar que la cantidad de datos puede o no estar relacionada con el tiempo de recolección, ya que esto depende del alcance y el tipo de estudio que se pretende emprender. Así, se puede obtener una gran cantidad de datos en un momento coyuntural que ocurre en un lapso corto, por ejemplo en una marcha, y por otro lado recolectar cantidades mínimas en periodos prolongados, o viceversa. En cualquier caso queda claro que el tiempo de recolección y la cantidad de datos no es una relación simétrica o proporcional, sino que ambas se desarrollan en relación con las lógicas sociales que motivan dicha interacción, al tráfico de los datos de interés por parte de las empresas o a los algoritmos propios de cada plataforma.
Finalmente, asumir que los datos son imperfectos permite reconocer parte de un proceso que está presente en todo tipo de investigación, pero que no se toma en cuenta: la complejidad (Morin, 1994). Nunca será posible aprehender un objeto de estudio en su totalidad, pero sí es factible delimitarlo a partir de los intereses propios del investigador para su abordaje.
En este orden de ideas, el big data despliega sus efectos en el ámbito de la investigación social, generando cambios sutiles pero de gran alcance a nivel teórico y metodológico. En la teoría se puede reconocer la inconmensurable cantidad de artículos y libros que abordan lo social desde diferentes perspectivas, cada uno ampliando su relevancia y contribuyendo al análisis de diferentes objetos de estudio. Sin embargo, esto también implica reconocer nuevos retos para el investigador, ya que ha pasado de buscar la escasa o selecta información y textos para un análisis a disertar entre los cientos de autores que hoy publican sobre esa línea de investigación. Nuevamente se presenta una abundancia de conocimiento que abona a la construcción de una sociedad dual del conocimiento/desconocimiento (Innerarity, 2011), pero a una escala global propio del sistema digital contemporáneo (Bolz, 2006).
En el ámbito metodológico la llegada de Internet ha derivado en un profundo proceso de actualización sobre las formas de hacer investigación: la parte digital y tecnológica ha contribuido innegablemente a un proceso de adecuación de las metodologías y las técnicas para obtener, sistematizar y analizar la información, por lo que su reconocimiento permite ver la innovación en los procesos de investigación.
Innovación metodológica: ARS
Algunas ciencias sociales, como la antropología, la comunicación y la sociología, han implementado estrategias para poder abordar sus objetos de estudio, mismos que ya no se piensan en un sentido alejado de lo digital, sino más bien como parte de un permanente proceso de convergencia propio de la sociedad onlife (Floridi, 2015). La etnografía digital y el ARS son ejemplos que reflejan una dinámica de adecuación a las nuevas necesidades propias de los objetos de estudio. Estos dos elementos muestran que ya no existe un único camino, sino que, como arguye Feyerabend (2007), existen varias maneras para llegar y abordar un objeto de estudio.
Aunque la etnografía digital no es centro de este trabajo, vale la pena atender, al menos de forma general, parte de sus innovaciones. En este sentido, la etnografía quizás es la metodología que mayores cambios ha desarrollado en este proceso de convergencia digital. La etnografía digital no se aleja de los principios básicos de la tradición antropológica, sino que los adecúa para ampliar su campo de uso a partir de los procesos colectivos de interacción en Internet (Sinanam y McDonald, 2018; Pink, Horst, Postill, Hjorth, Lewis y Tacchi, 2019).
Bárcenas Barajas y Preza Carreño (2019) reflexionan sobre los retos de las implicaciones metodológicas que acarrea la etnografía en el espacio digital. Entre sus aportaciones, establecen los retos del etnógrafo que realiza observación en entornos virtuales, además de reconocer el carácter complejo de la realidad contemporánea al asumir el contexto onlife. Entre las adecuaciones más importantes de la etnografía digital se encuentran los periodos de observación, los cuales son más cortos en comparación a la tradición consolidada por Malinowski, así como la transparencia del etnógrafo ante los grupos o tribus que analiza en Internet con el objetivo de ser reconocido como observador o, en su caso, pasar desapercibido para que su reconocimiento no modifique la participación de las personas que son observadas.
Por otro lado, el ARS se consolida como una metodología para el estudio de Internet y los fenómenos sociales que allí se desarrollan. No solo ha sido útil para el análisis de la denominada Web 1.0 (Rogers, 2018), sino que es factible por el paulatino incremento de lo digital en la vida cotidiana de las personas (Ricaurte y Vidal-Ramos, 2015). Esta metodología tiene un origen interdisciplinario, dado que sus aportaciones teóricas de análisis y visualización provienen de la sociología, las matemáticas y las ciencias computacionales (Lozares, 1996; Watts, 2006). Estudios sobre el contenido textual o audiovisual en plataformas sociodigitales (Del-Fresno-García, 2014; Wiedermann, 2013), la expresión organizativa y simbólica de movimientos sociales (Olmedo Neri, 2019, 2021; Rodríguez Cano, 2020), o la replicación de discursos y estrategias políticas (Congosto, 2015; García Faroldi, 2006), muestran la variedad de perspectivas que pueden desarrollarse a partir de la noción de red como paradigma y como metodología.
Esta amplitud de usos y fenómenos utilizados ha derivado en la ampliación de la idea que los vínculos tienen exclusivamente una base empírica y biográfica, para dar atención a las lógicas operativas, algorítmicas y de información que intervienen en la red y las diferentes plataformas sociodigitales. Por ello, si bien el ARS puede ser factible para el reconocimiento de las comunidades y las tribus que se gestan en el espacio digital, el carácter puramente estructural es una parte del sentido construido en esas comunidades.
El carácter estructural y de contenido que se desarrolla en el ARS (Luna, 2004; Pisani y Piotet, 2009) tiene un potencial cualitativo y cuantitativo, por lo que no solo es la visibilidad y la estructura de las comunidades, sino también los sentidos que se construyen en ella, las relaciones de poder que estructuran la red y los flujos de información que posicionan estratégicamente a ciertos usuarios o que se crean por ellos mismos.
Estos últimos elementos cobran eco en la perspectiva comunicacional, ya que las comunidades no solo se construyen a través de vínculos formales y derivados del devenir histórico del individuo, sino que en Internet es posible crear relaciones de interacción-comunicación, es decir, “relaciones sociales efímeras/perdurables que se desarrollan entre individuos mediante el flujo de información que en estas plataformas se lleva a cabo de manera oblicua, permanente y redundante” (Olmedo Neri, 2020, p. 75). Este tipo de relaciones ponen al descubierto que el contenido multimedia que desarrolla un usuario en relación con los demás y transita a través de las redes puede desembocar en arquitecturas reticulares de amplio alcance, mismas que son originadas del contenido con el que se interactúa.
Así, el carácter preponderante de la comunicación como detonadora de procesos de socialización permite redimensionar su papel como una ciencia transversal que tiene la función de amalgama (Craig, 1999; Giménez, 2011). Esto le permite construir una mirada propia sobre la interacción social y los procesos de socialización que se desarrollan en el espacio digital (Boyd, 2011; Papacharissi, 2011). De esta manera, el ARS como metodología para abordar Internet permite reconocer, por ejemplo, los efectos, procesos y posibilidades que una acción colectiva desarrolla de manera sinérgica. También es posible reconocer el impacto en términos de alcance de una campaña política a través de la interacción con contenido, etiquetas o vínculos que establecen los propios usuarios a través de sus prácticas comunicativas.
Algunos autores proponen la vinculación entre la etnografía digital y el ARS. Por ejemplo, las reflexiones de González Gil y Servín Arroyo (2017) ahondan más en el sentido orgánico y potencial del estudio de Internet. Estos autores asumen que el análisis de los vínculos y los sociogramas pueden entrar en las áreas de interés de la etnografía digital, lo cual es útil dado que atienden el sentido simbólico de la socialización. Sin embargo, se deja de lado el carácter medular que se instala en Internet gracias a las aportaciones de las ciencias computacionales hacia los estudios, así como el desarrollo de programas que contribuyen al análisis de grandes cantidades de información.
Por esto, a partir de lo expuesto se considera que la etnografía digital y el ARS tienen una autonomía metodológica que hace factible acercamientos, mas no una integración de una a otra. El sentido de la investigación será el factor que haga comulgar estas dos perspectivas a través de la propia creatividad investigativa. Además, en ambas perspectivas se deja de lado la esencia comunicativa de lo que acontece en Internet, por lo que la mirada comunicacional permitirá reconocer y ampliar las aportaciones de estas dos metodologías.
Cuando se alude a la perspectiva comunicacional, se entiende que la comunicación no es un proceso reducido a la transmisión del contenido ni a la mera función operativa del canal/medio; más bien la comunicación se asume como campo de estudio y práctica, por lo que así es posible argüir que las personas ya no solo se comunican a través de estas plataformas, sino que interactúan en ellas (Lash, 2005; Olmedo Neri, 2019; Sfez, 1994).
Las aportaciones antropológicas sobre el estudios relativos a la comunicación y la cultura reconocen la falta de un análisis que contemple esta última perspectiva (García Canclini, 2004, 2019); de hecho, la cultura y comunicación poseen una relación dialógica-dialéctica porque una no se piensa sin la otra (Craig, 1999; Giménez, 2011). Así, pensar desde la comunicación supone reconocer la heterogeneidad presente en los procesos de apropiación de la tecnología, de su incorporación en la vida cotidiana y de las formas en que el sujeto articula los medios en sus actividades dentro y fuera de Internet, así como de manera particular el reconocimiento de las formas en que la parte técnica y operativa moldea la práctica comunicativa y la vida cotidiana del sujeto contemporáneo.
Movimientos sociales en Internet
Cuando se monitorean los repertorios de acción conectiva de un movimiento social es necesario identificar dos elementos clave: en primer lugar, las fechas en que se da un incremento en la actividad de un movimiento social, por ejemplo cuando se logra una meta, un reconocimiento o un cambio positivo en la sociedad para este grupo y, en segundo término, es necesario identificar un elemento común que fluya dentro de una o más plataformas y que pueda ser rastreado, como un meme, un enlace, un hashtag o una imagen.
Monitorear las fechas en que se viralizan logros para un movimiento social, es decir, que adquieren una mayor difusión y alcance, contribuye a reconocer la sinergia entre lo que ocurre en las calles y en las redes. Ese incremento de interacción en Internet supone una lógica de visibilidad y reconocimiento de aquellas personas que reivindican el logro desde su perfil, el cual funge como una extensión del espacio privado en el espacio público digital.
A nivel de contenido existe una producción de sentido y articulación discursiva que deriva de un avance o de un obstáculo para el movimiento social. Por ello es necesario identificar un elemento que permita rastrear, visibilizar y recolectar la información que se genera durante ese momento coyuntural para dicha acción colectiva. Sería imposible recolectar la información de manera individual, por lo que trabajar con este tipo de análisis requiere obligadamente el uso de software gratuitos, tales como VOSON, Gephi y Pajek, o de licencia, por ejemplo NodeXL y UCINET, con los cuales se pueda obtener información mediante la minería de datos (Gunter, 2014). Dependiendo del alcance de la investigación y el presupuesto de la misma es posible utilizar uno o combinar las ventajas de varios para sortear estos retos propios de la investigación. En otras palabras, los datos obtenidos a partir del contenido que crean y consumen los integrantes de un movimiento social requiere del uso programas para que, mediante la minería de datos, sea posible la sistematización, depuración y análisis de los datos accidentales.
Aunque el análisis de la interacción de un movimiento social no podría considerarse como un ejemplo de big data, puesto que se requeriría un equipo de cómputo con mayores capacidades operativas y funcionales al de las computadoras en general, queda claro que sí permite entender la potencialidad que yace sobre esa cantidad de datos que puede ser obtenida y analizada en computadoras de uso universitario o académico.
Existen estudios que utilizan el hashtag como eje rector de articulación comunicativa, simbólica, semiótica, cultural y de visibilidad (Olmedo Neri, 2019, 2021; La Rocca, 2020). Estos ejercicios analíticos son un ejemplo de cómo una creación textual situada en un momento clave se puede convertir en un dato accidental mediante la recolección de información. Por ello, su uso como una variable dentro del estudio permite delimitar el objeto, destacar el carácter conectivo a través del contenido y la estructura que se forma en relación con los usuarios (nodos) y los vínculos.
#LeyOlimpiaNacional
Para atender el objetivo de este trabajo se ha usado el hashtag #LeyOlimipiaNacional, el cual fue utilizado antes, durante y después de la aprobación de la Ley Olimpia con un carácter nacional. La aprobación de esta ley se dio el 5 de noviembre de 2020 (Senado de la República, 2020), por lo que antes de esa fecha se generó este hashtag bajo la intensión de visibilizar este proceso de aprobación en el marco de las demandas del movimiento feminista.
A partir de las puntualizaciones realizadas en los apartados anteriores, se utilizó el software NodeXL (Social Media Research Foundation, 2021) para la recolección de información y el software Gephi (Bastian et. al., 2021) fue empleado para la visualización de la red y la obtención de indicadores clave como el grado de intermediación (betweenness en inglés), que se refiere al atributo que adquiere un nodo en la red a través de sus vínculos. Con sus enlaces, el nodo se puede posicionar de manera estratégica al convertirse en un potencial hub (Barabási, 2011) y, con ello, la información o contenido que comparte puede tener un mayor alcance. A partir del grado de intermediación se pueden identificar aquellos nodos que tienen la capacidad de amplificar el contenido dado el número y direccionalidad de los vínculos que poseen.
La plataforma seleccionada para la recolección de datos fue Twitter. Detrás de la selección de la plataforma está inmerso todo un proceso sobre la lucha alrededor de estos datos y su fiabilidad, dado que las plataformas sociodigitales presentan intereses privados que pueden o no entrar en conflicto con estas dinámicas sociales disruptivas al sobrepasar las lógicas preestablecidas por los programadores (Poell y Va Dijck, 2018). La recolección de datos se hizo del 15 de octubre al 4 de noviembre de 2020 y del 5 al 12 noviembre del mismo año; dicha delimitación temporal tiene la intención de observar la dinámica que se desarrolla antes y después del logro legal para las mujeres en México. Se encontró que la cantidad de vínculos (interacciones) y nodos (usuarios) que utilizaron el hashtag cambió entre ambos periodos de recolección. La cantidad de vínculos aumentó de 3,594 a 14,070, mientras que la cantidad de nodos aumentó de 768 a 6,697.
A partir de estos datos se puede observar que existe un cambio en cuanto a la interacción con la etiqueta, lo cual permite entender y dimensionar no solo su uso, sino las relaciones simbólicas y de contenido que se afianzan conforme cada usuario integra contenido propio a ese logro difundido en Twitter. A nivel visual, estos datos permiten conocer la cartografía conectiva que se gesta alrededor de esta estrategia de comunicación y conexión digital (Olmedo Neri, 2021). La Figura 1 muestra la red que se formó por los usuarios que emplearon el hashtag #LeyOlimpiaNacional antes de su aprobación.
Figura 1. Red #LeyOlimpiaNacional antes de su aprobación
Nota: Elaboración propia con datos de Gephi.
La visualización presenta una serie de vínculos de diferente color y tamaño, de tal manera que el color refiere a las comunidades formadas a través de la interacción con el contenido que comparten los nodos. En términos de redes, cada comunidad es un subgrafo que tiene una mayor cohesión interna pero no está aislada de la red, como sí sucede con aquellos nodos que no tienen vínculos con otros más.
El grosor de los vínculos está relacionado con la interacción entre los nodos. Los tuits, menciones, comentarios y etiquetas contribuyen a que el vínculo entre dos nodos sea más grueso y, por tanto, es una muestra de una mayor comunicación entre esos usuarios. El tamaño del nodo responde al indicador de intermediación, por lo que mientras más grande sea el nodo mayor será su capacidad de difundir contenido a una gran cantidad de personas que forman parte de sus redes sociales.
Cada comunidad construye un sentido y contenido específico que le permite reforzar sus vínculos, pero a la vez ser parte de algo más grande que aunque imperceptible. Generan estructuras reticulares que evidencian el carácter descentralizado de la acción conectiva de algunos movimientos sociales (Reguillo, 2017; Rovira, 2017). En esta primera red, el hashtag estuvo acompañado de una estrategia de visibilizar el contenido mediante etiquetar cuentas de tomadores de decisiones sobre la iniciativa. Un buen ejemplo es el tuit de @ley_olimpia del 29 de octubre de 2020, en el que se citó un tuit de @isauralara5 apoyando el hashtag. En este tuit, la cuenta @ley_olimpia etiquetó a cuentas oficiales de los legisladores involucrados en el proceso de aprobación de la ley (Ley Olimpia, 2020).
En esa primera red se puede observar de manera clara los vínculos y las comunidades pero, conforme la dinámica relacional se expone, la interacción e interactividad adquieren un carácter contingente. Esto permite observar no solo el incremento sobre la interacción alrededor del hashtag #LeyOlimipiaNacional, sino que el uso de estos miles de datos es la antesala a los millones de datos que componen el big data . La Figura 2 muestra el incremento en la cantidad de información tratada a nivel reticular, con la finalidad de observar esas relaciones mediadas por el contenido.
Figura 2. Red #LeyOlimpiaNacional después de su aprobación
Nota: Elaboración propia con datos de Gephi.
Como se observa, a pesar del incremento de la interacción de usuarios con el hashtag, existen perfiles que se mantienen como relevantes de la estructura reticular. @olimpiamujer es un ejemplo de la permanencia en cuanto a uso y reconocimiento de este perfil como uno que está permanentemente activo alrededor de esta demanda.
También otros perfiles se manifiestan en esta nueva red con una presencia adquirida por la contextualización de la demanda; el hecho de que la cuenta oficial del Senado de la República se considere como un amplificador de contenido no responde a que dicha cuenta haya estado insistiendo en la legislación sobre la Ley Olimpia, por el contrario, su visibilidad remite al papel que juegan sus integrantes en el proceso de aprobación de aquella. De allí la importancia de reconocer el papel del sujeto en estos procesos y las dinámicas que se desarrollan a partir del contenido que produce o comparte en su respectivo perfil. Que la cuenta @senadomexicano haya ampliado su visibilidad y generado un subgrafo se debió al contenido que tuvo importancia tanto para las organizaciones civiles que empujaron la iniciativa como para aquella población potencialmente beneficiada por esta Ley. Pasa, entonces, de ser una cuenta etiquetada, a una generadora de contenido. Un ejemplo es el tuit realizado el 4 de noviembre de 2020 por esta cuenta, en la que usa el hashtag para anunciar la transmisión en vivo de la reunión de las comisiones unidas Para la Igualdad de Género y Estudios Legislativos para el análisis de la Ley Olimpia (Senado de México, 2020a).
Este cambio resulta de su papel en la demanda buscada por parte del movimiento feminista. La visibilidad y el alcance de su contenido se incrementa cuando se aprueba la Ley Olimpia y la noticia se difunde por los vínculos generados a través del contenido. Durante el periodo de análisis, la publicación con mayores interacciones de la cuenta @senadomexicano fue en la que anunció la aprobación de la Ley Olimpia, el 5 de noviembre de 2020 (Senado de México, 2020b), mientras que su publicación de 7 de noviembre (Senado de México, 2020c) expone cómo la relación entre los usuarios en las plataformas no es netamente digital, sino que son la expresión de un trabajo fuera de Internet y que se sustenta en sus redes sociales, al compartir el comunicado de @OlimpiaCMujer, organización civil que impulsó la aprobación de la Ley.
Cuando los datos provenientes de la interacción y la interactividad son contextualizados es posible reconocer la lógica operativa en la plataforma sociodigital y la convergencia de las acciones que realizan los usuarios dentro y fuera de Internet. De esta manera, el ARS no solo tiene un carácter visual y estructural (Luna, 2004) sino que desde la perspectiva comunicacional permite contextualizar dicha estructura y explicar el porqué de dicha posición y qué dinámicas fundamentan esa vinculación.
Reflexiones finales
A partir de la información obtenida con este ejercicio de recolección y análisis de datos desde la perspectiva de las redes sociales, resulta importante destacar tanto sus ventajas como desventajas a nivel metodológico de acuerdo con el objeto de estudio.
Respecto a las ventajas, este tipo de análisis permiten visualizar la interacción de los usuarios alrededor de un momento específico que tiene efectos dentro y fuera de Internet. La visualización y explicación de estas estructuras permiten reconocer las dinámicas digitales que los perfiles en Twitter desarrollan alrededor de un tema que no sería prioritario en los medios de comunicación de la manera en que lo es para las mujeres mexicanas que reconocen esta Ley como un logro del movimiento feminista. Son las organizaciones civiles, integrantes del movimiento social y sus simpatizantes/aliados quienes a través de sus respectivos perfiles promueven sus demandas aprovechando las lógicas operativas (etiquetar cuentas, crear hashtags, generar contenido multimedia, entre otros) con el fin de colocar su mensaje en el espacio público digital y, con ello, fortalecer una presencia mediada en la agenda pública digital.
Otra ventaja es que esta visualización no se limita a las redes sino que, dependiendo el nivel de profundidad y el propio objeto de estudio, esta recolección de información puede llegar a conocer el contenido que se expresa en cada una de las comunidades que se visualizan. Lo anterior abre paso a considerar otros campos que pueden analizarse a partir de la información que la minería de datos puede ofrecer.
Dentro de la información que puede ser obtenida de NodeXL se encuentra la fecha de creación de un perfil, número de seguidores y personas que sigue, fecha y hora en que publicó un tuit con el hashtag, el vínculo al tuit, la ubicación desde donde se tuitea, otros hashtags utilizados dentro del tuit, dispositivo desde el que se publica el tuit y tipo de publicación (tuit, retuit, o comentario con etiqueta a otros usuarios). Toda esa información adquirirá un valor solo a través de la creatividad del investigador y de los objetivos que pretenda atender en su investigación.
En términos de desventaja, el uso de diversos software requiere necesariamente de procesos de capacitación que permitan al investigador utilizar y explotar de manera eficaz y eficiente la información que puede obtener mediante la minería de datos. Esto implica una inversión económica que se puede reflejar tanto en el uso del software como en la compra de licencias para poder utilizar todas las herramientas de dichos programas. Esto puede sortearse con el uso de programas gratuitos, sin embargo, la capacitación en su uso sigue siendo imprescindible.
Además, si el investigador considera factible el ARS, es aconsejable que el análisis de las redes incluya un proceso de contextualización sobre los indicadores que le pueden ayudar a analizar la estructura de la red y las dinámicas internas que allí se desarrollan. Como resultado de la sistematización de la experiencia con el uso del ARS en Internet, se presentan las siguientes etapas para la investigación utilizando esta metodología: delimitación del universo (reconocer la comunidad o contenido que se desarrolla alrededor de una demanda o tendencia relevante para un conjunto de usuarios en una plataforma sociodigital), obtención de datos (recopilar datos antes, durante y después de un evento trascendental para dicha comunidad que implique ese contenido o que suponga una mayor actividad por parte de los usuarios, considerando que los datos varían de acuerdo con el software utilizado), sistematización de datos (revisar los datos accidentales para poder delimitar aquellos de importancia para la investigación), análisis de datos (seleccionar los indicadores del ARS útiles para el objetivo de la investigación, ya sea un estudio estructural o dinámico) y contextualización (identificar el papel que cumple cada usuario, destacando aquellos que por sus vínculos son importantes tanto en la estructura como en la dinámica de la red, ubicando su papel dentro de la comunidad y su trayectoria fuera de Internet como posibles elementos replicados y/o base de su relevancia o prestigio para la comunidad en cuestión).
Finalmente, presentar estas ventajas y desventajas a partir de la experiencia es fundamental ya que permite a los investigadores conocer las implicaciones y oportunidades de objetos de estudio que tienen que ver con Internet. En cualquier caso, como afirman Bárcenas Barajas y Preza Carreño (2019, p. 95) “extender nuestro arsenal metodológico con el uso creativo de las posibilidades tecnológicas a nuestro alcance, nos permite también preguntarnos sobre nuestros métodos y teorías”. De allí la importancia de reconocer esta metodología y el uso potencial que se le puede dar para el análisis de aquellos fenómenos que poseen una dinámica relacional y de visibilidad a través de la interacción y la comunicación en su proceso.
Referencias
Barabási, A.-L. (2011). Introduction and Keynote to A Networked Self. En Z. Papacharissi (Ed.), A Networked Self (pp. 1–14). Routledge.
Bárcenas Barajas, K. y Preza Carreño, N. (2019). Desafíos de la etnografía digital en el trabajo de campo onlife. Virtualis, 10 (18), 134–151. https://doi.org/10.2123/virtualis.v10i18.287
Bastian, M. et al. (2021) Gephi (0.9.4). The Gephi Consortium. https://gephi.org/users/download/
Bolz, N. (2006). Comunicación mundial. Katz.
Boyd, D. (2011). Social Networks Sites as Networked Publics. En Z. Papacharissi (Ed.), A Networked Self (pp. 39–58). Routledge.
Camargo-Vega, J. J., Camargo-Ortega, J. F. y Joyanes-Aguilar, L. (2015). Conociendo Big Data. Revista Facultad de Ingeniería, 24(38), 63–77. http://www.scielo.org.co/pdf/rfing/v24n38/v24n38a06.pdf
Cheney-Lippold, J. (2019). We are data. Algorithms and the making of digital selves. New York University Press.
Congosto, M. L. (2015). Elecciones Europeas 2014: Viralidad de los mensajes en Twitter. REDES-Revista hispana para el análisis de redes sociales, 26(1), 23–52. https://doi.org/10.5565/rev/redes.529
Craig, R. T. (1999). Communication Theory as a Field. Communication Theory, 9(2), 119–161. https://doi.org/10.1111/j.1468-2885.1999.tb00355.x
Del-Fresno-García, M. (2014). Haciendo visible lo invisible: visualización de la estructura de las relaciones en red en Twitter por medio del análisis de redes sociales. Profesional De La Información, 23(3), 246–252. https://doi.org/10.3145/epi.2014.may.04
Feyerabend, P. K. (2007). Tratado contra el método: Esquema de una teoría anarquista del conocimiento. Tecnos.
Felt, M. (2016). Social media and the social sciences: How researches employ Big Data analytics. Big Data & Society, 3 (1), 1 – 15. https://doi.org/10.1177%2F2053951716645828
Floridi, L. (2015). The Onlife Manifesto. Being Human in a Hyperconnected Era. Springer Open.
García Calderón, C. y Olmedo Neri, R. A. (2019). El nuevo opio del pueblo: apuntes desde la Economía Política de la Comunicación para (des)entender la esfera digital. Iberoamérica Social, 7(XII), 84–96. https://iberoamericasocial.com/ojs/index.php/IS/article/view/366
García Canclini, N. (2004). Diferentes, desiguales y desconectados. Mapas de la interculturalidad. Gedisa.
García Canclini, N. (2019). Ciudadanos reemplazados por algoritmos. CALAS.
García Faroldi, L. (2006). Conocimiento y centralidad: el papel de los expertos en las redes de discusión política. REDES-Revista hispana para el análisis de redes sociales, 11(7), 1–32. https://doi.org/10.5565/rev/redes.92
Giménez, G. (2011). Comunicación, cultura e identidad. Reflexiones epistemológicas. Cultura y Representaciones sociales, 6(11), 109–132. https://www.scielo.org.mx/pdf/crs/v6n11/v6n11a5.pdf
González Gil, L. J. y Servín Arroyo, A. (2017). Métodos cualitativos digitales: un acercamiento a la antropología digital y otras posturas de investigación online. Virtualis, 7(15), 61–80. https://doi.org/10.2123/virtualis.v8i15.220
Gunter, B. (2014). Los procedimientos de las investigaciones cuantitativas. En K. B. Jensen (Ed.), La comunicación y los medios (pp. 379–424). Fondo de Cultura Económica.
Han, B.-C. (2018). Psicopolítica. Herder.
Innerarity, D. (2011). La democracia del conocimiento. Por una sociedad inteligente. Paidós.
La Rocca, G. (2020). La fuerza de un signo. Perspectivas teóricas para el análisis de los hashtags #. BARTARIA. Revista Castellano-Manchega de Ciencias sociales (27), 46–61. https://doi.org/10.20932/barataria.v0i27.559
Lash, S. (2005). Crítica de la información. Amorrortu.
Ley Olimpia [@ley olimpia]. (2020, 29 de octubre). @isauralara5 apoya la #LeyOlimpiaNacional… [Tuit]. Twitter. https://twitter.com/ley_olimpia/status/1322036769685200897
Lozares, C. (1996). La teoría de redes sociales. Papers: revista de sociología (48), 103–126. https://doi.org/10.5565/rev/papers/v48n0.1814
Luna, M. (2004). Redes sociales. Revista Mexicana de Sociología, 66(Número Especial), 59–75. https://doi.org/10.2307/3541443
Miège, B. (1995). Las etapas del pensamiento comunicacional. Signo y Pensamiento(26), 109–138. https://revistas.javeriana.edu.co/index.php/signoypensamiento/article/view/5633/4496
Morin, E. (1994). Introducción al pensamiento complejo. Gedisa.
Neyland, D. (2019). The Everyday Life of an Algorithm. Palgrave Macmillan.
Olmedo Neri, R. A. (2019). #AmorEsAmor como constructor de redes digitales en el movimiento LGBTTTIQA en México. Virtualis, 10(19), 109–133. https://doi.org/10.2123/virtualis.v10i19.301
Olmedo Neri, R. A. (2020). Implicaciones metodológicas en el Análisis de Redes Sociales en las redes sociodigitales. Quórum Académico, 17(2), 73–94. https://www.redalyc.org/articulo.oa?id=199064447005
Olmedo Neri, R. A. (2021). Cartografías conectivas: un acercamiento a la construcción de redes sociodigitales del movimiento LGBT+. Chasqui. Revista Latinoamericana de Comunicación(147), 123–142. https://doi.org/10.16921/chasqui.v1i147.4456
Ovadia, S. (2013) The role of Big Data in the Social Sciences. Behavioral & Social Sciences Librarian(32), 130–134. https://doi.org/10.1080/01639269.2013.787274
Papacharissi, Z. (2011). Conclusion: A Networked Self. En Z. Papacharissi (Ed.), A networked self (pp. 304–317). Routledge.
Pink, S., Horst, H., Postill, J., Hjorth, L., Lewis, T. y Tachi, J. (2019). Etnografía digital. Principios y práctica. Morata
Pisani, F. y Piotet, D. (2009). La alquimia de las multitudes. Paidós.
Poell, T. y Van Dijck, J. (2018). Social media and new protest movements. En J. Burgess, A. Marwick y T. Poell (Eds.), The SAGE Handbook of Social Media (pp. 546–561). SAGE.
Prigogine, Y. (1994). El devenir de la ciencia y de los relojes a las nubes. En D. F. Schitman (Ed.), Nuevos paradigmas. Cultura y Subjetividad (pp. 37–59). Paidós.
Reguillo, R. (2017). Paisajes insurrectos. ITESO-NED.
Ricaurte, P. y Ramos-Vidal, I. (2015). Investigación en redes sociales digitales: consideraciones metodológicas desde el paradigma estructural. Virtualis, 6(11), 165–194. https://doi.org/10.2123/virtualis.v6i11.119
Rogers, R. (2018). Digital methods for across-platform analysis. En J. Burgess, A. Marwick y T. Poell (Eds.),The SAGE Handbook of Social Media(pp. 91–110). SAGE.
Rovira, G. (2017). Activismo en red y multitudes conectadas. Icaria.
Senado de México (@senadomexicano) (2020a, 4 de noviembre). Reunión de las comisiones unidas Para la Igualdad de Género y de Estudios Legislativos Segunda para analizar la #LeyOlimpiaNacional, del 4 de noviembre de 2020 [Tuit]. Twitter. https://twitter.com/senadomexicano/status/1324026330271248384
Senado de México (@senadomexicano) (2020b, 5 de noviembre). ✅ Para erradicar la violencia digital y mediática, el Senado aprueba por unanimidad la reforma conocida como #LeyOlimpiaNacional.Consulta más en: https://senado.gob.mx/64/gaceta_del_senado/documento/113733 [Tuit]. Twitter. https://twitter.com/senadomexicano/status/1324436870651170820
Senado de México (@senadomexicano) (2020c, 7 de noviembre). ▶️Tras la aprobación de la #LeyOlimpiaNacional, @OlimpiaCMujer, quien inspiró el instrumento legal que busca proteger a las mujeres, te comparte el motivo de esta lucha en favor de los derechos femeninos. 💜 [Tuit]. Twitter. https://twitter.com/senadomexicano/status/1325275348863385601
Sinanan, J. y McDonald, T (2018) Etnography. En J. Burgess, A. Marwick, & T. Poell (Eds.), The SAGE Handbook of Social Media(pp. 179–195). SAGE.
NodeXL(1.0.1.238). (2013). Social Media Research Foundation. https://www.smrfoundation.org/
Senado de la República. (2020, 5 de noviembre). Aprueban la Ley Olimpia; hasta seis años de cárcel a quien viole la intimidad sexual.Boletines. https://bit.ly/3L5HvG6
Sfez, L. (1995). Critica de la comunicación. Amorrortu.
Vizer, E. (2016). Notas para una ontología de la comunicación. En E. Vizer y C. Vidales (Eds.), Comunicación, campo(s), teorías y problemas (pp. 21–65). Salamanca.
Watts, D. J. (2006). Seis grados de separación, La ciencia de las redes en la era del acceso. Paidós.
Wiedermann, G. (2013) Opening up to Big Data: Computer-Assited Analysis of Textual Data in Social Sciences. Historical Social Research, 38(4), 332–357. https://www.jstor.org/stable/24142701
Yehya, N. (2017). Nuevos entornos nueva carne. Reconfiguración y personalización tecnológica de la cultura. Cátedra Eusebio Francisco Kino SJ. https://rei.iteso.mx/bitstream/handle/11117/4689/Tecnolog%c3%ada%20de%20la%20Cultura.pdf?sequence=3&isAllowed=y
Acerca del autor
Raul Anthony Olmedo Neri (raul.olmedo@politicas.unam.mx) es doctorante en Ciencias Políticas y Sociales en la Universidad Nacional Autónoma de México (UNAM). Maestro en Comunicación y licenciado en Ciencias de la Comunicación por la Universidad Nacional Autónoma de México. (ORCID 0000-0001-5318-0170).
Recibido: 19/09/2021
Aceptado: 27/01/2022
Cómo citar este artículo
Olmedo Neri, R. A. (2022). Rastrear la interacción: redes y big data. Caleidoscopio - Revista Semestral de Ciencias Sociales y Humanidades, 24(46). https://doi.org/10.33064/46crscsh3350
Esta obra está bajo una
Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional
Usted es libre de compartir o adaptar el material en cualquier medio o formato bajo las condiciones siguientes: (a) debe reconocer adecuadamente la autoría, proporcionar un enlace a la licencia e indicar si se han realizado cambios; (b) no puede utilizar el material para una finalidad comercial y (c) si remezcla, transforma o crea a partir del material, deberá difundir sus contribuciones bajo la misma licencia que el original.
Resumen de la licencia https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es_ES
Texto completo de la licencia https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode