Tras dos años de vida mad.convoca.la está cogiendo tracción y cada vez los movimientos sociales de la ciudad lo están usando más y haciendo suya. No obstante aún no podemos decir que somos representativos de los eventos activistas y culturales ya que hay muchos eventos que aún no están en la agenda. La manera más fácil de ver qué eventos nos faltan es mirar los que se mueven en los canales de telegram de difusión de los colectivos y los que agrupan los de “convocatorias madrid”:
channel_ids:
- -1001066046787 # convocatorias madrid (grupo)
- -1001000140354 # convocatorias madrid
- -1001291582971 # convocatorias x madrid
- -1001882040176 # convocatorias madrid 2
- -1001358084598 # movimiento vivienda madrid
- -1001553337697 # madrid underground
- -1001252254985 # la villana
- -1001179309450 # la horizontal
- -1001246211373 # cs la brecha
- -1001295739886 # esla eko difusion
- -1001313655473 # enre difusion
- -1001430804383 # cso casika
- -1001966857821 # la rosa
- -1002185588741 # cso diskordia
- -4233849262 # test calendario
- -1001405778240 # nodo difusion
- -1001121496358 # vivienda krbc
- -1001082305638 # sindicato inquilinas
- -1001392667650 # ateno popular alcorcón
- -1001457572410 # orgullo vallekano
- -1001465695553 # cso atalaya
- -1001623298472 # maliciosa
- -1001760205107 # local anarquista magadalena
- -1001199621953 # cnt madrid
- -1001630474472 # a way of live (conciertos)
La realidad es que por las formas de hacer del colectivo, la velocidad de llegar a los nuevos colectivos es bastante lenta. Por ello, desde el Nodo de Producción de Carabanchel, se hizo una herramienta automática que está a la escucha en dichos canales, lee los carteles de los eventos de forma automática y extrae los datos necesarios para subirlos a mad.convoca.la. Nos presentaron la herramienta en la asamblea del 9 de Octubre y desde entonces estamos debatiendo si el uso de esta herramienta es coherente con nuestros valores.
Debates #
En particular se han producido los siguientes debates:
¿Qué nos aporta la herramienta? #
La herramienta tiene el potencial de:
- Tener con “poco esfuerzo” una agenda más representativa de la actividad de la ciudad.
- Reducir el esfuerzo necesario para subir eventos que aún se están subiendo manualmente. En vez de estar monitorizando dichos canales y metiendo los datos a mano, las administradoras “sólo” tendríamos que verificar que los datos de los eventos están bien introducidos y que cumplen nuestras guías de publicación.
- Puede ser un buen primer paso para permitir a las usuarias subir eventos directamente a través de telegram. Podríamos usar el mismo programa para que una usuaria mande el cartel al bot de telegram y a partir de los resultados la usuaria sólo tenga que editar los campos que estén mal.
- Dar cabida a aquellos colectivos que no se vean con las fuerzas necesarias para hacer su integración ahora mismo en convócala pero que si que querrían que sus eventos estuviesen recogidos.
¿Es coherente el uso de la herramienta desde el punto de vista ecológico? #
Para que la herramienta funcione es necesario extraer la información del cartel de manera programática, para ello hay que utilizar las siguientes tecnologías:
- OCR para identificar la información en bruto del cartel (fecha, lugar, título del evento…)
- Probablemente LLM para limpiar los datos procedentes del OCR.
- Geolocalización para deducir las coordenadas del lugar.
Todos estos procesos (en especial el LLM) generan un consumo energético y de recursos importantes, en especial si se delegan a servicios externos como los de Google, Ngrok, Amazon, Claude…(para más información puedes ver esta charla o las publicaciones de la gente de tu nube seca mi rio). Este es el funcionamiento actual de la herramienta.
Otro factor a tener en cuenta es el hecho de que es probable que el uso de procesos de computación externa vaya a dar un vuelco dentro de no mucho. El incremento de la demanda y el límite de recursos es probable que haga que ya no se puedan usar de manera gratuita y tengamos que empezar a pagar por ellos.
Como alternativa se podrían correr estos procesos en los servidores de los activistas que formamos parte del colectivo. Esto reduce considerablemente la huella ecológica del uso de la herramienta ya que:
- Se usan modelos mucho más pequeños que consumen menos recursos
- No incrementamos el uso de los servicios externos de IA que está desencadenando un problema ecológico.
Aunque esta solución sigue teniendo sus contras:
- Al tener menos potencia, la calidad de los eventos creados va a ser peor que si usásemos los servicios externos. Esto implicará que haga falta más esfuerzo militante para corregir errores.
- El uso de LLM aunque sea en nuestros servidores conlleva una huella ecológica mayor que el consumo local de recursos. Hay que tener en cuenta también los necesarios para entrenar los modelos que usamos. No obstante creemos que esto está fuera de nuestro alcance. Los modelos ya han sido entrenados y que los usemos o no no va a cambiar este hecho. El valor diferencial es que las personas que entrenan los modelos no saben que los estamos usando por lo que no colaboramos en la carrera de los LLM.
¿Es coherente el uso de la herramienta desde el punto de vista político? #
Desde el punto de vista político nos han surgido los siguientes debates:
- Riesgo de pérdida de razón de ser del colectivo
- Depender de servicios externos
- Riesgo de pérdida de calidad
- Riesgo de sobrecarga de moderación
- ¿Empezamos a usar la herramienta ya o esperamos a tener la que querríamos tener?
Riesgo de pérdida de razón de ser del colectivo #
Para nosotras la web es una herramienta para construir el colectivo que mantiene el proyecto, hasta ahora nuestra manera de crearlo y mantenerlo es estableciendo una relación más o menos estrecha con los distintos colectivos que queremos que estén representados en la agenda. La idea es que ellas se sientan parte de esta agenda, no que sea algo arbitrado desde fuera sino por los mismos movimientos sociales.
El hecho de introducir un elemento de automatización como esta herramienta nos genera dudas de si este objetivo principal puede verse desplazado. Quizá al tener ya sus eventos subidos sin su interacción pueden perder el interés de implicarse más en el colectivo.
Dado que está tan integrado en nuestros valores, no creemos que nosotras dejemos de empujar en esta dirección. También creemos que debemos conseguir que el proyecto sea suficientemente llamativo por si mismo para que los colectivos quieran acercarse a nosotras, no que se vean obligadas a venir para suplir su necesidad de publicación de eventos.
Por ello creemos que es positivo seguir adelante con la implementación de la herramienta como algo complementario y temporal a nuestro hacer actual.
Depender de servicios externos #
El estado actual de la herramienta nos introduciría dos dependencias externas:
- Los servicios de computación externos (Google, OpenAi, …): Además de las razones ecológicas no nos parece buena idea subir activamente carteles de los movimientos sociales a dichos servicios, poco podemos hacer para que ellos no lo scrapeen, pero no queremos engrosar sus bases de datos activamente, aunque sea información pública.
- El servicio está corriendo en servidores fuera de nuestra gestión, usando credenciales de otra persona para los servicios externos y su cuenta de Telegram. Esto implicaría que si quisiésemos desactivarlo, levantarlo si se ha caído, añadir canales, actualizar el software o cualquier otra operación dependeríamos de esa persona para que lo hiciese. Dado que sería una pieza integral del colectivo creemos que debería de ser gestionado por el propio colectivo y estar alojado en servidores gestionados por nosotras.
Riesgo de pérdida de calidad #
Una de los puntos fuertes de mad.convoca.la es la calidad de los eventos subidos. Esto es garantizado por la red de confianza que hemos creado con las usuarias y la moderación del colectivo. Nos daba miedo que al introducir esta herramienta la calidad bajase por dos razones:
- No todos los eventos subidos en dichos canales cumplirán nuestros criterios de publicación
- El sistema automatizado tendrá errores de extracción de información
- Cualquier evento creado por un proceso automatizado tendrá menos cariño que el de un humano que quiere promocionar su evento, por lo tanto siempre será de peor calidad.
Para solucionarlo proponemos que:
- La herramienta publique eventos de forma anónima y pase por moderación.
- Intentar que los colectivos no usen la herramienta automatizada.
Riesgo de sobrecarga de moderación #
Hicimos una prueba de conectar la herramienta un par de días y vimos que se generaban en torno a 10 eventos diarios, lo que supera con creces la carga que tenemos ahora mismo. No estamos seguras de tener las suficientes fuerzas para abordarlo, pero queremos probar a ver.
Algo que va a dificultar la moderación es que la herramienta aún no comprueba si un evento con el mismo contenido ya está subido a convócala, por lo que las administradoras tendrán que ir uno por uno comprobando. Es algo que está planeado solucionarlo en una versión posterior del programa.
¿Empezamos a usar la herramienta ya o esperamos a tener la que querríamos tener? #
De los debates anteriores hemos deducido que, a pesar de ser una muy buena herramienta, no nos sentimos bien conectando la herramienta hasta que no se cumplan los siguientes puntos:
- Que toda la computación se haga en un servidor gestionado por alguien del colectivo
- Que no se usen servicios externos de OCR o LLM.
- Que las fuentes de los datos (las administradoras o colectivos que gestionan los canales de telegram) sean conscientes y nos den su consentimiento de que se extraigan sus eventos y se ingesten automáticamente en mad.convoca.la. No nos parece la mejor aproximación para crear la red de colectivos que deseamos.
Entendemos que esto ralentizará el tiempo de implementación pero preferimos hacer las cosas acordes a nuestros valores.
Conclusión #
La herramienta nos resulta muy interesante y queremos incorporarla lo antes posible siempre y cuando su implementación cumpla con nuestros valores.
Nos pondremos por tanto a modificar el software creado por el Nodo de Producción para ver si es posible hacer una versión que corra el OCR y el LLM en local y que de resultados medio decentes. Una vez montado veremos si tenemos las fuerzas para mantenerlo encendido.