Lo primero que necesitamos es una lista de medios de comunicación. Por ejemplo esta lista con más de 100 españoles:
Creamos un simple script para sacar el host del email:
LISTAMEDIOS="listamedios.txt" NMEDIOS=$(cat $LISTAMEDIOS | wc -l) while [ "$NMEDIOS" -ge 1 ]; do MEDIO=$(cat $LISTAMEDIOS | head -$NMEDIOS | tail -1) HOSTMAIL=$(host $MEDIO | grep "mail is" | cut -d " " -f 7 | head -1) echo "$MEDIO;$HOSTMAIL" NMEDIOS=$(echo "$NMEDIOS - 1" | bc ) done
Ese script lo podemos llamar por ejemplo sacainfo.sh, lo colocamos en el mismo directorio donde tengamos la lista de medios y lo ejecutamos así:
bash sacainfo.sh
Si queremos que nos guarde la salida en un archivo lo hacemos así:
bash sacainfo.sh > salida.csv
El resultado estará desordenado. Podemos crear un segundo archivo de salida ordenado:
cat salida.csv | sort | uniq > salida2.csv
Y finalmente vamos a solamente extraer los host de email y ordenarlos en una salida3.csv
cat salida2.csv | cut -d ";" -f 2 | sort | uniq > salida3.csv
Con esto nos damos cuenta de que en realidad no existe tanta diversidad de medios en España. Simplemente con mirar sus servidores de correo nos damos cuenta de esto.
diariodeibiza.es mxr.renr.es. diariodemallorca.es mxr.renr.es. diarioinformacion.com mxr.renr.es. laopinioncoruna.es mxr.renr.es. laopiniondemalaga.es mxr.renr.es. laopiniondemurcia.es mxr.renr.es. laopiniondezamora.es mxr.renr.es. laopinion.es mxr.renr.es. laprovincia.es mxr.renr.es. levante-emv.com mxr.renr.es. lne.es mxr.renr.es. regio7.cat mxr.renr.es. superdeporte.es mxr.renr.es.
Editorial prensa Ibérica http://renr.es básicamente concentran todo su correo por el mismo sitio ya que son lo mismo.
abc.es mx.acens.vocento.com. diariovasco.com mx.acens.vocento.com. elcomercio.es mx.acens.vocento.com. elcorreo.com mx.acens.vocento.com. eldiariomontanes.es mx.acens.vocento.com. hoy.es mx.acens.vocento.com. ideal.es mx.acens.vocento.com. lasprovincias.es mx.acens.vocento.com. laverdad.es mx.acens.vocento.com. lavozdigital.es mx.acens.vocento.com. abcdesevilla.es mx.acens.vocento.com.
El abc tambien son de concentrar. Todos esos supuestos periódicos al final son de vocento y pasan por allí los correos.
Y sport de elperiodico:
elperiodicodearagon.com mail3.elperiodico.com. elperiodicomediterraneo.com mail3.elperiodico.com. diariocordoba.com mail4.elperiodico.com. elperiodico.com mailer1.elperiodico.com. sport.es mail2.elperiodico.com. elperiodico.com mail.elperiodico.com. elperiodicoextremadura.com mail.elperiodico.com.
Luego por el sur esta el grupo joly de periodismo de agencia y de becarios:
eldiadecordoba.es mail2.grupojoly.com. europasur.es mail2.grupojoly.com. diariodecadiz.es mail.grupojoly.com.
Tienen muchos más medios. Esto no es un análisis de absolutamente todo, no obstante ya va haciéndonos pensar que esta gentuza al final son los mismos siempre.
Su talón de Aquiles es el correo. Hoy en día se depende mucho del correo de modo que si caen esos servidores lo mismo descansan los becarios de unas decenas de periódicos. Dios no lo quiera. Otra opción es agencia EFE y europapress que nutren a muchos medios.
Vamos a obtener la posición de sus servidores de correo:
apt-get install geoip-bin geoip-database-contrib
Y esto se usa así:
geoiplookup tomir.ultimahora.es | grep "GeoIP City"
Un ejemplo de salida de varias peticiones::
expansion-com.mail.protection.outlook.com;GeoIP City Edition, Rev 1: GB, H9, London, City of, London, EC2V, 51.514198, -0.093100, 0, 0 elmundo-es.mail.protection.outlook.com;GeoIP City Edition, Rev 1: GB, H9, London, City of, London, EC2V, 51.514198, -0.093100, 0, 0 diariojaen-es.mail.protection.outlook.com;GeoIP City Edition, Rev 1: GB, H9, London, City of, London, EC2V, 51.514198, -0.093100, 0, 0 marca-com.mail.protection.outlook.com;GeoIP City Edition, Rev 1: GB, H9, London, City of, London, EC2V, 51.514198, -0.093100, 0, 0 mail.lavozdealmeria.es.;GeoIP City Edition, Rev 1: ES, 60, Comunidad Valenciana, Orihuela, 03300, 38.084801, -0.944000, 0, 0 tomir.ultimahora.es.;GeoIP City Edition, Rev 1: ES, 60, Comunidad Valenciana, Valencia, 46001, 39.466702, -0.366700, 0, 0
Con esos datos ya podemos geoposicionar donde pasa más o menos el correo de los medios en España no obstante muchos periódicos y periodistas al final usan gmail y cosas así. Los propios periódicos redireccionan su correo a gmail, incluso periódicos de movimientos sociales.
es muy bueno che! ya lo sabiamos (obiamente aqui en argentina sucede lo mismo), pero es muy bueno!
Que seria esto segun la profecion de la informacion? periodismo de investiacion digital?
P.D.: Ya nos podemos montar un programa los domindos a las 21 hs!! (por lo menos aqui en ese dia y horario estan los supuestos «investiadores periodistas»).