
Sapete quando vi dicono che ‘i dati non mentono’? Beh, forse mentono un po’ di più di quanto vorremmo ammettere. Secondo un preprint pubblicato recentemente, quasi un terzo degli studi accademici sui social media ha legami non dichiarati con le aziende del settore. Insomma, il classico caso di ‘chi paga il pifferaio magico’.
La notizia non è esattamente una sorpresa per chi ha passato anni a scavare nel fango dei dataset aziendali, ma fa sempre un certo effetto vedere i numeri messi nero su bianco. Perché, diciamocelo, quando leggiamo uno studio accademico, ci aspettiamo che sia il risultato di una ricerca obiettiva, non di un report commissionato da qualche corporate per pulirsi l’immagine.
Ma perché dovrebbe importarci, noi che passiamo le notti a far brillare i LED con Arduino o a modellare robot in Blender? Perché i dati sono il nostro pane quotidiano. Siamo quelli che prendono i dataset, li smontano, li rimontano e a volte li fanno cantare in modi che neanche gli autori originali avevano previsto. E se quei dati sono già manipolati o parziali, il nostro lavoro diventa un po’ come costruire una torre di Lego con alcuni pezzi mancanti.
La prima lezione è semplice: diffidate sempre delle fonti. Non perché siano tutte bugiarde, ma perché spesso manca la trasparenza. Se un paper non dichiara i finanziamenti, fatevi due domande. Se un dataset è stato raccolto da un’azienda, chiedetevi cosa si aspettano di trovare (e cosa vogliono nascondere). E se vi capita tra le mani uno studio che sembra troppo bello per essere vero, beh, probabilmente lo è.
La seconda lezione è ancora più importante: fatevi i vostri dataset. Non sto dicendo che dovete rinunciare a usare i dati degli altri (sarebbe come dire a un maker di smettere di usare Arduino), ma se potete, raccogliete i vostri. Con sensori, con scraper, con i vostri progetti open source. Più controllate i dati, meno dovete fidarvi degli altri.
E poi, ammettiamolo, c’è un certo piacere masochistico nel trovare i bias nascosti nei dataset aziendali. È come smontare un vecchio videogioco arcade e scoprire che il codice è pieno di Easter egg. Solo che qui gli Easter egg sono bug, omissioni e a volte vere e proprie menzogne.
In conclusione, la prossima volta che leggete uno studio sui social media (o su qualsiasi altra cosa), fatevi due conti. Chi lo ha finanziato? Quali interessi ci sono dietro? E, soprattutto, vi fidate davvero di chi vi sta dicendo la verità? Perché noi, i maker, i geek e gli hacker, sappiamo che la verità spesso è più complicata di quello che sembra.
E se vi serve un dataset pulito, beh, forse è il momento di costruirvi il vostro.
Source: Nearly a third of social media research has undisclosed ties to industry
