Salta la navigazione
Parte II Capitolo 10

Privacy

Hero image of Web Almanac characters with cameras, phones, and microphones acting like paparazzi while another character pulls back a shower curtain to reveal a web page behind it.

Introduzione

Questo capitolo del Web Almanac offre una panoramica dello stato attuale della privacy sul web. Questo argomento è diventato di recente sempre più popolare e ha aumentato la consapevolezza da parte degli utenti. La necessità di linee guida è stata soddisfatta con varie normative (come GDPR in Europa, LGPD in Brasile, CCPA in California per citarne solo alcuni). Questi mirano ad aumentare la responsabilità dei responsabili del trattamento dei dati e la loro trasparenza nei confronti degli utenti. In questo capitolo si discute della prevalenza del tracciamento online con diverse tecniche e del tasso di adozione dei banner di consenso sui cookie e delle politiche sulla privacy da parte dei siti web.

Online tracking

I tracker di terze parti raccolgono i dati degli utenti per creare profili del comportamento dell’utente da monetizzare a fini pubblicitari. Ciò solleva preoccupazioni per la privacy degli utenti sul Web, che ha portato all’emergere di varie protezioni di tracciamento. Tuttavia, come vedremo in questa sezione, il monitoraggio online è ancora ampiamente utilizzato. Non solo ha un impatto negativo sulla privacy, il monitoraggio online ha un enorme impatto sull’ambiente ed evitarlo può portare a prestazioni migliori.

Esaminiamo l’importanza delle tipologie più comuni di tracciamento di terze parti, ovvero mediante cookie di terze parti e l’utilizzo del fingerprinting. Il monitoraggio online non si limita solo a queste due tecniche, ne continuano a sorgere di nuove per aggirare le contromisure esistenti.

Tracker di terze parti

Utilizziamo l’elenco dei tracker di WhoTracksMe per determinare la percentuale di siti web che inviano una richiesta a un potenziale tracker. Come mostrato nella figura seguente, abbiamo riscontrato che almeno un potenziale tracker è presente su circa il 93% dei siti web.

Figura 10.1. Siti web che includono almeno un potenziale tracker

Abbiamo esaminato i tracker più utilizzati e tracciato la prevalenza dei 10 più popolari.

Figura 10.2. Top 10 potenziali tracker

Il più grande player nel mercato del tracking online è senza dubbio Google, con otto dei suoi domini presenti tra i primi 10 potenziali tracker e prevalenti su almeno il 70% dei siti web. Sono seguiti da Facebook e Cloudflare, anche se quest’ultimo probabilmente riflette maggiormente la loro popolarità come sito di hosting.

L’elenco dei tracker di WhoTracksMe definisce anche le categorie a cui appartengono i tracker. Se rimuoviamo CDN e siti di hosting dalle nostre statistiche, presumendo che non possano tenere traccia, o almeno che questa non sia la loro funzione principale, si ottiene una visione leggermente diversa dei primi 10.

Figura 10.3. I 10 migliori tracker

Qui Google costituisce ancora sette dei primi 10 domini. La figura seguente mostra la distribuzione delle diverse categorie per i 100 più grandi tracker potenziali per categoria.

Figura 10.4. Categorie dei 100 potenziali tracker più popolari

Quasi il 60% dei tracker più popolari sono legati alla pubblicità. Ciò potrebbe essere dovuto al fatto che la redditività del mercato della pubblicità online viene percepita come correlata alla quantità di tracciamento.

Cookies

Abbiamo esaminato i cookie più popolari impostati sui siti Web nell’intestazione della risposta HTTP, in base al loro nome e dominio.

Dominio Nome del Cookie Siti web
doubleclick.net test_cookie 24%
facebook.com fr 10%
youtube.com VISITOR_INFO1_LIVE 10%
youtube.com YSC 10%
doubleclick.net IDE 9%
doubleclick.net sconosciuto 9%
youtube.com GPS 9%
doubleclick.net sconosciuto 8%
google.com NID 6%
doubleclick.net sconosciuto 6%
Figura 10.5. I migliori cookie sui siti desktop
Dominio Nome del Cookie Siti web
doubleclick.net test_cookie 32%
doubleclick.net IDE 21%
facebook.com fr 10%
youtube.com VISITOR_INFO1_LIVE 10%
youtube.com YSC 10%
google.com NID 10%
youtube.com GPS 8%
doubleclick.net DSID 7%
yandex.ru yandexuid 6%
yandex.ru i 6%
Figura 10.6. Principali cookie sui siti mobile

Come puoi vedere, il dominio di monitoraggio di Google “doubleclick.net” imposta i cookie su circa un quarto dei siti web su un client mobile e un terzo di tutti i siti web su un client desktop. Ancora una volta, nove dei dieci cookie più popolari sul client desktop e sette su dieci sui dispositivi mobile sono impostati da un dominio Google. Si tratta di un limite inferiore per il numero di siti Web su cui è impostato il cookie, poiché contiamo solo i cookie impostati tramite un’intestazione HTTP: un gran numero di cookie di tracciamento viene impostato utilizzando script di terze parti.

Fingerprinting

Un’altra tecnica di tracciamento ampiamente utilizzata è il fingerprinting. Consiste nel raccogliere diversi tipi di informazioni sull’utente con l’obiettivo di creare per loro una “impronta digitale” unica. Diversi tipi di impronte digitali vengono utilizzati sul Web dai tracker. Il fingerprinting del browser utilizza caratteristiche specifiche del browser dell’utente, basandosi sul fatto che la possibilità che un altro utente abbia la stessa identica configurazione del browser è abbastanza piccola se c’è un numero sufficiente di variabili da tracciare. Durante la nostra scansione, abbiamo esaminato la presenza della libreria FingerprintJS , che fornisce il fingerprinting del browser come servizio.

Figura 10.7. Siti web che utilizzano FingerprintJS

Sebbene la libreria sia presente solo su una piccola percentuale di siti Web, la natura persistente delle fingerprinting significa che anche un piccolo utilizzo può avere un grande impatto. Inoltre, FingerprintJS non è l’unico tentativo di rilevamento delle impronte digitali. Anche altre librerie, strumenti e codice nativo possono servire a questo scopo, quindi questo è solo un esempio.

Piattaforme di gestione del consenso

I banner di consenso sui cookie sono diventati comuni ora. Aumentano la trasparenza nei confronti dei cookie e spesso consentono agli utenti di specificare le proprie scelte sui cookie. Sebbene molti siti web scelgano di utilizzare la propria implementazione di banner cookie, recentemente sono emerse soluzioni di terze parti chiamate Piattaforme di gestione del consenso. Le piattaforme forniscono ai siti Web un modo semplice per raccogliere il consenso dell’utente per diversi tipi di cookie. Vediamo che il 4.4% dei siti Web utilizza una piattaforma di gestione del consenso per gestire le scelte dei cookie sui client desktop e il 4.0% sui client mobile.

Figura 10.8. Siti web che utilizzano una piattaforma di gestione del consenso
Figura 10.9. Popolarità della piattaforma di gestione del consenso

Osservando la popolarità delle diverse soluzioni di gestione del consenso, possiamo vedere che Osano e Quantcast Choice sono le piattaforme leader.

IAB Europe, l’Interactive Advertising Bureau, è un’associazione europea per il marketing e la pubblicità digitale. Hanno proposto un Transparency Consent Framework (TCF) come soluzione conforme al GDPR per ottenere il consenso degli utenti sulle loro preferenze in materia di pubblicità digitale. L’implementazione fornisce uno standard di settore per la comunicazione tra editori e inserzionisti sul consenso dei consumatori.

Figura 10.10. Tasso di adozione del banner TCF

Anche se i nostri risultati mostrano che il banner TCF non è ancora lo “standard del settore”, è un passo avanti. Considerando che il principale gruppo target di IAB Europe sono infatti gli editori europei, e la nostra scansione è globale, avere un tasso di adozione sull’1.5% dei siti web su client desktop e dell’1.4% su mobile non è poi così male.

Norme sulla privacy

Le politiche sulla privacy sono ampiamente utilizzate dai siti Web per soddisfare gli obblighi legali e aumentare la trasparenza nei confronti degli utenti sulle pratiche di raccolta dei dati. Nella nostra ricerca per indicizzazione, abbiamo cercato parole chiave che indicano la presenza di un testo di informativa sulla privacy su ciascun sito Web visitato.

Figura 10.11. Siti Web che dispongono di una politica sulla privacy

I risultati mostrano che quasi la metà dei siti Web nel set di dati ha incluso una politica sulla privacy, il che è positivo. Tuttavia, gli studi hanno dimostrato che la maggior parte degli utenti di Internet non si preoccupa di leggere le politiche sulla privacy e, quando lo fanno, mancano di comprensione a causa della lunghezza e della complessità della maggior parte dei testi delle politiche sulla privacy. Avere ancora una politica è un passo avanti!

Conclusione

Questo capitolo ha mostrato che il monitoraggio di terze parti rimane prominente sia sui client desktop che su quelli mobile, con Google che traccia la percentuale più alta di siti web. Le piattaforme di gestione del consenso vengono utilizzate su una piccola percentuale di siti Web; tuttavia molti siti web implementano i propri banner di consenso ai cookie.

Infine, circa la metà dei siti Web include una politica sulla privacy, che beneficia notevolmente della trasparenza nei confronti degli utenti sulle pratiche di elaborazione dei dati. Questo è senza dubbio un passo avanti, ma resta ancora molto da fare. Al di fuori di questa analisi sappiamo che le politiche sulla privacy sono difficili da leggere e comprendere e che i banner di consenso sui cookie manipolano gli utenti nel consenso.

Affinché il Web rispetti veramente gli utenti, la privacy deve essere una parte del concetto, non un ripensamento. La regolamentazione è una buona cosa a questo riguardo ed è rassicurante vedere un aumento della regolamentazione della privacy in tutto il mondo. Privacy by design dovrebbe essere la norma, piuttosto che implementare politiche e strumenti al fine di soddisfare i requisiti legali minimi ed evitare sanzioni finanziarie.

Autore

Citazione

BibTeX
@inbook{WebAlmanac.2020.Privacy,
author = "Dimova, Yana e Satyagraha, Laurent Devernay e Ostapenko, Max e Pollard, Barry",
title = "Privacy",
booktitle = "Il Web Almanac 2020",
chapter = 10,
publisher = "HTTP Archive",
year = "2020",
language = "Italiano",
url = "https://almanac.httparchive.org/en/2020/privacy"
}