
[ Home | Liste | F.A.Q. |
Risorse | Cerca... ]
[ Data: precedente
| successivo
| indice ]
[ Argomento: precedente
| successivo
| indice ]
Archivio: forensics@sikurezza.org
Soggetto: [forensics] WebArchive (WayBack Machine)
Mittente: Daniele Minotti
Data: Sat, 20 Sep 2008 15:22:54 +0200 (CEST)
Spero di non essere OT.
Tutti conosciamo la WayBack Machine di WebArchive.
Mi e' capitato - e penso anche a voi - di utilizzare/veder utilizzati i
relativi servizi per *provare* l'esistenza (e il relativo contenuto) di
determinate pagine in un dato periodo. Un po' come la cache di Google, ma
con una *memoria* decisamente piu' ampia.
Al di la' della mia convenienza quando l'ho usata, non sono convintissimo
della piena affidabilita'. Anche leggendo termini e condizioni del servizio
http://www.archive.org/about/terms.php
Al di la' di cio' (ma penso sia gradita ogni opinione sul punto), il mio
interesse, oggi, e' piu' astratto che concreto.
Mi riferisco ad un caso di cui avrete sentito parlare: la condanna dello
storico Carlo Ruta per stampa clandestina
http://www.minotti.net/2008/08/31/carlo-ruta-i-motivi-della-sentenza/
(perdonate l'autopromozione)
Uno tra i nodi critici (comunque, per me, non decisivo) riguardava la
*periodicita' regolare* delle pubblicazioni.
La PG ha fatto le sue verifiche. A questo link trovate trascrizione di
alcuni atti del procedimento
http://www.giornalismi.info/vocilibere/articoli/art_1092.html
in particolare una relazione di servizio dove si riportano i risultati
dell'utilizzo della WayBack Machine
Ora, a parte il fatto che, secondo me, quella lista di *aggiornamenti* non
prova la periodicita' regolare (ove prova neccessaria a fini giuridici), il
punto e' il seguente:
atteso che Webarchive opera, fondamentalmente, con un crawler memorizzando,
poi, le revisioni di un certo URL, che voi sappiate i risultati come quelli
della relazione menzionata sono esclusivamente quelli che registrano un
qualche cmabiamento rispetto all'*aggiornamento* precedente oppure sono
soltanto quelli prelevati dopo la visita, periodica, del crawler? Io penso
di no (ho fatto la verifica con siti da me gestiti).
Eppoi, conoscete la frequenza di crawling?
La risposte parrebbero essere qui
http://www.archive.org/about/faqs.php
What does it mean when a site's archive data has been "updated"?
When our automated systems crawl the web every few months or so, we find
that only about 50% of all pages on the web have changed from our previous
visit. This means that much of the content in our archive is duplicate
material. If you don't see ""*"" next to an archived document, then the
content on the archived page is identical to the previously archived copy.
Mi sembra che queste risposte possano intervenire sul giudizio di
affidabilita' di questo mezzo di prova che, alla fine, direi negativo o,
comuqnue, non completamente positivo (dipende dalla prova che si vuole
ottenere).
Ripeto: soltanto una discussione astratto. Non sono il difensore di Carlo
Ruta, ma la cosa potrebbe essere *arte da mettere da parte*, magari anche
per Il Minottino.
Un saluto.
Daniele Minotti
daniele@xxxxxxxxxxx
[ Home | Liste | F.A.Q. |
Risorse | Cerca... ]
www.sikurezza.org - Italian Security Mailing List
(c) 1999-2005