[ Home | Liste | F.A.Q. | Risorse | Cerca... ]


[ Data: precedente | successivo | indice ] [ Argomento: precedente | successivo | indice ]


Archivio: forensics@sikurezza.org
Soggetto: [forensics] WebArchive (WayBack Machine)
Mittente: Daniele Minotti
Data: Sat, 20 Sep 2008 15:22:54 +0200 (CEST)
Spero di non essere OT.
Tutti conosciamo la WayBack Machine di WebArchive.
Mi e' capitato - e penso anche a voi - di utilizzare/veder utilizzati i relativi servizi per *provare* l'esistenza (e il relativo contenuto) di determinate pagine in un dato periodo. Un po' come la cache di Google, ma con una *memoria* decisamente piu' ampia.
Al di la' della mia convenienza quando l'ho usata, non sono convintissimo della piena affidabilita'. Anche leggendo termini e condizioni del servizio
http://www.archive.org/about/terms.php
Al di la' di cio' (ma penso sia gradita ogni opinione sul punto), il mio interesse, oggi, e' piu' astratto che concreto.
Mi riferisco ad un caso di cui avrete sentito parlare: la condanna dello storico Carlo Ruta per stampa clandestina
http://www.minotti.net/2008/08/31/carlo-ruta-i-motivi-della-sentenza/ (perdonate l'autopromozione)
Uno tra i nodi critici (comunque, per me, non decisivo) riguardava la *periodicita' regolare* delle pubblicazioni.
La PG ha fatto le sue verifiche. A questo link trovate trascrizione di alcuni atti del procedimento
http://www.giornalismi.info/vocilibere/articoli/art_1092.html
in particolare una relazione di servizio dove si riportano i risultati dell'utilizzo della WayBack Machine
Ora, a parte il fatto che, secondo me, quella lista di *aggiornamenti* non prova la periodicita' regolare (ove prova neccessaria a fini giuridici), il punto e' il seguente:
atteso che Webarchive opera, fondamentalmente, con un crawler memorizzando, poi, le revisioni di un certo URL, che voi sappiate i risultati come quelli della relazione menzionata sono esclusivamente quelli che registrano un qualche cmabiamento rispetto all'*aggiornamento* precedente oppure sono soltanto quelli prelevati dopo la visita, periodica, del crawler? Io penso di no (ho fatto la verifica con siti da me gestiti).
Eppoi, conoscete la frequenza di crawling?
La risposte parrebbero essere qui
http://www.archive.org/about/faqs.php
What does it mean when a site's archive data has been "updated"?


When our automated systems crawl the web every few months or so, we find that only about 50% of all pages on the web have changed from our previous visit. This means that much of the content in our archive is duplicate material. If you don't see ""*"" next to an archived document, then the content on the archived page is identical to the previously archived copy.

Mi sembra che queste risposte possano intervenire sul giudizio di affidabilita' di questo mezzo di prova che, alla fine, direi negativo o, comuqnue, non completamente positivo (dipende dalla prova che si vuole ottenere).
Ripeto: soltanto una discussione astratto. Non sono il difensore di Carlo Ruta, ma la cosa potrebbe essere *arte da mettere da parte*, magari anche per Il Minottino.
Un saluto.
Daniele Minotti
daniele@xxxxxxxxxxx






[ Home | Liste | F.A.Q. | Risorse | Cerca... ]

www.sikurezza.org - Italian Security Mailing List
(c) 1999-2005