1. Wyniki
- Z zebranych adresów URL udało się pobrać i przeanalizować 16 857 835 plików PDF
- Łączny rozmiar pobranych plików wyniósł 23 143 gigabajty
Z zebranych metadanych powstały, w formie wykresów, następujące raporty:
- Liczba wygenerowanych plików PDF według producenta oprogramowania
- Liczba wygenerowanych plików PDF według twórcy oprogramowania(programu generującego)
- Liczba dokumentów z podziałem na wersję PDF
- Liczba dokumentów PDF z podziałem na ilość stron
Na wykresach uwzględniono producenta/twórcę dla liczby dokumentów powyżej 50 tysięcy.
Przejdź do wykresów
2. Podsumowanie
Patrząć na liczby łatwo zauważyć stratę blisko 10 milionów plików, w których zawierają się:
- Błędy typu 404(nie znaleziono pliku), 500(Błąd serwera) itp.
- Wielokrotne linki do tych samych plików