Świat
CC-MAIN-2014-10 - URLs
26 250 788
Unikalnych adresów
16 857 835
Pobranych plików
23 143
Rozmiar w gigabajtach

1. Wyniki

  • Z zebranych adresów URL udało się pobrać i przeanalizować 16 857 835 plików PDF
  • Łączny rozmiar pobranych plików wyniósł 23 143 gigabajty

Z zebranych metadanych powstały, w formie wykresów, następujące raporty:

  • Liczba wygenerowanych plików PDF według producenta oprogramowania
  • Liczba wygenerowanych plików PDF według twórcy oprogramowania(programu generującego)
  • Liczba dokumentów z podziałem na wersję PDF
  • Liczba dokumentów PDF z podziałem na ilość stron

Na wykresach uwzględniono producenta/twórcę dla liczby dokumentów powyżej 50 tysięcy.

Przejdź do wykresów

2. Podsumowanie

Patrząć na liczby łatwo zauważyć stratę blisko 10 milionów plików, w których zawierają się:

  • Błędy typu 404(nie znaleziono pliku), 500(Błąd serwera) itp.
  • Wielokrotne linki do tych samych plików