Item archiveteam_archivebot_go_20240413013143_fc548808

Filename	Size
archiveteam_archivebot_go_20240413013143_fc548808.cdx.gz	4862	download
archiveteam_archivebot_go_20240413013143_fc548808.cdx.idx	65	download
archiveteam_archivebot_go_20240413013143_fc548808_files.xml	0	download
archiveteam_archivebot_go_20240413013143_fc548808_meta.sqlite	28672	download
archiveteam_archivebot_go_20240413013143_fc548808_meta.xml	1043	download
ascii.textfiles.com-shallow-20240413-012618-7lkw8-00000.warc.gz	1350712	download job
ascii.textfiles.com-shallow-20240413-012618-7lkw8-00000.warc.os.cdx.gz	4949	download
ascii.textfiles.com-shallow-20240413-012618-7lkw8-meta.warc.gz	6542	download job
ascii.textfiles.com-shallow-20240413-012618-7lkw8-meta.warc.os.cdx.gz	47	download
ascii.textfiles.com-shallow-20240413-012618-7lkw8.json	267	download job
dev.to-inf-20231201-195421-13t0y-00505.warc.gz	5371469800	download job
dev.to-inf-20231201-195421-13t0y-00505.warc.os.cdx.gz	4621093	download
fivethirtyeight.com-inf-20240408-172625-aggl8-00105.warc.gz	5370938731	download job
fivethirtyeight.com-inf-20240408-172625-aggl8-00105.warc.os.cdx.gz	188577	download
freedomcommons.com-inf-20240413-002513-2eivu-00000.warc.gz	1135544891	download job
freedomcommons.com-inf-20240413-002513-2eivu-00000.warc.os.cdx.gz	1660573	download
freedomcommons.com-inf-20240413-002513-2eivu-meta.warc.gz	955843	download job
freedomcommons.com-inf-20240413-002513-2eivu-meta.warc.os.cdx.gz	47	download
freedomcommons.com-inf-20240413-002513-2eivu.json	243	download job
get.pixelexperience.org-inf-20240411-224620-1qod0-00149.warc.gz	5440109295	download job
get.pixelexperience.org-inf-20240411-224620-1qod0-00149.warc.os.cdx.gz	741	download
get.pixelexperience.org-inf-20240411-224620-1qod0-00150.warc.gz	5447795617	download job
get.pixelexperience.org-inf-20240411-224620-1qod0-00150.warc.os.cdx.gz	768	download
get.pixelexperience.org-inf-20240411-224620-1qod0-00151.warc.gz	5529494622	download job
get.pixelexperience.org-inf-20240411-224620-1qod0-00151.warc.os.cdx.gz	774	download
igs.bkg.bund.de-inf-20240410-162007-1378y-00068.warc.gz	5369037847	download job
igs.bkg.bund.de-inf-20240410-162007-1378y-00068.warc.os.cdx.gz	1147563	download
jsvp-thurgau.ch-inf-20240413-001748-abtuu-00000.warc.gz	619478220	download job
jsvp-thurgau.ch-inf-20240413-001748-abtuu-00000.warc.os.cdx.gz	674822	download
jsvp-thurgau.ch-inf-20240413-001748-abtuu-meta.warc.gz	433920	download job
jsvp-thurgau.ch-inf-20240413-001748-abtuu-meta.warc.os.cdx.gz	47	download
jsvp-thurgau.ch-inf-20240413-001748-abtuu.json	240	download job
judc.ch-inf-20240412-235832-bbyob-00000.warc.gz	657265487	download job
judc.ch-inf-20240412-235832-bbyob-00000.warc.os.cdx.gz	799955	download
judc.ch-inf-20240412-235832-bbyob-meta.warc.gz	519157	download job
judc.ch-inf-20240412-235832-bbyob-meta.warc.os.cdx.gz	47	download
judc.ch-inf-20240412-235832-bbyob.json	232	download job
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00487.warc.gz	5550273886	download job
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00487.warc.os.cdx.gz	3389	download
russian-records.com-inf-20240403-051621-8a3r3-00082.warc.gz	5369125845	download job
russian-records.com-inf-20240403-051621-8a3r3-00082.warc.os.cdx.gz	1449491	download
scholarworks.umt.edu-inf-20240409-050039-2ekzj-00081.warc.gz	6088323285	download job
scholarworks.umt.edu-inf-20240409-050039-2ekzj-00081.warc.os.cdx.gz	95392	download
staging.truthout.org-inf-20240408-170925-2tvgv-00095.warc.gz	5610672363	download job
staging.truthout.org-inf-20240408-170925-2tvgv-00095.warc.os.cdx.gz	609581	download
stopwoke.ch-inf-20240413-003918-20kcn-00000.warc.gz	1030001359	download job
stopwoke.ch-inf-20240413-003918-20kcn-00000.warc.os.cdx.gz	537593	download
stopwoke.ch-inf-20240413-003918-20kcn-meta.warc.gz	336264	download job
stopwoke.ch-inf-20240413-003918-20kcn-meta.warc.os.cdx.gz	47	download
stopwoke.ch-inf-20240413-003918-20kcn.json	243	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-04099.warc.gz	5409314272	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-04099.warc.os.cdx.gz	561	download
urls-storage.scenariopla.net-parabolicarc.com-inf-20240111-053007-btu11-wordpress+drupal+google+wix.txt-shallow-20240410-075302-cll3y-00006.warc.gz	11023846417	download
urls-storage.scenariopla.net-parabolicarc.com-inf-20240111-053007-btu11-wordpress+drupal+google+wix.txt-shallow-20240410-075302-cll3y-00006.warc.os.cdx.gz	888	download
urls-storage.scenariopla.net-parabolicarc.com-inf-20240111-053007-btu11-wordpress+drupal+google+wix.txt-shallow-20240410-075302-cll3y-00007.warc.gz	7487643150	download
urls-storage.scenariopla.net-parabolicarc.com-inf-20240111-053007-btu11-wordpress+drupal+google+wix.txt-shallow-20240410-075302-cll3y-00007.warc.os.cdx.gz	1476	download
urls-transfer.archivete.am-s3.amazonaws.com_ncaa_urls_other_than_access_log.txt-shallow-20240412-215728-2e3a3-00003.warc.gz	5372223941	download job
urls-transfer.archivete.am-s3.amazonaws.com_ncaa_urls_other_than_access_log.txt-shallow-20240412-215728-2e3a3-00003.warc.os.cdx.gz	976103	download
www-pre.newshub.co.nz-inf-20240412-031136-cowse-00017.warc.gz	5714401866	download job
www-pre.newshub.co.nz-inf-20240412-031136-cowse-00017.warc.os.cdx.gz	2552241	download
www.polskieradio.pl-inf-20231221-075717-djrf2-01353.warc.gz	5436550560	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01353.warc.os.cdx.gz	9924	download
www.the-pixels.com-inf-20240412-212959-5ds8s-00003.warc.gz	5368957099	download job
www.the-pixels.com-inf-20240412-212959-5ds8s-00003.warc.os.cdx.gz	1491068	download
www.visittheusa.com.au-inf-20240409-054246-1ax54-00026.warc.gz	5369923563	download job
www.visittheusa.com.au-inf-20240409-054246-1ax54-00026.warc.os.cdx.gz	2190271	download