Item archiveteam_archivebot_go_20240601053308_2a2ccb77

Filename	Size
7rdj.com-inf-20240527-195302-f1gwl-00016.warc.gz	5382743819	download job
7rdj.com-inf-20240527-195302-f1gwl-00016.warc.os.cdx.gz	75197	download
api.inagrm.com-inf-20240601-051943-fz0xx-00000.warc.gz	2463	download job
api.inagrm.com-inf-20240601-051943-fz0xx-00000.warc.os.cdx.gz	47	download
api.inagrm.com-inf-20240601-051943-fz0xx-meta.warc.gz	3665	download job
api.inagrm.com-inf-20240601-051943-fz0xx-meta.warc.os.cdx.gz	47	download
api.inagrm.com-inf-20240601-051943-fz0xx.json	245	download job
archiveteam_archivebot_go_20240601053308_2a2ccb77.cdx.gz	73865	download
archiveteam_archivebot_go_20240601053308_2a2ccb77.cdx.idx	66	download
archiveteam_archivebot_go_20240601053308_2a2ccb77_files.xml	0	download
archiveteam_archivebot_go_20240601053308_2a2ccb77_meta.sqlite	114688	download
archiveteam_archivebot_go_20240601053308_2a2ccb77_meta.xml	1045	download
catalog-legacy.osaarchivum.org-inf-20240519-093136-3c0u6-00215.warc.gz	5469213581	download job
catalog-legacy.osaarchivum.org-inf-20240519-093136-3c0u6-00215.warc.os.cdx.gz	431523	download
displate.com-inf-20240417-101313-as2hg-00200.warc.gz	5368718508	download job
displate.com-inf-20240417-101313-as2hg-00200.warc.os.cdx.gz	17456402	download
dspace.nplg.gov.ge-inf-20240518-160308-crlmb-00628.warc.gz	5465855429	download job
dspace.nplg.gov.ge-inf-20240518-160308-crlmb-00628.warc.os.cdx.gz	185461	download
dspace.nplg.gov.ge-inf-20240518-160308-crlmb-00629.warc.gz	5453116409	download job
dspace.nplg.gov.ge-inf-20240518-160308-crlmb-00629.warc.os.cdx.gz	143722	download
edutheque.inagrm.com-inf-20240601-052007-4467d-00000.warc.gz	1338216	download job
edutheque.inagrm.com-inf-20240601-052007-4467d-00000.warc.os.cdx.gz	3472	download
edutheque.inagrm.com-inf-20240601-052007-4467d-meta.warc.gz	5212	download job
edutheque.inagrm.com-inf-20240601-052007-4467d-meta.warc.os.cdx.gz	47	download
edutheque.inagrm.com-inf-20240601-052007-4467d.json	251	download job
forum.blockland.us-inf-20240512-042906-dss6w-00142.warc.gz	5392515023	download job
forum.blockland.us-inf-20240512-042906-dss6w-00142.warc.os.cdx.gz	4827068	download
gar.edutheque.inagrm.com-inf-20240601-052011-9q4ss-00000.warc.gz	23821	download job
gar.edutheque.inagrm.com-inf-20240601-052011-9q4ss-00000.warc.os.cdx.gz	472	download
gar.edutheque.inagrm.com-inf-20240601-052011-9q4ss-meta.warc.gz	3724	download job
gar.edutheque.inagrm.com-inf-20240601-052011-9q4ss-meta.warc.os.cdx.gz	47	download
gar.edutheque.inagrm.com-inf-20240601-052011-9q4ss.json	255	download job
inagrm.com-inf-20240601-051750-6b66b-00000.warc.gz	108319931	download job
inagrm.com-inf-20240601-051750-6b66b-00000.warc.os.cdx.gz	89044	download
inagrm.com-inf-20240601-051750-6b66b-meta.warc.gz	59897	download job
inagrm.com-inf-20240601-051750-6b66b-meta.warc.os.cdx.gz	47	download
inagrm.com-inf-20240601-051750-6b66b.json	241	download job
kleinmanenergy.upenn.edu-inf-20240529-015905-1vblp-00095.warc.gz	5553911679	download job
kleinmanenergy.upenn.edu-inf-20240529-015905-1vblp-00095.warc.os.cdx.gz	48453	download
kleinmanenergy.upenn.edu-inf-20240529-015905-1vblp-00096.warc.gz	5407714558	download job
kleinmanenergy.upenn.edu-inf-20240529-015905-1vblp-00096.warc.os.cdx.gz	22540	download
m.dj97.com-inf-20240510-160546-vomba-00196.warc.gz	5401435040	download job
m.dj97.com-inf-20240510-160546-vomba-00196.warc.os.cdx.gz	37895	download
opposition24.com-inf-20240530-142305-cxivf-00027.warc.gz	5468265721	download job
opposition24.com-inf-20240530-142305-cxivf-00027.warc.os.cdx.gz	702180	download
tigerprints.clemson.edu-inf-20240531-031631-4eucb-00039.warc.gz	5369004915	download job
tigerprints.clemson.edu-inf-20240531-031631-4eucb-00039.warc.os.cdx.gz	132130	download
urls-transfer.archivete.am-2024-05-29_www.72dj.com-preview-media-part2.txt-shallow-20240531-185053-8480s-00026.warc.gz	5371271028	download job
urls-transfer.archivete.am-2024-05-29_www.72dj.com-preview-media-part2.txt-shallow-20240531-185053-8480s-00026.warc.os.cdx.gz	13543	download
urls-transfer.archivete.am-2024-05-29_www.72dj.com-preview-media-part2.txt-shallow-20240531-185053-8480s-00027.warc.gz	5371519033	download job
urls-transfer.archivete.am-2024-05-29_www.72dj.com-preview-media-part2.txt-shallow-20240531-185053-8480s-00027.warc.os.cdx.gz	17284	download
urls-transfer.archivete.am-2024-05-31_repo.mongodb.org.txt-shallow-20240531-221208-cinrn-00029.warc.gz	5383695690	download job
urls-transfer.archivete.am-2024-05-31_repo.mongodb.org.txt-shallow-20240531-221208-cinrn-00029.warc.os.cdx.gz	23645	download
urls-transfer.archivete.am-2024-05-31_repo.mongodb.org.txt-shallow-20240531-221208-cinrn-00030.warc.gz	5385603303	download job
urls-transfer.archivete.am-2024-05-31_repo.mongodb.org.txt-shallow-20240531-221208-cinrn-00030.warc.os.cdx.gz	38769	download
urls-transfer.archivete.am-webmedia.inagrm.com_seed_urls.txt-inf-20240601-053146-673da-00000.warc.gz	2559	download job
urls-transfer.archivete.am-webmedia.inagrm.com_seed_urls.txt-inf-20240601-053146-673da-00000.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-webmedia.inagrm.com_seed_urls.txt-inf-20240601-053146-673da-meta.warc.gz	8381	download job
urls-transfer.archivete.am-webmedia.inagrm.com_seed_urls.txt-inf-20240601-053146-673da-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-webmedia.inagrm.com_seed_urls.txt-inf-20240601-053146-673da-urls.txt	5628	download
urls-transfer.archivete.am-webmedia.inagrm.com_seed_urls.txt-inf-20240601-053146-673da.json	358	download job
valvetime.co.uk-inf-20240601-052655-6uw17-00000.warc.gz	6966788	download job
valvetime.co.uk-inf-20240601-052655-6uw17-00000.warc.os.cdx.gz	13468	download
valvetime.co.uk-inf-20240601-052655-6uw17-meta.warc.gz	12082	download job
valvetime.co.uk-inf-20240601-052655-6uw17-meta.warc.os.cdx.gz	47	download
valvetime.co.uk-inf-20240601-052655-6uw17.json	246	download job
webmedia.inagrm.com-inf-20240601-052717-e1sm1-00000.warc.gz	2473	download job
webmedia.inagrm.com-inf-20240601-052717-e1sm1-00000.warc.os.cdx.gz	47	download
webmedia.inagrm.com-inf-20240601-052717-e1sm1-meta.warc.gz	3685	download job
webmedia.inagrm.com-inf-20240601-052717-e1sm1-meta.warc.os.cdx.gz	47	download
webmedia.inagrm.com-inf-20240601-052717-e1sm1.json	250	download job
whyevolutionistrue.com-inf-20240506-024418-f32hi-00276.warc.gz	5395972244	download job
whyevolutionistrue.com-inf-20240506-024418-f32hi-00276.warc.os.cdx.gz	2456117	download
www.euractiv.de-inf-20240528-163505-5n4gy-00010.warc.gz	5444994131	download job
www.euractiv.de-inf-20240528-163505-5n4gy-00010.warc.os.cdx.gz	6825715	download
www.fon.hum.uva.nl-inf-20240530-213126-605ju-00062.warc.gz	5369174721	download job
www.fon.hum.uva.nl-inf-20240530-213126-605ju-00062.warc.os.cdx.gz	2508665	download
www.gilonthehill.com-inf-20240601-035132-6oiz4-00000.warc.gz	5390772898	download job
www.gilonthehill.com-inf-20240601-035132-6oiz4-00000.warc.os.cdx.gz	3344470	download
www.inagrm.com-inf-20240601-051736-79156-00000.warc.gz	2466	download job
www.inagrm.com-inf-20240601-051736-79156-00000.warc.os.cdx.gz	47	download
www.inagrm.com-inf-20240601-051736-79156-meta.warc.gz	3663	download job
www.inagrm.com-inf-20240601-051736-79156-meta.warc.os.cdx.gz	47	download
www.inagrm.com-inf-20240601-051736-79156.json	245	download job
www.synthtopia.com-inf-20240529-083450-bwrz0-00025.warc.gz	5418304934	download job
www.synthtopia.com-inf-20240529-083450-bwrz0-00025.warc.os.cdx.gz	2462483	download