Item archiveteam_archivebot_go_20240304011959_f9c5c7cc

Filename	Size
archiveteam_archivebot_go_20240304011959_f9c5c7cc.cdx.gz	25712073	download
archiveteam_archivebot_go_20240304011959_f9c5c7cc.cdx.idx	28330	download
archiveteam_archivebot_go_20240304011959_f9c5c7cc_files.xml	0	download
archiveteam_archivebot_go_20240304011959_f9c5c7cc_meta.sqlite	90112	download
archiveteam_archivebot_go_20240304011959_f9c5c7cc_meta.xml	830	download
dumps.wikimedia.org-inf-20240229-192025-egwmh-00040.warc.gz	6813993603	download job
dumps.wikimedia.org-inf-20240229-192025-egwmh-00040.warc.os.cdx.gz	6925	download
europepmc.org-inf-20240212-215511-8x1ov-00582.warc.gz	5408407796	download job
europepmc.org-inf-20240212-215511-8x1ov-00582.warc.os.cdx.gz	105220	download
ibew1245.com-inf-20240229-144227-ealhe-00082.warc.gz	5404945923	download job
ibew1245.com-inf-20240229-144227-ealhe-00082.warc.os.cdx.gz	1476431	download
ibew1245.com-inf-20240229-144227-ealhe-00083.warc.gz	5420981649	download job
ibew1245.com-inf-20240229-144227-ealhe-00083.warc.os.cdx.gz	49790	download
nein-uferinitiative.ch-inf-20240303-224007-xph6x-00000.warc.gz	1768564407	download job
nein-uferinitiative.ch-inf-20240303-224007-xph6x-00000.warc.os.cdx.gz	1688956	download
nein-uferinitiative.ch-inf-20240303-224007-xph6x-meta.warc.gz	1180228	download job
nein-uferinitiative.ch-inf-20240303-224007-xph6x-meta.warc.os.cdx.gz	47	download
nein-uferinitiative.ch-inf-20240303-224007-xph6x.json	247	download job
region9a.uaw.org-inf-20240303-032424-cbml2-00002.warc.gz	3572676018	download job
region9a.uaw.org-inf-20240303-032424-cbml2-00002.warc.os.cdx.gz	5014865	download
region9a.uaw.org-inf-20240303-032424-cbml2-meta.warc.gz	20497115	download job
region9a.uaw.org-inf-20240303-032424-cbml2-meta.warc.os.cdx.gz	47	download
region9a.uaw.org-inf-20240303-032424-cbml2.json	249	download job
scholarlycommons.pacific.edu-inf-20240302-135619-dib5w-00039.warc.gz	5419809555	download job
scholarlycommons.pacific.edu-inf-20240302-135619-dib5w-00039.warc.os.cdx.gz	25095	download
teamster988.org-inf-20240303-230550-f5ku6-00000.warc.gz	1342052767	download job
teamster988.org-inf-20240303-230550-f5ku6-00000.warc.os.cdx.gz	1128204	download
teamster988.org-inf-20240303-230550-f5ku6-meta.warc.gz	728325	download job
teamster988.org-inf-20240303-230550-f5ku6-meta.warc.os.cdx.gz	47	download
teamster988.org-inf-20240303-230550-f5ku6.json	248	download job
urls-transfer.archivete.am-cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-remainder-shallow-20240228-163104-y5t9y-00282.warc.gz	6169261173	download job
urls-transfer.archivete.am-cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-remainder-shallow-20240228-163104-y5t9y-00282.warc.os.cdx.gz	634	download
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_12M_to_13M.txt-shallow-20240228-200435-cnep0-00195.warc.gz	3429554089	download job
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_12M_to_13M.txt-shallow-20240228-200435-cnep0-00195.warc.os.cdx.gz	141528	download
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_12M_to_13M.txt-shallow-20240228-200435-cnep0-meta.warc.gz	23203296	download job
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_12M_to_13M.txt-shallow-20240228-200435-cnep0-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_12M_to_13M.txt-shallow-20240228-200435-cnep0-urls.txt	69000000	download
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_12M_to_13M.txt-shallow-20240228-200435-cnep0.json	384	download job
urls-transfer.archivete.am-s3-us-west-1.amazonaws.com_wp.uploads.wamu.org-shallow-20240301-055241-4v5in-00195.warc.gz	5368908146	download job
urls-transfer.archivete.am-s3-us-west-1.amazonaws.com_wp.uploads.wamu.org-shallow-20240301-055241-4v5in-00195.warc.os.cdx.gz	1010774	download
urls-transfer.archivete.am-s3-us-west-1.amazonaws.com_wp.uploads.wamu.org-shallow-20240301-055241-4v5in-00196.warc.gz	5369072425	download job
urls-transfer.archivete.am-s3-us-west-1.amazonaws.com_wp.uploads.wamu.org-shallow-20240301-055241-4v5in-00196.warc.os.cdx.gz	929901	download
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-00929.warc.gz	5488701086	download job
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-00929.warc.os.cdx.gz	11800	download
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-00930.warc.gz	5791710845	download job
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-00930.warc.os.cdx.gz	8922	download
video.ictp.it-inf-20240227-163244-d3zhc-00469.warc.gz	6253287089	download job
video.ictp.it-inf-20240227-163244-d3zhc-00469.warc.os.cdx.gz	1691	download
video.ictp.it-inf-20240227-163244-d3zhc-00470.warc.gz	7815949592	download job
video.ictp.it-inf-20240227-163244-d3zhc-00470.warc.os.cdx.gz	661	download
wamu.org-inf-20240223-023258-9oibf-00280.warc.gz	5368822670	download job
wamu.org-inf-20240223-023258-9oibf-00280.warc.os.cdx.gz	580088	download
wellcomecollection.org-inf-20231009-135258-6qeuc-01755.warc.gz	5368994716	download job
wellcomecollection.org-inf-20231009-135258-6qeuc-01755.warc.os.cdx.gz	1458871	download
www.nationalnursesunited.org-inf-20240302-052744-brjmz-00022.warc.gz	5401495326	download job
www.nationalnursesunited.org-inf-20240302-052744-brjmz-00022.warc.os.cdx.gz	2004986	download
www.propublica.org-inf-20240302-220146-c7twl-aborted-00000.warc.gz	3711712670	download job
www.propublica.org-inf-20240302-220146-c7twl-aborted-00000.warc.os.cdx.gz	3101297	download
www.propublica.org-inf-20240302-220146-c7twl-aborted-wpull.log.gz	2219906	download
www.propublica.org-inf-20240302-220146-c7twl-aborted.json	250	download job
www.providence.org-inf-20240302-222208-cjeag-00000.warc.gz	5368727808	download job
www.providence.org-inf-20240302-222208-cjeag-00000.warc.os.cdx.gz	4704853	download
www.providence.org-inf-20240302-222208-cjeag-00001.warc.gz	5368932297	download job
www.providence.org-inf-20240302-222208-cjeag-00001.warc.os.cdx.gz	3182964	download