Item archiveteam_archivebot_go_20240502230110_1ba7bb7d

Filename	Size
adrians.htmlplanet.com-inf-20240502-221714-evgf0-00000.warc.gz	93513898	download job
adrians.htmlplanet.com-inf-20240502-221714-evgf0-00000.warc.os.cdx.gz	232240	download
adrians.htmlplanet.com-inf-20240502-221714-evgf0-meta.warc.gz	149046	download job
adrians.htmlplanet.com-inf-20240502-221714-evgf0-meta.warc.os.cdx.gz	47	download
adrians.htmlplanet.com-inf-20240502-221714-evgf0.json	246	download job
ajpi.htmlplanet.com-inf-20240502-222515-4u9q4-00000.warc.gz	179322512	download job
ajpi.htmlplanet.com-inf-20240502-222515-4u9q4-00000.warc.os.cdx.gz	193756	download
ajpi.htmlplanet.com-inf-20240502-222515-4u9q4-meta.warc.gz	125491	download job
ajpi.htmlplanet.com-inf-20240502-222515-4u9q4-meta.warc.os.cdx.gz	47	download
ajpi.htmlplanet.com-inf-20240502-222515-4u9q4.json	243	download job
alaskaklezmer.htmlplanet.com-inf-20240502-224732-6z492-meta.warc.gz	14394	download job
alaskaklezmer.htmlplanet.com-inf-20240502-224732-6z492-meta.warc.os.cdx.gz	47	download
alaskaklezmer.htmlplanet.com-inf-20240502-224732-6z492.json	252	download job
archiveteam_archivebot_go_20240502230110_1ba7bb7d.cdx.gz	381230	download
archiveteam_archivebot_go_20240502230110_1ba7bb7d.cdx.idx	370	download
archiveteam_archivebot_go_20240502230110_1ba7bb7d_files.xml	0	download
archiveteam_archivebot_go_20240502230110_1ba7bb7d_meta.sqlite	135168	download
archiveteam_archivebot_go_20240502230110_1ba7bb7d_meta.xml	1045	download
balloon-juice.com-inf-20240410-205032-ee5cy-00140.warc.gz	6527427723	download job
balloon-juice.com-inf-20240410-205032-ee5cy-00140.warc.os.cdx.gz	947823	download
blogs.sas.com-inf-20240428-005620-a61gf-00033.warc.gz	5368779924	download job
blogs.sas.com-inf-20240428-005620-a61gf-00033.warc.os.cdx.gz	7179370	download
cargain.rategain.com-inf-20240502-221005-6axfi-00000.warc.gz	19201313	download job
cargain.rategain.com-inf-20240502-221005-6axfi-00000.warc.os.cdx.gz	61610	download
cargain.rategain.com-inf-20240502-221005-6axfi-meta.warc.gz	42703	download job
cargain.rategain.com-inf-20240502-221005-6axfi-meta.warc.os.cdx.gz	47	download
cargain.rategain.com-inf-20240502-221005-6axfi.json	251	download job
met.refeds.org-inf-20240428-205922-cubnc-00008.warc.gz	5368719283	download job
met.refeds.org-inf-20240428-205922-cubnc-00008.warc.os.cdx.gz	2359403	download
richardgage911.org-inf-20240502-180028-d2cig-00008.warc.gz	5857024818	download job
richardgage911.org-inf-20240502-180028-d2cig-00008.warc.os.cdx.gz	39577	download
richardgage911.org-inf-20240502-180028-d2cig-00009.warc.gz	5828798651	download job
richardgage911.org-inf-20240502-180028-d2cig-00009.warc.os.cdx.gz	65501	download
starcitizen.tools-inf-20240501-090014-a0eds-00016.warc.gz	5368709161	download job
starcitizen.tools-inf-20240501-090014-a0eds-00016.warc.os.cdx.gz	10848614	download
storage.googleapis.com-inf-20240301-202801-5jgg7-06580.warc.gz	6018019161	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06580.warc.os.cdx.gz	999	download
storage.googleapis.com-inf-20240301-202801-5jgg7-06581.warc.gz	5581244205	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06581.warc.os.cdx.gz	940	download
storage.googleapis.com-inf-20240301-202801-5jgg7-06582.warc.gz	5575459862	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06582.warc.os.cdx.gz	950	download
truthactionproject.org-inf-20240502-200647-aeuav-00002.warc.gz	5906388123	download job
truthactionproject.org-inf-20240502-200647-aeuav-00002.warc.os.cdx.gz	429306	download
truthout.org-inf-20240408-165731-16a89-00324.warc.gz	5369659286	download job
truthout.org-inf-20240408-165731-16a89-00324.warc.os.cdx.gz	723217	download
urls-transfer.archivete.am-cfr-acms-01.acms.us1.pr.anuvu.cloud_and_asset-acms.anuvu.cloud_first_1k_urls.txt-shallow-20240502-221928-4az9v-00000.warc.gz	2767405080	download job
urls-transfer.archivete.am-cfr-acms-01.acms.us1.pr.anuvu.cloud_and_asset-acms.anuvu.cloud_first_1k_urls.txt-shallow-20240502-221928-4az9v-00000.warc.os.cdx.gz	105967	download
urls-transfer.archivete.am-cfr-acms-01.acms.us1.pr.anuvu.cloud_and_asset-acms.anuvu.cloud_first_1k_urls.txt-shallow-20240502-221928-4az9v-meta.warc.gz	52882	download job
urls-transfer.archivete.am-cfr-acms-01.acms.us1.pr.anuvu.cloud_and_asset-acms.anuvu.cloud_first_1k_urls.txt-shallow-20240502-221928-4az9v-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-cfr-acms-01.acms.us1.pr.anuvu.cloud_and_asset-acms.anuvu.cloud_first_1k_urls.txt-shallow-20240502-221928-4az9v-urls.txt	327917	download
urls-transfer.archivete.am-cfr-acms-01.acms.us1.pr.anuvu.cloud_and_asset-acms.anuvu.cloud_first_1k_urls.txt-shallow-20240502-221928-4az9v.json	458	download job
urls-transfer.archivete.am-igp06.gameloft.com_gl-ads06-gold.s3.amazonaws.com_subdomain_discovery.txt-shallow-20240502-222448-1982x-00000.warc.gz	228856	download job
urls-transfer.archivete.am-igp06.gameloft.com_gl-ads06-gold.s3.amazonaws.com_subdomain_discovery.txt-shallow-20240502-222448-1982x-00000.warc.os.cdx.gz	4440	download
urls-transfer.archivete.am-igp06.gameloft.com_gl-ads06-gold.s3.amazonaws.com_subdomain_discovery.txt-shallow-20240502-222448-1982x-urls.txt	6998	download
urls-transfer.archivete.am-igp06.gameloft.com_gl-ads06-gold.s3.amazonaws.com_subdomain_discovery.txt-shallow-20240502-222448-1982x.json	442	download job
urls-transfer.archivete.am-workshop.abcvg.info_seed_urls.txt-inf-20240425-164117-br34y-00443.warc.gz	5515538622	download job
urls-transfer.archivete.am-workshop.abcvg.info_seed_urls.txt-inf-20240425-164117-br34y-00443.warc.os.cdx.gz	3978	download
urls-transfer.archivete.am-x19.update.netease.com_g79.update.netease.com_minecraft_launchers.txt-shallow-20240502-182716-e82xl-00006.warc.gz	5377740787	download job
urls-transfer.archivete.am-x19.update.netease.com_g79.update.netease.com_minecraft_launchers.txt-shallow-20240502-182716-e82xl-00006.warc.os.cdx.gz	4826	download
urls-transfer.archivete.am-x19.update.netease.com_g79.update.netease.com_minecraft_launchers.txt-shallow-20240502-182716-e82xl-00007.warc.gz	28401029	download job
urls-transfer.archivete.am-x19.update.netease.com_g79.update.netease.com_minecraft_launchers.txt-shallow-20240502-182716-e82xl-00007.warc.os.cdx.gz	312	download
urls-transfer.archivete.am-x19.update.netease.com_g79.update.netease.com_minecraft_launchers.txt-shallow-20240502-182716-e82xl-meta.warc.gz	20896	download job
urls-transfer.archivete.am-x19.update.netease.com_g79.update.netease.com_minecraft_launchers.txt-shallow-20240502-182716-e82xl-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-x19.update.netease.com_g79.update.netease.com_minecraft_launchers.txt-shallow-20240502-182716-e82xl-urls.txt	38064	download
urls-transfer.archivete.am-x19.update.netease.com_g79.update.netease.com_minecraft_launchers.txt-shallow-20240502-182716-e82xl.json	434	download job
whoistheoriginalman.tumblr.com-inf-20240502-082329-czo86-00013.warc.gz	5369766146	download job
whoistheoriginalman.tumblr.com-inf-20240502-082329-czo86-00013.warc.os.cdx.gz	3386290	download
wissenschaft3000.wordpress.com-inf-20240430-203453-33pk9-00050.warc.gz	5435481555	download job
wissenschaft3000.wordpress.com-inf-20240430-203453-33pk9-00050.warc.os.cdx.gz	687684	download
www-qa.tetrapak.com-inf-20240502-063534-d3na7-00008.warc.gz	2533217171	download job
www-qa.tetrapak.com-inf-20240502-063534-d3na7-00008.warc.os.cdx.gz	84002	download
www-qa.tetrapak.com-inf-20240502-063534-d3na7-meta.warc.gz	8779919	download job
www-qa.tetrapak.com-inf-20240502-063534-d3na7-meta.warc.os.cdx.gz	47	download
www-qa.tetrapak.com-inf-20240502-063534-d3na7.json	250	download job
www-stage.tetrapak.com-inf-20240502-062816-90tmt-00009.warc.gz	5564668117	download job
www-stage.tetrapak.com-inf-20240502-062816-90tmt-00009.warc.os.cdx.gz	1030723	download
www.freemaptools.com-inf-20240502-224434-5r8kr-00000.warc.gz	32385	download job
www.freemaptools.com-inf-20240502-224434-5r8kr-00000.warc.os.cdx.gz	429	download
www.freemaptools.com-inf-20240502-224434-5r8kr-meta.warc.gz	3562	download job
www.freemaptools.com-inf-20240502-224434-5r8kr-meta.warc.os.cdx.gz	47	download
www.freemaptools.com-inf-20240502-224434-5r8kr.json	247	download job
www.motleycollegefootball.com-inf-20240502-192208-96wib-00000.warc.gz	5369046688	download job
www.motleycollegefootball.com-inf-20240502-192208-96wib-00000.warc.os.cdx.gz	2988027	download
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00468.warc.gz	5395934279	download job
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00468.warc.os.cdx.gz	872407	download
www.tetrapak.com-inf-20240502-040224-l4ba4-00012.warc.gz	5440768778	download job
www.tetrapak.com-inf-20240502-040224-l4ba4-00012.warc.os.cdx.gz	2425496	download