Item archiveteam_archivebot_go_20240614103625_e7cf135a

Filename	Size
amerika21.de-inf-20240514-173356-a47gq-00046.warc.gz	5368800867	download job
amerika21.de-inf-20240514-173356-a47gq-00046.warc.os.cdx.gz	1753051	download
archiveteam_archivebot_go_20240614103625_e7cf135a.cdx.gz	37502726	download
archiveteam_archivebot_go_20240614103625_e7cf135a.cdx.idx	38969	download
archiveteam_archivebot_go_20240614103625_e7cf135a_files.xml	0	download
archiveteam_archivebot_go_20240614103625_e7cf135a_meta.sqlite	98304	download
archiveteam_archivebot_go_20240614103625_e7cf135a_meta.xml	881	download
balloon-juice.com-inf-20240410-205032-ee5cy-00575.warc.gz	5368879859	download job
balloon-juice.com-inf-20240410-205032-ee5cy-00575.warc.os.cdx.gz	1188981	download
billing.virmach.com-inf-20240614-102405-1xfp8-00000.warc.gz	30851501	download job
billing.virmach.com-inf-20240614-102405-1xfp8-00000.warc.os.cdx.gz	44172	download
billing.virmach.com-inf-20240614-102405-1xfp8-meta.warc.gz	34818	download job
billing.virmach.com-inf-20240614-102405-1xfp8-meta.warc.os.cdx.gz	47	download
billing.virmach.com-inf-20240614-102405-1xfp8.json	246	download job
climatecontrarian.wordpress.com-inf-20240614-091557-amx6g-00000.warc.gz	5370029739	download job
climatecontrarian.wordpress.com-inf-20240614-091557-amx6g-00000.warc.os.cdx.gz	1184533	download
devblogs.microsoft.com-inf-20240607-082825-30yva-00053.warc.gz	5407162743	download job
devblogs.microsoft.com-inf-20240607-082825-30yva-00053.warc.os.cdx.gz	929070	download
freshcut.gg-inf-20240613-094831-co7se-00007.warc.gz	5368816767	download job
freshcut.gg-inf-20240613-094831-co7se-00007.warc.os.cdx.gz	12135164	download
learn.microsoft.com-inf-20240606-084119-1y7vh-00063.warc.gz	5432646160	download job
learn.microsoft.com-inf-20240606-084119-1y7vh-00063.warc.os.cdx.gz	2985183	download
natwiss.de-inf-20240614-090654-aass6-00000.warc.gz	1524877327	download job
natwiss.de-inf-20240614-090654-aass6-00000.warc.os.cdx.gz	1546173	download
natwiss.de-inf-20240614-090654-aass6-meta.warc.gz	998300	download job
natwiss.de-inf-20240614-090654-aass6-meta.warc.os.cdx.gz	47	download
natwiss.de-inf-20240614-090654-aass6.json	238	download job
nsarchive.gwu.edu-inf-20240612-195949-330mb-00018.warc.gz	5374378002	download job
nsarchive.gwu.edu-inf-20240612-195949-330mb-00018.warc.os.cdx.gz	645823	download
omaintti.fi-inf-20240614-095512-29ioo-00000.warc.gz	31563138	download job
omaintti.fi-inf-20240614-095512-29ioo-00000.warc.os.cdx.gz	134635	download
omaintti.fi-inf-20240614-095512-29ioo-meta.warc.gz	134587	download job
omaintti.fi-inf-20240614-095512-29ioo-meta.warc.os.cdx.gz	47	download
omaintti.fi-inf-20240614-095512-29ioo.json	244	download job
opensustain.tech-inf-20240614-054436-5o2q3-00001.warc.gz	9624822122	download job
opensustain.tech-inf-20240614-054436-5o2q3-00001.warc.os.cdx.gz	100556	download
pixeldrain.com-shallow-20240614-102829-4toft-00000.warc.gz	1087818	download job
pixeldrain.com-shallow-20240614-102829-4toft-00000.warc.os.cdx.gz	1152	download
pixeldrain.com-shallow-20240614-102829-4toft-meta.warc.gz	4024	download job
pixeldrain.com-shallow-20240614-102829-4toft-meta.warc.os.cdx.gz	47	download
pixeldrain.com-shallow-20240614-102829-4toft.json	255	download job
pixeldrain.com-shallow-20240614-102830-6du3g-00000.warc.gz	29875	download job
pixeldrain.com-shallow-20240614-102830-6du3g-00000.warc.os.cdx.gz	244	download
pixeldrain.com-shallow-20240614-102830-6du3g-meta.warc.gz	3483	download job
pixeldrain.com-shallow-20240614-102830-6du3g-meta.warc.os.cdx.gz	47	download
pixeldrain.com-shallow-20240614-102830-6du3g.json	271	download job
pleu.megabus.com-inf-20240614-021114-csxxu-00001.warc.gz	3121917895	download job
pleu.megabus.com-inf-20240614-021114-csxxu-00001.warc.os.cdx.gz	3376601	download
pleu.megabus.com-inf-20240614-021114-csxxu-meta.warc.gz	3900875	download job
pleu.megabus.com-inf-20240614-021114-csxxu-meta.warc.os.cdx.gz	47	download
pleu.megabus.com-inf-20240614-021114-csxxu.json	246	download job
politikstube.com-inf-20240611-194835-3l43u-00013.warc.gz	5369116428	download job
politikstube.com-inf-20240611-194835-3l43u-00013.warc.os.cdx.gz	336891	download
setsideb.com-inf-20240614-054031-cojdx-00002.warc.gz	5463437052	download job
setsideb.com-inf-20240614-054031-cojdx-00002.warc.os.cdx.gz	771105	download
uk.megabus.com-inf-20240614-003252-alfxw-00000.warc.gz	5369355702	download job
uk.megabus.com-inf-20240614-003252-alfxw-00000.warc.os.cdx.gz	1938839	download
urls-transfer.archivete.am-collections.library.uarts.edu_asset_urls.txt-shallow-20240614-000532-dpj4z-00005.warc.gz	5429153767	download job
urls-transfer.archivete.am-collections.library.uarts.edu_asset_urls.txt-shallow-20240614-000532-dpj4z-00005.warc.os.cdx.gz	43793	download
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_21.txt-shallow-20240614-072812-7ac59-00002.warc.gz	5368788746	download job
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_21.txt-shallow-20240614-072812-7ac59-00002.warc.os.cdx.gz	383637	download
www.frontiersin.org-inf-20240117-203250-6tu94-00817.warc.gz	5368991768	download job
www.frontiersin.org-inf-20240117-203250-6tu94-00817.warc.os.cdx.gz	3444272	download
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00826.warc.gz	5396757723	download job
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00826.warc.os.cdx.gz	1127799	download
www.pro-medienmagazin.de-inf-20240611-092130-1k0bl-00031.warc.gz	5739140135	download job
www.pro-medienmagazin.de-inf-20240611-092130-1k0bl-00031.warc.os.cdx.gz	418986	download
www.sheetmusicplus.com-inf-20240512-212156-pg1ia-00534.warc.gz	5380817076	download job
www.sheetmusicplus.com-inf-20240512-212156-pg1ia-00534.warc.os.cdx.gz	1572054	download
www.shipspotting.com-inf-20240524-101759-c69jq-00068.warc.gz	5368995868	download job
www.shipspotting.com-inf-20240524-101759-c69jq-00068.warc.os.cdx.gz	1028207	download
www.thebureauinvestigates.com-inf-20240613-171503-8v7l8-00006.warc.gz	5368748237	download job
www.thebureauinvestigates.com-inf-20240613-171503-8v7l8-00006.warc.os.cdx.gz	1585933	download