Item archiveteam_archivebot_go_20250412014643_5e30652a

Filename	Size
0x0.st-shallow-20250412-014527-d84ko-00000.warc.gz	181372	download job
0x0.st-shallow-20250412-014527-d84ko-00000.warc.os.cdx.gz	214	download
0x0.st-shallow-20250412-014527-d84ko-meta.warc.gz	3354	download job
0x0.st-shallow-20250412-014527-d84ko-meta.warc.os.cdx.gz	47	download
0x0.st-shallow-20250412-014527-d84ko.json	246	download job
archiveteam_archivebot_go_20250412014643_5e30652a.cdx.gz	12857163	download
archiveteam_archivebot_go_20250412014643_5e30652a.cdx.idx	14122	download
archiveteam_archivebot_go_20250412014643_5e30652a_files.xml	0	download
archiveteam_archivebot_go_20250412014643_5e30652a_meta.sqlite	57344	download
archiveteam_archivebot_go_20250412014643_5e30652a_meta.xml	1047	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-06496.warc.gz	5739995454	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06496.warc.os.cdx.gz	1795	download
data-products.cmu.hubmapconsortium.org-inf-20250411-141858-7rm1x-00003.warc.gz	14474497253	download job
data-products.cmu.hubmapconsortium.org-inf-20250411-141858-7rm1x-00003.warc.os.cdx.gz	301	download
flibusta.is-inf-20240924-060021-7gpwv-01252.warc.gz	5369235455	download job
flibusta.is-inf-20240924-060021-7gpwv-01252.warc.os.cdx.gz	4007412	download
mirror.reenigne.net-inf-20250411-232553-2jmc9-00017.warc.gz	6596387017	download job
mirror.reenigne.net-inf-20250411-232553-2jmc9-00017.warc.os.cdx.gz	3023	download
news.umich.edu-inf-20250401-155606-bf3dd-00006.warc.gz	5372837113	download job
news.umich.edu-inf-20250401-155606-bf3dd-00006.warc.os.cdx.gz	1423415	download
np-mrd.org-inf-20250411-190603-94qma-00009.warc.gz	33071305010	download job
np-mrd.org-inf-20250411-190603-94qma-00009.warc.os.cdx.gz	1132	download
portal.nersc.gov-inf-20250411-235739-duomw-00002.warc.gz	5856696846	download job
portal.nersc.gov-inf-20250411-235739-duomw-00002.warc.os.cdx.gz	34179	download
urls-transfer.archivete.am-brainimagelibrary.org_subdomains.txt-inf-20250411-005434-4aumn-00003.warc.gz	5381624309	download job
urls-transfer.archivete.am-brainimagelibrary.org_subdomains.txt-inf-20250411-005434-4aumn-00003.warc.os.cdx.gz	13115	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00256.warc.gz	5385866584	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00256.warc.os.cdx.gz	34983	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_images_full.txt-shallow-20250409-223924-8n4dx-00075.warc.gz	5368740431	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_images_full.txt-shallow-20250409-223924-8n4dx-00075.warc.os.cdx.gz	2357267	download
urls-transfer.archivete.am-www.npshistory.com_seed_urls.txt-inf-20250404-024004-5ti8k-00187.warc.gz	5383078420	download job
urls-transfer.archivete.am-www.npshistory.com_seed_urls.txt-inf-20250404-024004-5ti8k-00187.warc.os.cdx.gz	205862	download
webdav.dandiarchive.org-inf-20250411-130303-4ylae-00049.warc.gz	6959674459	download job
webdav.dandiarchive.org-inf-20250411-130303-4ylae-00049.warc.os.cdx.gz	955	download
webdav.dandiarchive.org-inf-20250411-130303-4ylae-00050.warc.gz	6993499838	download job
webdav.dandiarchive.org-inf-20250411-130303-4ylae-00050.warc.os.cdx.gz	733	download
www.genome.gov-inf-20250411-014304-5eqx7-00013.warc.gz	5529447680	download job
www.genome.gov-inf-20250411-014304-5eqx7-00013.warc.os.cdx.gz	5176270	download