Item archiveteam_archivebot_go_20250420200014_a2f045a8

Filename	Size
archiveteam_archivebot_go_20250420200014_a2f045a8.cdx.gz	25253847	download
archiveteam_archivebot_go_20250420200014_a2f045a8.cdx.idx	29387	download
archiveteam_archivebot_go_20250420200014_a2f045a8_files.xml	0	download
archiveteam_archivebot_go_20250420200014_a2f045a8_meta.sqlite	61440	download
archiveteam_archivebot_go_20250420200014_a2f045a8_meta.xml	881	download
bbs.boingboing.net-inf-20241103-062556-9e8b3-00633.warc.gz	5374073210	download job
bbs.boingboing.net-inf-20241103-062556-9e8b3-00633.warc.os.cdx.gz	1504668	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-07083.warc.gz	5763593052	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-07083.warc.os.cdx.gz	795	download
classicalarts.net-inf-20250420-181521-dwr4m-00000.warc.gz	1837422560	download job
classicalarts.net-inf-20250420-181521-dwr4m-00000.warc.os.cdx.gz	1369084	download
classicalarts.net-inf-20250420-181521-dwr4m-meta.warc.gz	817367	download job
classicalarts.net-inf-20250420-181521-dwr4m-meta.warc.os.cdx.gz	47	download
classicalarts.net-inf-20250420-181521-dwr4m.json	248	download job
culturalfund.gazprom.com-inf-20250420-184727-3jorv-00000.warc.gz	1631940971	download job
culturalfund.gazprom.com-inf-20250420-184727-3jorv-00000.warc.os.cdx.gz	954391	download
culturalfund.gazprom.com-inf-20250420-184727-3jorv-meta.warc.gz	493464	download job
culturalfund.gazprom.com-inf-20250420-184727-3jorv-meta.warc.os.cdx.gz	47	download
culturalfund.gazprom.com-inf-20250420-184727-3jorv.json	255	download job
hydrogen.gazprom.com-inf-20250420-184924-cih4i-00000.warc.gz	1369790799	download job
hydrogen.gazprom.com-inf-20250420-184924-cih4i-00000.warc.os.cdx.gz	886829	download
hydrogen.gazprom.com-inf-20250420-184924-cih4i-meta.warc.gz	453380	download job
hydrogen.gazprom.com-inf-20250420-184924-cih4i-meta.warc.os.cdx.gz	47	download
hydrogen.gazprom.com-inf-20250420-184924-cih4i.json	251	download job
ipsw.me-inf-20241201-145231-9lrev-07737.warc.gz	6616837775	download job
ipsw.me-inf-20241201-145231-9lrev-07737.warc.os.cdx.gz	351	download
music.si.edu-inf-20250329-031222-ev7nj-00226.warc.gz	5368709634	download job
music.si.edu-inf-20250329-031222-ev7nj-00226.warc.os.cdx.gz	1847797	download
portal.nersc.gov-inf-20250411-235739-duomw-00354.warc.gz	5605868633	download job
portal.nersc.gov-inf-20250411-235739-duomw-00354.warc.os.cdx.gz	1660	download
public.dhe.ibm.com-inf-20250416-120237-a9nyc-00065.warc.gz	5561524459	download job
public.dhe.ibm.com-inf-20250416-120237-a9nyc-00065.warc.os.cdx.gz	8610	download
sakuracon.org-inf-20250420-181117-3yav0-00000.warc.gz	5368934861	download job
sakuracon.org-inf-20250420-181117-3yav0-00000.warc.os.cdx.gz	1649845	download
urls-transfer.archivete.am-monarchinitiative.org_subdomains.txt-inf-20250411-053510-c3hjt-00192.warc.gz	8289694663	download job
urls-transfer.archivete.am-monarchinitiative.org_subdomains.txt-inf-20250411-053510-c3hjt-00192.warc.os.cdx.gz	551	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00539.warc.gz	5380807065	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00539.warc.os.cdx.gz	89024	download
urls-transfer.archivete.am-skinregeneration.org_subdomains.txt-inf-20250411-045441-8aqot-00130.warc.gz	5368983191	download job
urls-transfer.archivete.am-skinregeneration.org_subdomains.txt-inf-20250411-045441-8aqot-00130.warc.os.cdx.gz	421488	download
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00259.warc.gz	5371517036	download job
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00259.warc.os.cdx.gz	466373	download
videocast.nih.gov-inf-20250411-131031-4l9c9-00602.warc.gz	5650823134	download job
videocast.nih.gov-inf-20250411-131031-4l9c9-00602.warc.os.cdx.gz	744	download
www.i4cp.com-inf-20250418-202817-zt55g-00014.warc.gz	6846564836	download job
www.i4cp.com-inf-20250418-202817-zt55g-00014.warc.os.cdx.gz	2909796	download
www.i4cp.com-inf-20250418-202817-zt55g-00015.warc.gz	16986297	download job
www.i4cp.com-inf-20250418-202817-zt55g-00015.warc.os.cdx.gz	102397	download
www.i4cp.com-inf-20250418-202817-zt55g-meta.warc.gz	17817590	download job
www.i4cp.com-inf-20250418-202817-zt55g-meta.warc.os.cdx.gz	47	download
www.i4cp.com-inf-20250418-202817-zt55g.json	243	download job
www.oxford-chiltern-bus-page.co.uk-inf-20250420-080535-axbfb-00005.warc.gz	2670350739	download job
www.oxford-chiltern-bus-page.co.uk-inf-20250420-080535-axbfb-00005.warc.os.cdx.gz	3407982	download
www.oxford-chiltern-bus-page.co.uk-inf-20250420-080535-axbfb-meta.warc.gz	8709234	download job
www.oxford-chiltern-bus-page.co.uk-inf-20250420-080535-axbfb-meta.warc.os.cdx.gz	47	download
www.oxford-chiltern-bus-page.co.uk-inf-20250420-080535-axbfb.json	259	download job
www.pbs.org-inf-20250330-092508-bykmh-02330.warc.gz	5722136299	download job
www.pbs.org-inf-20250330-092508-bykmh-02330.warc.os.cdx.gz	14686	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05258.warc.gz	5369046292	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05258.warc.os.cdx.gz	70678	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05259.warc.gz	5447988428	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05259.warc.os.cdx.gz	72503	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05260.warc.gz	5750857343	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05260.warc.os.cdx.gz	112192	download
www.spc.noaa.gov-inf-20250326-171522-53voz-00112.warc.gz	5368715567	download job
www.spc.noaa.gov-inf-20250326-171522-53voz-00112.warc.os.cdx.gz	6268372	download
www.thebooksmugglers.com-inf-20250418-073429-dquhm-00013.warc.gz	5369994687	download job
www.thebooksmugglers.com-inf-20250418-073429-dquhm-00013.warc.os.cdx.gz	4034169	download
www.wells.edu-inf-20250420-115219-6h5n6-00003.warc.gz	2967278684	download job
www.wells.edu-inf-20250420-115219-6h5n6-00003.warc.os.cdx.gz	419275	download
www.wells.edu-inf-20250420-115219-6h5n6-meta.warc.gz	2917375	download job
www.wells.edu-inf-20250420-115219-6h5n6-meta.warc.os.cdx.gz	47	download
www.wells.edu-inf-20250420-115219-6h5n6.json	243	download job