Item archiveteam_archivebot_go_20260314070505_f2ab8f66

Filename	Size
actramagazine.ca-inf-20260314-062825-6s208-aborted-00000.warc.gz	18002922	download job
actramagazine.ca-inf-20260314-062825-6s208-aborted-00000.warc.os.cdx.gz	27707	download
actramagazine.ca-inf-20260314-062825-6s208-aborted-wpull.log.gz	14295	download
actramagazine.ca-inf-20260314-062825-6s208-aborted.json	246	download job
archiveteam_archivebot_go_20260314070505_f2ab8f66.cdx.gz	51588678	download
archiveteam_archivebot_go_20260314070505_f2ab8f66.cdx.idx	60639	download
archiveteam_archivebot_go_20260314070505_f2ab8f66_files.xml	0	download
archiveteam_archivebot_go_20260314070505_f2ab8f66_meta.sqlite	217088	download
archiveteam_archivebot_go_20260314070505_f2ab8f66_meta.xml	1047	download
awards.ubcpactra.ca-inf-20260314-053527-6qc26-00000.warc.gz	1287727440	download job
awards.ubcpactra.ca-inf-20260314-053527-6qc26-00000.warc.os.cdx.gz	1152205	download
awards.ubcpactra.ca-inf-20260314-053527-6qc26-meta.warc.gz	744136	download job
awards.ubcpactra.ca-inf-20260314-053527-6qc26-meta.warc.os.cdx.gz	47	download
awards.ubcpactra.ca-inf-20260314-053527-6qc26.json	250	download job
beta.actramagazine.ca-inf-20260314-063333-cvewt-00000.warc.gz	10142	download job
beta.actramagazine.ca-inf-20260314-063333-cvewt-00000.warc.os.cdx.gz	327	download
beta.actramagazine.ca-inf-20260314-063333-cvewt-meta.warc.gz	3540	download job
beta.actramagazine.ca-inf-20260314-063333-cvewt-meta.warc.os.cdx.gz	47	download
beta.actramagazine.ca-inf-20260314-063333-cvewt.json	252	download job
chroma.actramagazine.ca-inf-20260314-062901-k0g6m-00000.warc.gz	236177162	download job
chroma.actramagazine.ca-inf-20260314-062901-k0g6m-00000.warc.os.cdx.gz	258600	download
chroma.actramagazine.ca-inf-20260314-062901-k0g6m-meta.warc.gz	146408	download job
chroma.actramagazine.ca-inf-20260314-062901-k0g6m-meta.warc.os.cdx.gz	47	download
chroma.actramagazine.ca-inf-20260314-062901-k0g6m.json	254	download job
chroma.actramagazine.ca-shallow-20260314-062844-cgwp6-00000.warc.gz	21917495	download job
chroma.actramagazine.ca-shallow-20260314-062844-cgwp6-00000.warc.os.cdx.gz	48069	download
chroma.actramagazine.ca-shallow-20260314-062844-cgwp6-meta.warc.gz	26725	download job
chroma.actramagazine.ca-shallow-20260314-062844-cgwp6-meta.warc.os.cdx.gz	47	download
chroma.actramagazine.ca-shallow-20260314-062844-cgwp6.json	266	download job
creativeartsfinancial.com-inf-20260314-061908-dj7z4-00000.warc.gz	857070505	download job
creativeartsfinancial.com-inf-20260314-061908-dj7z4-00000.warc.os.cdx.gz	727723	download
creativeartsfinancial.com-inf-20260314-061908-dj7z4-meta.warc.gz	456818	download job
creativeartsfinancial.com-inf-20260314-061908-dj7z4-meta.warc.os.cdx.gz	47	download
creativeartsfinancial.com-inf-20260314-061908-dj7z4.json	256	download job
das.sdss.org-inf-20250226-051304-5s39o-07041.warc.gz	5368798895	download job
das.sdss.org-inf-20250226-051304-5s39o-07041.warc.os.cdx.gz	837763	download
dev.actramagazine.ca-inf-20260314-063351-2q6e0-00000.warc.gz	164352	download job
dev.actramagazine.ca-inf-20260314-063351-2q6e0-00000.warc.os.cdx.gz	1488	download
dev.actramagazine.ca-inf-20260314-063351-2q6e0-meta.warc.gz	4394	download job
dev.actramagazine.ca-inf-20260314-063351-2q6e0-meta.warc.os.cdx.gz	47	download
dev.actramagazine.ca-inf-20260314-063351-2q6e0.json	251	download job
discourse.webflow.com-inf-20260312-094746-chvlj-00002.warc.gz	5368873484	download job
discourse.webflow.com-inf-20260312-094746-chvlj-00002.warc.os.cdx.gz	7640504	download
docs.google.com-inf-20260314-063555-f421f-00000.warc.gz	10091319	download job
docs.google.com-inf-20260314-063555-f421f-00000.warc.os.cdx.gz	33345	download
docs.google.com-inf-20260314-063555-f421f-meta.warc.gz	23093	download job
docs.google.com-inf-20260314-063555-f421f-meta.warc.os.cdx.gz	47	download
docs.google.com-inf-20260314-063555-f421f.json	339	download job
docs.google.com-shallow-20260314-063555-szsf9-00000.warc.gz	2900487	download job
docs.google.com-shallow-20260314-063555-szsf9-00000.warc.os.cdx.gz	6021	download
docs.google.com-shallow-20260314-063555-szsf9-meta.warc.gz	7008	download job
docs.google.com-shallow-20260314-063555-szsf9-meta.warc.os.cdx.gz	47	download
docs.google.com-shallow-20260314-063555-szsf9.json	318	download job
mbt.ca-inf-20260314-061800-a0qka-00000.warc.gz	342185770	download job
mbt.ca-inf-20260314-061800-a0qka-00000.warc.os.cdx.gz	569448	download
mbt.ca-inf-20260314-061800-a0qka-meta.warc.gz	370081	download job
mbt.ca-inf-20260314-061800-a0qka-meta.warc.os.cdx.gz	47	download
mbt.ca-inf-20260314-061800-a0qka.json	237	download job
new.actramagazine.ca-inf-20260314-063345-7q29u-00000.warc.gz	10135	download job
new.actramagazine.ca-inf-20260314-063345-7q29u-00000.warc.os.cdx.gz	333	download
new.actramagazine.ca-inf-20260314-063345-7q29u-meta.warc.gz	3562	download job
new.actramagazine.ca-inf-20260314-063345-7q29u-meta.warc.os.cdx.gz	47	download
new.actramagazine.ca-inf-20260314-063345-7q29u.json	251	download job
policebrutalitywatch.com-inf-20260313-055506-5pz3o-00011.warc.gz	5371211914	download job
policebrutalitywatch.com-inf-20260313-055506-5pz3o-00011.warc.os.cdx.gz	318976	download
policebrutalitywatch.com-inf-20260313-055506-5pz3o-00012.warc.gz	5570260976	download job
policebrutalitywatch.com-inf-20260313-055506-5pz3o-00012.warc.os.cdx.gz	11483	download
rootsaction.org-inf-20260312-012416-3w10w-00062.warc.gz	6468829516	download job
rootsaction.org-inf-20260312-012416-3w10w-00062.warc.os.cdx.gz	1267109	download
staging.canshof.ca-inf-20260314-061959-8jtip-00000.warc.gz	806739906	download job
staging.canshof.ca-inf-20260314-061959-8jtip-00000.warc.os.cdx.gz	656081	download
test.actramagazine.ca-inf-20260314-063347-dfsfo-00000.warc.gz	36240	download job
test.actramagazine.ca-inf-20260314-063347-dfsfo-00000.warc.os.cdx.gz	988	download
test.actramagazine.ca-inf-20260314-063347-dfsfo-meta.warc.gz	3983	download job
test.actramagazine.ca-inf-20260314-063347-dfsfo-meta.warc.os.cdx.gz	47	download
test.actramagazine.ca-inf-20260314-063347-dfsfo.json	252	download job
thirdworldxxx.com-inf-20260308-223712-a31io-00019.warc.gz	5368728886	download job
thirdworldxxx.com-inf-20260308-223712-a31io-00019.warc.os.cdx.gz	14541945	download
urls-nue2.nulldata.foo-github.com_pokeheadroom-20260314053757-links.txt-shallow-20260314-053843-agjmb-urls.txt	6423	download
urls-nue2.nulldata.foo-github.com_pokeheadroom-20260314053757-links.txt-shallow-20260314-053843-agjmb.json	390	download job
urls-transfer.archivete.am-archive.actramagazine.ca_pdf_urls.txt-shallow-20260314-063302-n0u56-00000.warc.gz	364656032	download job
urls-transfer.archivete.am-archive.actramagazine.ca_pdf_urls.txt-shallow-20260314-063302-n0u56-00000.warc.os.cdx.gz	2109	download
urls-transfer.archivete.am-archive.actramagazine.ca_pdf_urls.txt-shallow-20260314-063302-n0u56-meta.warc.gz	4517	download job
urls-transfer.archivete.am-archive.actramagazine.ca_pdf_urls.txt-shallow-20260314-063302-n0u56-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-archive.actramagazine.ca_pdf_urls.txt-shallow-20260314-063302-n0u56-urls.txt	2696	download
urls-transfer.archivete.am-archive.actramagazine.ca_pdf_urls.txt-shallow-20260314-063302-n0u56.json	370	download job
urls-transfer.archivete.am-bciaerospace.com_subdomains.txt-inf-20260313-194356-2zz9e-00002.warc.gz	227075407	download job
urls-transfer.archivete.am-bciaerospace.com_subdomains.txt-inf-20260313-194356-2zz9e-00002.warc.os.cdx.gz	538686	download
urls-transfer.archivete.am-bciaerospace.com_subdomains.txt-inf-20260313-194356-2zz9e-meta.warc.gz	5163345	download job
urls-transfer.archivete.am-bciaerospace.com_subdomains.txt-inf-20260313-194356-2zz9e-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-bciaerospace.com_subdomains.txt-inf-20260313-194356-2zz9e-urls.txt	6087	download
urls-transfer.archivete.am-bciaerospace.com_subdomains.txt-inf-20260313-194356-2zz9e.json	354	download job
urls-transfer.archivete.am-berkeley.edu_subdomains.txt-inf-20260225-025210-bb9um-00125.warc.gz	5369615021	download job
urls-transfer.archivete.am-berkeley.edu_subdomains.txt-inf-20260225-025210-bb9um-00125.warc.os.cdx.gz	1363203	download
urls-transfer.archivete.am-downloads.khinsider.com-ignored-audio-files_part-3.txt-shallow-20260311-143002-asdm3-00212.warc.gz	5372427723	download job
urls-transfer.archivete.am-downloads.khinsider.com-ignored-audio-files_part-3.txt-shallow-20260311-143002-asdm3-00212.warc.os.cdx.gz	144605	download
urls-transfer.archivete.am-downloads.khinsider.com-ignored-audio-files_part-3.txt-shallow-20260311-143002-asdm3-00213.warc.gz	5369300475	download job
urls-transfer.archivete.am-downloads.khinsider.com-ignored-audio-files_part-3.txt-shallow-20260311-143002-asdm3-00213.warc.os.cdx.gz	157646	download
urls-transfer.archivete.am-interaffairs.ru_and_en.interaffairs.ru.txt-inf-20260227-153931-404o7-00059.warc.gz	5368852136	download job
urls-transfer.archivete.am-interaffairs.ru_and_en.interaffairs.ru.txt-inf-20260227-153931-404o7-00059.warc.os.cdx.gz	554869	download
urls-transfer.archivete.am-www.blikk.hu-inf-20251109-021442-6akki-skipped-image.blikk.hu.txt-shallow-20260313-211827-cdjbu-00007.warc.gz	5368982910	download job
urls-transfer.archivete.am-www.blikk.hu-inf-20251109-021442-6akki-skipped-image.blikk.hu.txt-shallow-20260313-211827-cdjbu-00007.warc.os.cdx.gz	5571102	download
urls-transfer.archivete.am-www.mrtv.gov.mm.txt-inf-20260128-185436-1ibq9-01685.warc.gz	5392579291	download job
urls-transfer.archivete.am-www.mrtv.gov.mm.txt-inf-20260128-185436-1ibq9-01685.warc.os.cdx.gz	38835	download
urls-transfer.archivete.am-www.thaipbs.or.th_and_world.thaipbs.or.th.txt-inf-20260301-075702-aq249-00076.warc.gz	5368746962	download job
urls-transfer.archivete.am-www.thaipbs.or.th_and_world.thaipbs.or.th.txt-inf-20260301-075702-aq249-00076.warc.os.cdx.gz	1214110	download
waywardvegan.com-inf-20260314-062802-69p1r-00000.warc.gz	358663433	download job
waywardvegan.com-inf-20260314-062802-69p1r-00000.warc.os.cdx.gz	352693	download
waywardvegan.com-inf-20260314-062802-69p1r-meta.warc.gz	205839	download job
waywardvegan.com-inf-20260314-062802-69p1r-meta.warc.os.cdx.gz	47	download
waywardvegan.com-inf-20260314-062802-69p1r.json	247	download job
www.actra.org-inf-20260314-053302-d9b47-00000.warc.gz	1316497560	download job
www.actra.org-inf-20260314-053302-d9b47-00000.warc.os.cdx.gz	1071896	download
www.actra.org-inf-20260314-053302-d9b47-meta.warc.gz	887525	download job
www.actra.org-inf-20260314-053302-d9b47-meta.warc.os.cdx.gz	47	download
www.actra.org-inf-20260314-053302-d9b47.json	244	download job
www.actramagazine.ca-inf-20260314-062813-46w3c-00000.warc.gz	27129192	download job
www.actramagazine.ca-inf-20260314-062813-46w3c-00000.warc.os.cdx.gz	48587	download
www.actramagazine.ca-inf-20260314-062813-46w3c-meta.warc.gz	26783	download job
www.actramagazine.ca-inf-20260314-062813-46w3c-meta.warc.os.cdx.gz	47	download
www.actramagazine.ca-inf-20260314-062813-46w3c.json	251	download job
www.afbs.ca-inf-20260314-061552-5euax-00000.warc.gz	252390884	download job
www.afbs.ca-inf-20260314-061552-5euax-00000.warc.os.cdx.gz	353625	download
www.afbs.ca-inf-20260314-061552-5euax-meta.warc.gz	218649	download job
www.afbs.ca-inf-20260314-061552-5euax-meta.warc.os.cdx.gz	47	download
www.afbs.ca-inf-20260314-061552-5euax.json	242	download job
www.atlanticcouncil.org-inf-20260302-005040-ag774-00167.warc.gz	5378905998	download job
www.atlanticcouncil.org-inf-20260302-005040-ag774-00167.warc.os.cdx.gz	428349	download
www.basf.com-inf-20260304-071631-nsnwp-00016.warc.gz	5369393186	download job
www.basf.com-inf-20260304-071631-nsnwp-00016.warc.os.cdx.gz	5629237	download
www.db.com-inf-20260313-212731-ek8f1-00004.warc.gz	6325833716	download job
www.db.com-inf-20260313-212731-ek8f1-00004.warc.os.cdx.gz	1728570	download
www.placer.ai-inf-20260313-195118-59q1q-00012.warc.gz	5372499630	download job
www.placer.ai-inf-20260313-195118-59q1q-00012.warc.os.cdx.gz	597883	download
www.readthecode.ca-inf-20260314-062540-2rj5u-00000.warc.gz	2473	download job
www.readthecode.ca-inf-20260314-062540-2rj5u-00000.warc.os.cdx.gz	47	download
www.readthecode.ca-inf-20260314-062540-2rj5u-meta.warc.gz	3494	download job
www.readthecode.ca-inf-20260314-062540-2rj5u-meta.warc.os.cdx.gz	47	download
www.readthecode.ca-inf-20260314-062540-2rj5u.json	249	download job
www.reaganfoundation.org-inf-20260313-193454-5dchu-00010.warc.gz	5746320197	download job
www.reaganfoundation.org-inf-20260313-193454-5dchu-00010.warc.os.cdx.gz	1240197	download
www.relay.fm-inf-20260305-195614-7djyj-00183.warc.gz	5375440173	download job
www.relay.fm-inf-20260305-195614-7djyj-00183.warc.os.cdx.gz	2463190	download
www.sb.by-inf-20260305-072513-dvjmy-00054.warc.gz	5369520899	download job
www.sb.by-inf-20260305-072513-dvjmy-00054.warc.os.cdx.gz	1559105	download
www.tabnak.ir-inf-20260130-213526-8r7zi-00267.warc.gz	5453647570	download job
www.tabnak.ir-inf-20260130-213526-8r7zi-00267.warc.os.cdx.gz	349859	download
www.waywardvegan.com-inf-20260314-063641-9ze97-00000.warc.gz	96817	download job
www.waywardvegan.com-inf-20260314-063641-9ze97-00000.warc.os.cdx.gz	871	download
www.waywardvegan.com-inf-20260314-063641-9ze97-meta.warc.gz	4270	download job
www.waywardvegan.com-inf-20260314-063641-9ze97-meta.warc.os.cdx.gz	47	download
www.waywardvegan.com-inf-20260314-063641-9ze97-wpull.log.gz	1704	download
www.waywardvegan.com-inf-20260314-063641-9ze97.json	251	download job