Item archiveteam_archivebot_go_20200116020002

Filename	Size
angryitalian.com-inf-20200115-220807-4z7br-00000.warc.gz	5465206866	download job
angryitalian.com-inf-20200115-220807-4z7br-00000.warc.os.cdx.gz	2620109	download
angryitalian.com-inf-20200115-220807-4z7br-meta.warc.gz	3006856	download job
angryitalian.com-inf-20200115-220807-4z7br-meta.warc.os.cdx.gz	47	download
archiveteam_archivebot_go_20200116020002.cdx.gz	70262532	download
archiveteam_archivebot_go_20200116020002.cdx.idx	69359	download
archiveteam_archivebot_go_20200116020002_files.xml	0	download
archiveteam_archivebot_go_20200116020002_meta.sqlite	164864	download
archiveteam_archivebot_go_20200116020002_meta.xml	1017	download
cyber.harvard.edu-inf-20191227-031633-8qize-00033.warc.gz	5381248408	download job
cyber.harvard.edu-inf-20191227-031633-8qize-00033.warc.os.cdx.gz	3893826	download
mecki.tripod.com-inf-20200115-214040-b1yqr-00000.warc.gz	5369405628	download job
mecki.tripod.com-inf-20200115-214040-b1yqr-00000.warc.os.cdx.gz	2298994	download
mecki.tripod.com-inf-20200115-214040-b1yqr-00001.warc.gz	47364607	download job
mecki.tripod.com-inf-20200115-214040-b1yqr-00001.warc.os.cdx.gz	189571	download
mecki.tripod.com-inf-20200115-214040-b1yqr-meta.warc.gz	1624809	download job
mecki.tripod.com-inf-20200115-214040-b1yqr-meta.warc.os.cdx.gz	47	download
mecki.tripod.com-inf-20200115-214040-b1yqr.json	246	download job
seeclickfix.com-inf-20191012-203853-am48d-00196.warc.gz	5368765733	download job
seeclickfix.com-inf-20191012-203853-am48d-00196.warc.os.cdx.gz	8055332	download
survivalblog.com-inf-20200111-040238-3gnon-00038.warc.gz	5372624253	download job
survivalblog.com-inf-20200111-040238-3gnon-00038.warc.os.cdx.gz	1520316	download
survivalblog.com-inf-20200111-040238-3gnon-00039.warc.gz	5368981664	download job
survivalblog.com-inf-20200111-040238-3gnon-00039.warc.os.cdx.gz	1541920	download
twitter.com-shallow-20200115-231859-875pl-00000.warc.gz	1388937	download job
twitter.com-shallow-20200115-231859-875pl-00000.warc.os.cdx.gz	5778	download
twitter.com-shallow-20200115-231859-875pl-meta.warc.gz	7069	download job
twitter.com-shallow-20200115-231859-875pl-meta.warc.os.cdx.gz	47	download
twitter.com-shallow-20200115-231859-875pl.json	287	download job
urls-transfer.notkiska.pw-facebook-@SenatorBlunt-shallow-20200115-165558-6bkuz-00003.warc.gz	1563748182	download job
urls-transfer.notkiska.pw-facebook-@SenatorBlunt-shallow-20200115-165558-6bkuz-00003.warc.os.cdx.gz	1157221	download
urls-transfer.notkiska.pw-facebook-@SenatorBlunt-shallow-20200115-165558-6bkuz-meta.warc.gz	1346412	download job
urls-transfer.notkiska.pw-facebook-@SenatorBlunt-shallow-20200115-165558-6bkuz-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-facebook-@SenatorBlunt-shallow-20200115-165558-6bkuz-urls.txt	413669	download
urls-transfer.notkiska.pw-facebook-@SenatorBlunt-shallow-20200115-165558-6bkuz.json	338	download job
urls-transfer.notkiska.pw-facebook-@angryita-shallow-20200115-221111-cu0pn-00000.warc.gz	1541866007	download job
urls-transfer.notkiska.pw-facebook-@angryita-shallow-20200115-221111-cu0pn-00000.warc.os.cdx.gz	1162088	download
urls-transfer.notkiska.pw-facebook-@angryita-shallow-20200115-221111-cu0pn-meta.warc.gz	728152	download job
urls-transfer.notkiska.pw-facebook-@angryita-shallow-20200115-221111-cu0pn-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-facebook-@angryita-shallow-20200115-221111-cu0pn-urls.txt	283453	download
urls-transfer.notkiska.pw-facebook-@angryita-shallow-20200115-221111-cu0pn.json	332	download job
urls-transfer.notkiska.pw-facebook-@senatorbencardin-shallow-20200115-185938-81emv-00003.warc.gz	2954521805	download job
urls-transfer.notkiska.pw-facebook-@senatorbencardin-shallow-20200115-185938-81emv-00003.warc.os.cdx.gz	1272060	download
urls-transfer.notkiska.pw-facebook-@senatorbencardin-shallow-20200115-185938-81emv-meta.warc.gz	1563910	download job
urls-transfer.notkiska.pw-facebook-@senatorbencardin-shallow-20200115-185938-81emv-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-facebook-@senatorbencardin-shallow-20200115-185938-81emv-urls.txt	346477	download
urls-transfer.notkiska.pw-facebook-@senatorbencardin-shallow-20200115-185938-81emv.json	346	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00023.warc.gz	5373536046	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00023.warc.os.cdx.gz	692095	download
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00024.warc.gz	5386007954	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00024.warc.os.cdx.gz	856979	download
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00030.warc.gz	5368723351	download job
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00030.warc.os.cdx.gz	431019	download
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00031.warc.gz	5379659200	download job
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00031.warc.os.cdx.gz	966604	download
urls-transfer.notkiska.pw-twitter-%23manuscripts-shallow-20200114-110749-d78rm-00013.warc.gz	5493961840	download job
urls-transfer.notkiska.pw-twitter-%23manuscripts-shallow-20200114-110749-d78rm-00013.warc.os.cdx.gz	880060	download
urls-transfer.notkiska.pw-twitter-%23manuscripts-shallow-20200114-110749-d78rm-00014.warc.gz	5376351236	download job
urls-transfer.notkiska.pw-twitter-%23manuscripts-shallow-20200114-110749-d78rm-00014.warc.os.cdx.gz	2108340	download
urls-transfer.notkiska.pw-twitter-@BenjaminNorton-shallow-20200114-124327-39umf-00020.warc.gz	6353601131	download job
urls-transfer.notkiska.pw-twitter-@BenjaminNorton-shallow-20200114-124327-39umf-00020.warc.os.cdx.gz	244916	download
urls-transfer.notkiska.pw-twitter-@BenjaminNorton-shallow-20200114-124327-39umf-00021.warc.gz	5383768010	download job
urls-transfer.notkiska.pw-twitter-@BenjaminNorton-shallow-20200114-124327-39umf-00021.warc.os.cdx.gz	227962	download
urls-transfer.notkiska.pw-twitter-@BenjaminNorton-shallow-20200114-124327-39umf-00022.warc.gz	5372754577	download job
urls-transfer.notkiska.pw-twitter-@BenjaminNorton-shallow-20200114-124327-39umf-00022.warc.os.cdx.gz	1050791	download
urls-transfer.notkiska.pw-twitter-@BenjaminNorton-shallow-20200114-124327-39umf-00023.warc.gz	5456992957	download job
urls-transfer.notkiska.pw-twitter-@BenjaminNorton-shallow-20200114-124327-39umf-00023.warc.os.cdx.gz	435516	download
urls-transfer.notkiska.pw-twitter-@FuggGunControl-shallow-20200115-221557-dlx31-00000.warc.gz	2073984	download job
urls-transfer.notkiska.pw-twitter-@FuggGunControl-shallow-20200115-221557-dlx31-00000.warc.os.cdx.gz	5861	download
urls-transfer.notkiska.pw-twitter-@FuggGunControl-shallow-20200115-221557-dlx31-meta.warc.gz	7152	download job
urls-transfer.notkiska.pw-twitter-@FuggGunControl-shallow-20200115-221557-dlx31-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@FuggGunControl-shallow-20200115-221557-dlx31-urls.txt	35	download
urls-transfer.notkiska.pw-twitter-@FuggGunControl-shallow-20200115-221557-dlx31.json	340	download job
urls-transfer.notkiska.pw-twitter-@IRCCloud-shallow-20200116-003407-cdzjk-00000.warc.gz	988266	download job
urls-transfer.notkiska.pw-twitter-@IRCCloud-shallow-20200116-003407-cdzjk-00000.warc.os.cdx.gz	3980	download
urls-transfer.notkiska.pw-twitter-@IRCCloud-shallow-20200116-003407-cdzjk-meta.warc.gz	6072	download job
urls-transfer.notkiska.pw-twitter-@IRCCloud-shallow-20200116-003407-cdzjk-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@IRCCloud-shallow-20200116-003407-cdzjk-urls.txt	29	download
urls-transfer.notkiska.pw-twitter-@IRCCloud-shallow-20200116-003407-cdzjk.json	328	download job
urls-transfer.notkiska.pw-twitter-@amigosaharaui-shallow-20200115-205950-9rcsk-urls.txt	977792	download
urls-transfer.notkiska.pw-twitter-@angryita-shallow-20200115-220900-es105-00000.warc.gz	1272300438	download job
urls-transfer.notkiska.pw-twitter-@angryita-shallow-20200115-220900-es105-00000.warc.os.cdx.gz	441848	download
urls-transfer.notkiska.pw-twitter-@angryita-shallow-20200115-220900-es105-meta.warc.gz	289077	download job
urls-transfer.notkiska.pw-twitter-@angryita-shallow-20200115-220900-es105-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@angryita-shallow-20200115-220900-es105-urls.txt	88370	download
urls-transfer.notkiska.pw-twitter-@angryita-shallow-20200115-220900-es105.json	328	download job
urls-transfer.notkiska.pw-youtube-telesurtv-shallow-20200114-164520-6m0vi-00004.warc.gz	5368715971	download job
urls-transfer.notkiska.pw-youtube-telesurtv-shallow-20200114-164520-6m0vi-00004.warc.os.cdx.gz	5668920	download
www.belltower.news-shallow-20200115-221255-1huu0-00000.warc.gz	6175069	download job
www.belltower.news-shallow-20200115-221255-1huu0-00000.warc.os.cdx.gz	5782	download
www.belltower.news-shallow-20200115-221255-1huu0-meta.warc.gz	7022	download job
www.belltower.news-shallow-20200115-221255-1huu0-meta.warc.os.cdx.gz	47	download
www.chinadaily.com.cn-inf-20190927-102302-505np-00112.warc.gz	1074009738	download job
www.chinadaily.com.cn-inf-20190927-102302-505np-00112.warc.os.cdx.gz	748567	download
www.icon-cs.com-inf-20200115-215432-dr7qm-00000.warc.gz	82483721	download job
www.icon-cs.com-inf-20200115-215432-dr7qm-00000.warc.os.cdx.gz	72763	download
www.icon-cs.com-inf-20200115-215432-dr7qm-meta.warc.gz	47424	download job
www.icon-cs.com-inf-20200115-215432-dr7qm-meta.warc.os.cdx.gz	47	download
www.icon-cs.com-inf-20200115-215432-dr7qm.json	245	download job
www.leader.ir-inf-20200104-232220-980so-00037.warc.gz	5388441347	download job
www.leader.ir-inf-20200104-232220-980so-00037.warc.os.cdx.gz	198465	download
www.naturalista.mx-inf-20200115-134112-73260-aborted-wpull.log.gz	1173431	download
www.naturalista.mx-inf-20200115-134112-73260-aborted.json	254	download job
www.ninersnation.com-inf-20191224-082402-8nweq-00194.warc.gz	5368806510	download job
www.ninersnation.com-inf-20191224-082402-8nweq-00194.warc.os.cdx.gz	1643498	download
www.ninersnation.com-inf-20191224-082402-8nweq-00195.warc.gz	5431732891	download job
www.ninersnation.com-inf-20191224-082402-8nweq-00195.warc.os.cdx.gz	1368447	download
www.ninersnation.com-inf-20191224-082402-8nweq-00196.warc.gz	5371812785	download job
www.ninersnation.com-inf-20191224-082402-8nweq-00196.warc.os.cdx.gz	1452114	download
www.ninersnation.com-inf-20191224-082402-8nweq-00197.warc.gz	5368869473	download job
www.ninersnation.com-inf-20191224-082402-8nweq-00197.warc.os.cdx.gz	1649024	download
www.northnorfolklabourparty.co.uk-inf-20200112-103516-hliai-00000.warc.gz	80602995	download job
www.northnorfolklabourparty.co.uk-inf-20200112-103516-hliai-00000.warc.os.cdx.gz	176794	download
www.northnorfolklabourparty.co.uk-inf-20200112-103516-hliai-meta.warc.gz	168558	download job
www.northnorfolklabourparty.co.uk-inf-20200112-103516-hliai-meta.warc.os.cdx.gz	47	download
www.northnorfolklabourparty.co.uk-inf-20200112-103516-hliai.json	263	download job
www.obslabour.london-inf-20200112-112523-36a7n-00000.warc.gz	77316398	download job
www.obslabour.london-inf-20200112-112523-36a7n-00000.warc.os.cdx.gz	165834	download
www.obslabour.london-inf-20200112-112523-36a7n-meta.warc.gz	102723	download job
www.obslabour.london-inf-20200112-112523-36a7n-meta.warc.os.cdx.gz	47	download
www.obslabour.london-inf-20200112-112523-36a7n.json	250	download job
www.owenpaterson.org-inf-20200112-112652-eq958-00000.warc.gz	897475049	download job
www.owenpaterson.org-inf-20200112-112652-eq958-00000.warc.os.cdx.gz	1337215	download
www.owenpaterson.org-inf-20200112-112652-eq958-meta.warc.gz	860412	download job
www.owenpaterson.org-inf-20200112-112652-eq958-meta.warc.os.cdx.gz	47	download
www.owenpaterson.org-inf-20200112-112652-eq958.json	250	download job
www.partyof.wales-inf-20200112-112720-aoo69-00000.warc.gz	5244526665	download job
www.partyof.wales-inf-20200112-112720-aoo69-00000.warc.os.cdx.gz	3867502	download
www.partyof.wales-inf-20200112-112720-aoo69-meta.warc.gz	2533527	download job
www.partyof.wales-inf-20200112-112720-aoo69-meta.warc.os.cdx.gz	47	download
www.partyof.wales-inf-20200112-112720-aoo69.json	247	download job
www.paulinelatham.co.uk-inf-20200112-113910-itli6-00000.warc.gz	618469963	download job
www.paulinelatham.co.uk-inf-20200112-113910-itli6-00000.warc.os.cdx.gz	825762	download
www.paulinelatham.co.uk-inf-20200112-113910-itli6-meta.warc.gz	511280	download job
www.paulinelatham.co.uk-inf-20200112-113910-itli6-meta.warc.os.cdx.gz	47	download
www.paulinelatham.co.uk-inf-20200112-113910-itli6.json	253	download job
www.quickpar.org.uk-inf-20200109-000330-3ejz9-00000.warc.gz	51057182	download job
www.quickpar.org.uk-inf-20200109-000330-3ejz9-00000.warc.os.cdx.gz	20817	download
www.quickpar.org.uk-inf-20200109-000330-3ejz9-meta.warc.gz	15119	download job
www.quickpar.org.uk-inf-20200109-000330-3ejz9-meta.warc.os.cdx.gz	47	download
www.quickpar.org.uk-inf-20200109-000330-3ejz9.json	249	download job
www.racheleden.net-inf-20200113-062549-10clk-00000.warc.gz	2760930335	download job
www.racheleden.net-inf-20200113-062549-10clk-00000.warc.os.cdx.gz	2496506	download
www.tagesstimme.com-shallow-20200115-221201-7rf8a-00000.warc.gz	7073642	download job
www.tagesstimme.com-shallow-20200115-221201-7rf8a-00000.warc.os.cdx.gz	19632	download
www.tagesstimme.com-shallow-20200115-221201-7rf8a-meta.warc.gz	15038	download job
www.tagesstimme.com-shallow-20200115-221201-7rf8a-meta.warc.os.cdx.gz	47	download
www.tagesstimme.com-shallow-20200115-221201-7rf8a.json	312	download job
www.taringa.net-inf-20190927-205127-2a0h7-00197.warc.gz	5368749060	download job
www.taringa.net-inf-20190927-205127-2a0h7-00197.warc.os.cdx.gz	4285474	download
www.telesurtv.net-inf-20200112-124750-cd4jz-00029.warc.gz	5368759336	download job
www.telesurtv.net-inf-20200112-124750-cd4jz-00029.warc.os.cdx.gz	7963905	download
www.thebeecourse.org-inf-20200115-230222-5etk9-00000.warc.gz	136201851	download job
www.thebeecourse.org-inf-20200115-230222-5etk9-00000.warc.os.cdx.gz	228408	download
www.thebeecourse.org-inf-20200115-230222-5etk9-meta.warc.gz	149158	download job
www.thebeecourse.org-inf-20200115-230222-5etk9-meta.warc.os.cdx.gz	47	download
www.thebeecourse.org-inf-20200115-230222-5etk9.json	250	download job
www.thestranger.com-inf-20190827-222815-3hodl-00399.warc.gz	5430817837	download job
www.thestranger.com-inf-20190827-222815-3hodl-00399.warc.os.cdx.gz	753825	download
www.usgennet.org-inf-20200113-035739-747ul-00002.warc.gz	5368743004	download job
www.usgennet.org-inf-20200113-035739-747ul-00002.warc.os.cdx.gz	6606020	download