Item archiveteam_archivebot_go_20210116160002

Filename	Size
accordingtohoyt.com-shallow-20210116-153008-vs5g6.json	304	download job
archiveteam_archivebot_go_20210116160002.cdx.gz	75825527	download
archiveteam_archivebot_go_20210116160002.cdx.idx	76784	download
archiveteam_archivebot_go_20210116160002_files.xml	0	download
archiveteam_archivebot_go_20210116160002_meta.sqlite	105472	download
archiveteam_archivebot_go_20210116160002_meta.xml	969	download
blaauwbugs.weebly.com-inf-20210116-140621-dsdyc-00000.warc.gz	347368458	download job
blaauwbugs.weebly.com-inf-20210116-140621-dsdyc-00000.warc.os.cdx.gz	303098	download
blaauwbugs.weebly.com-inf-20210116-140621-dsdyc-meta.warc.gz	204750	download job
blaauwbugs.weebly.com-inf-20210116-140621-dsdyc-meta.warc.os.cdx.gz	47	download
blaauwbugs.weebly.com-inf-20210116-140621-dsdyc.json	251	download job
carnage.bungie.org-inf-20210115-234441-a7njd-00020.warc.gz	5432927412	download job
carnage.bungie.org-inf-20210115-234441-a7njd-00020.warc.os.cdx.gz	255331	download
carnage.bungie.org-inf-20210115-234441-a7njd-00021.warc.gz	5483491510	download job
carnage.bungie.org-inf-20210115-234441-a7njd-00021.warc.os.cdx.gz	404155	download
forums.somd.com-inf-20201204-040430-45f94-00206.warc.gz	5368884149	download job
forums.somd.com-inf-20201204-040430-45f94-00206.warc.os.cdx.gz	2415294	download
ggapc.org-inf-20210116-140915-15pxp-00000.warc.gz	586900266	download job
ggapc.org-inf-20210116-140915-15pxp-00000.warc.os.cdx.gz	164020	download
ggapc.org-inf-20210116-140915-15pxp-meta.warc.gz	130793	download job
ggapc.org-inf-20210116-140915-15pxp-meta.warc.os.cdx.gz	47	download
ggapc.org-inf-20210116-140915-15pxp.json	239	download job
globalpolicyjournal.com-inf-20210113-164812-a5ijy-00041.warc.gz	8904504214	download job
globalpolicyjournal.com-inf-20210113-164812-a5ijy-00041.warc.os.cdx.gz	980232	download
globalpolicyjournal.com-inf-20210113-164812-a5ijy-meta.warc.gz	33106136	download job
globalpolicyjournal.com-inf-20210113-164812-a5ijy-meta.warc.os.cdx.gz	47	download
globalpolicyjournal.com-inf-20210113-164812-a5ijy.json	253	download job
grist.org-inf-20201201-045001-cx3tj-00202.warc.gz	5396647817	download job
grist.org-inf-20201201-045001-cx3tj-00202.warc.os.cdx.gz	3771482	download
justthenews.com-shallow-20210116-153218-bkfg4-meta.warc.gz	11898	download job
justthenews.com-shallow-20210116-153218-bkfg4-meta.warc.os.cdx.gz	47	download
kokkinosfakelos.blogspot.com-inf-20210116-024818-72mhs-00001.warc.gz	1815636730	download job
kokkinosfakelos.blogspot.com-inf-20210116-024818-72mhs-00001.warc.os.cdx.gz	4189841	download
kokkinosfakelos.blogspot.com-inf-20210116-024818-72mhs-meta.warc.gz	7345775	download job
kokkinosfakelos.blogspot.com-inf-20210116-024818-72mhs-meta.warc.os.cdx.gz	47	download
kokkinosfakelos.blogspot.com-inf-20210116-024818-72mhs.json	253	download job
pjmedia.com-inf-20201205-203127-6d2ou-00172.warc.gz	5370109801	download job
pjmedia.com-inf-20201205-203127-6d2ou-00172.warc.os.cdx.gz	1473986	download
service.mattel.com-inf-20210106-013836-ambxh-00000.warc.gz	5368718162	download job
service.mattel.com-inf-20210106-013836-ambxh-00000.warc.os.cdx.gz	9059753	download
teknikveckan.se-inf-20210115-022353-9nnq9-00022.warc.gz	4563028187	download job
teknikveckan.se-inf-20210115-022353-9nnq9-00022.warc.os.cdx.gz	1625300	download
transfer.notkiska.pw-shallow-20210116-150118-b4774-meta.warc.gz	3452	download job
transfer.notkiska.pw-shallow-20210116-150118-b4774-meta.warc.os.cdx.gz	47	download
tutusandtinyhats.wordpress.com-inf-20210115-221751-b2dgs-00015.warc.gz	5369496408	download job
tutusandtinyhats.wordpress.com-inf-20210115-221751-b2dgs-00015.warc.os.cdx.gz	3240039	download
tutusandtinyhats.wordpress.com-inf-20210115-221751-b2dgs-00016.warc.gz	801031659	download job
tutusandtinyhats.wordpress.com-inf-20210115-221751-b2dgs-00016.warc.os.cdx.gz	306388	download
tutusandtinyhats.wordpress.com-inf-20210115-221751-b2dgs-meta.warc.gz	15273528	download job
tutusandtinyhats.wordpress.com-inf-20210115-221751-b2dgs-meta.warc.os.cdx.gz	47	download
tutusandtinyhats.wordpress.com-inf-20210115-221751-b2dgs.json	258	download job
urls-transfer.notkiska.pw-twitter-%23StopTheSteal-shallow-20210107-020012-71dbc-00079.warc.gz	5382091686	download job
urls-transfer.notkiska.pw-twitter-%23StopTheSteal-shallow-20210107-020012-71dbc-00079.warc.os.cdx.gz	4889854	download
urls-transfer.notkiska.pw-twitter-%23StopTheSteal-shallow-20210107-020012-71dbc-00081.warc.gz	5399339556	download job
urls-transfer.notkiska.pw-twitter-%23StopTheSteal-shallow-20210107-020012-71dbc-00081.warc.os.cdx.gz	982943	download
urls-transfer.notkiska.pw-twitter-@MollyJongFast-shallow-20210114-091204-3zkvv-00017.warc.gz	5368756105	download job
urls-transfer.notkiska.pw-twitter-@MollyJongFast-shallow-20210114-091204-3zkvv-00017.warc.os.cdx.gz	5393727	download
urls-transfer.notkiska.pw-twitter-@noamchomskyT-shallow-20210116-044854-1jqia-00001.warc.gz	5486675667	download job
urls-transfer.notkiska.pw-twitter-@noamchomskyT-shallow-20210116-044854-1jqia-00001.warc.os.cdx.gz	471046	download
us.zgamz.org-inf-20210104-204452-cye3n-00097.warc.gz	5370115799	download job
us.zgamz.org-inf-20210104-204452-cye3n-00097.warc.os.cdx.gz	110947	download
us.zgamz.org-inf-20210104-204452-cye3n-00098.warc.gz	5370099769	download job
us.zgamz.org-inf-20210104-204452-cye3n-00098.warc.os.cdx.gz	128499	download
wmarxism.fudan.edu.cn-inf-20210116-111656-ehf74-00000.warc.gz	1704939038	download job
wmarxism.fudan.edu.cn-inf-20210116-111656-ehf74-00000.warc.os.cdx.gz	543000	download
wmarxism.fudan.edu.cn-inf-20210116-111656-ehf74-meta.warc.gz	355474	download job
wmarxism.fudan.edu.cn-inf-20210116-111656-ehf74-meta.warc.os.cdx.gz	47	download
wmarxism.fudan.edu.cn-inf-20210116-111656-ehf74.json	251	download job
www.chathamhouse.org-inf-20210109-223647-6wqxu-00033.warc.gz	5369879102	download job
www.chathamhouse.org-inf-20210109-223647-6wqxu-00033.warc.os.cdx.gz	1881927	download
www.eu-insekten.de-inf-20210116-142706-7ghwv-00000.warc.gz	184562375	download job
www.eu-insekten.de-inf-20210116-142706-7ghwv-00000.warc.os.cdx.gz	384109	download
www.eu-insekten.de-inf-20210116-142706-7ghwv-meta.warc.gz	198350	download job
www.eu-insekten.de-inf-20210116-142706-7ghwv-meta.warc.os.cdx.gz	47	download
www.eu-insekten.de-inf-20210116-142706-7ghwv.json	247	download job
www.flickr.com-inf-20210116-110238-ctkf3-00004.warc.gz	5372348485	download job
www.flickr.com-inf-20210116-110238-ctkf3-00004.warc.os.cdx.gz	576309	download
www.flickr.com-inf-20210116-110238-ctkf3-00005.warc.gz	5372531512	download job
www.flickr.com-inf-20210116-110238-ctkf3-00005.warc.os.cdx.gz	587429	download
www.ggapc.org-inf-20210116-142304-a7xam-00000.warc.gz	8333402	download job
www.ggapc.org-inf-20210116-142304-a7xam-00000.warc.os.cdx.gz	13813	download
www.ggapc.org-inf-20210116-142304-a7xam-meta.warc.gz	11249	download job
www.ggapc.org-inf-20210116-142304-a7xam-meta.warc.os.cdx.gz	47	download
www.ggapc.org-inf-20210116-142304-a7xam.json	243	download job
www.haconiwa-mag.com-inf-20210114-044736-6be8e-00003.warc.gz	5368709308	download job
www.haconiwa-mag.com-inf-20210114-044736-6be8e-00003.warc.os.cdx.gz	2739910	download
www.java2s.com-inf-20210107-234556-bjx75-00061.warc.gz	5368968485	download job
www.java2s.com-inf-20210107-234556-bjx75-00061.warc.os.cdx.gz	967304	download
www.java2s.com-inf-20210107-234556-bjx75-00063.warc.gz	5382097719	download job
www.java2s.com-inf-20210107-234556-bjx75-00063.warc.os.cdx.gz	681966	download
www.minijuegos.com-inf-20210102-225724-usy31-00015.warc.gz	5368727209	download job
www.minijuegos.com-inf-20210102-225724-usy31-00015.warc.os.cdx.gz	14810014	download
www.monotomidae.com-inf-20210116-151055-8bgc3-00000.warc.gz	469717904	download job
www.monotomidae.com-inf-20210116-151055-8bgc3-00000.warc.os.cdx.gz	271071	download
www.nethry.com-inf-20210104-202620-7htj0-00010.warc.gz	5369246150	download job
www.nethry.com-inf-20210104-202620-7htj0-00010.warc.os.cdx.gz	180152	download
www.pog.com-inf-20210104-034930-rdozb-00064.warc.gz	5368766908	download job
www.pog.com-inf-20210104-034930-rdozb-00064.warc.os.cdx.gz	3246835	download
www.securityfocus.com-inf-20210115-193747-dmhg1-00001.warc.gz	5399436024	download job
www.securityfocus.com-inf-20210115-193747-dmhg1-00001.warc.os.cdx.gz	2027583	download
www.teenvogue.com-inf-20200928-163823-6ac7g-00671.warc.gz	5382534433	download job
www.teenvogue.com-inf-20200928-163823-6ac7g-00671.warc.os.cdx.gz	4180092	download
www.theepochtimes.com-inf-20210113-040513-crylt-00031.warc.gz	5369013764	download job
www.theepochtimes.com-inf-20210113-040513-crylt-00031.warc.os.cdx.gz	4770831	download
www.veteranstoday.com-inf-20210107-013130-4h49r-00102.warc.gz	5368750383	download job
www.veteranstoday.com-inf-20210107-013130-4h49r-00102.warc.os.cdx.gz	166957	download
www.washingtontimes.com-shallow-20210116-154547-145ry-00000.warc.gz	40033790	download job
www.washingtontimes.com-shallow-20210116-154547-145ry-00000.warc.os.cdx.gz	35481	download