Item archiveteam_archivebot_go_20210806050001

Filename	Size
ap-unsdsn.org-inf-20210805-220201-89jku-00000.warc.gz	3253734069	download job
ap-unsdsn.org-inf-20210805-220201-89jku-00000.warc.os.cdx.gz	2229300	download
ap-unsdsn.org-inf-20210805-220201-89jku-meta.warc.gz	1456935	download job
ap-unsdsn.org-inf-20210805-220201-89jku-meta.warc.os.cdx.gz	47	download
ap-unsdsn.org-inf-20210805-220201-89jku.json	243	download job
archiveteam_archivebot_go_20210806050001.cdx.gz	61761081	download
archiveteam_archivebot_go_20210806050001.cdx.idx	61097	download
archiveteam_archivebot_go_20210806050001_files.xml	0	download
archiveteam_archivebot_go_20210806050001_meta.sqlite	167936	download
archiveteam_archivebot_go_20210806050001_meta.xml	969	download
balkanforum.info-inf-20210716-092709-esp7s-00040.warc.gz	5369724342	download job
balkanforum.info-inf-20210716-092709-esp7s-00040.warc.os.cdx.gz	3148218	download
balkanforum.info-inf-20210716-092709-esp7s-00041.warc.gz	5373040505	download job
balkanforum.info-inf-20210716-092709-esp7s-00041.warc.os.cdx.gz	2410126	download
brandnewtube.com-inf-20210704-231908-b5vok-00983.warc.gz	5373195191	download job
brandnewtube.com-inf-20210704-231908-b5vok-00983.warc.os.cdx.gz	362560	download
brandnewtube.com-inf-20210704-231908-b5vok-00984.warc.gz	5408690587	download job
brandnewtube.com-inf-20210704-231908-b5vok-00984.warc.os.cdx.gz	161340	download
education.barillacfn.com-inf-20210806-015541-4ufi0-00000.warc.gz	324427798	download job
education.barillacfn.com-inf-20210806-015541-4ufi0-00000.warc.os.cdx.gz	156812	download
education.barillacfn.com-inf-20210806-015541-4ufi0-meta.warc.gz	143123	download job
education.barillacfn.com-inf-20210806-015541-4ufi0-meta.warc.os.cdx.gz	47	download
education.barillacfn.com-inf-20210806-015541-4ufi0.json	254	download job
interactivemultimediatechnology.blogspot.com-inf-20210805-004652-46bxw-00005.warc.gz	5369283438	download job
interactivemultimediatechnology.blogspot.com-inf-20210805-004652-46bxw-00005.warc.os.cdx.gz	5221257	download
knightfoundation.org-inf-20210802-131734-ehj2n-00054.warc.gz	5554209457	download job
knightfoundation.org-inf-20210802-131734-ehj2n-00054.warc.os.cdx.gz	1332148	download
knightfoundation.org-inf-20210802-131734-ehj2n-00055.warc.gz	5369697949	download job
knightfoundation.org-inf-20210802-131734-ehj2n-00055.warc.os.cdx.gz	2534173	download
knightfoundation.org-inf-20210802-131734-ehj2n-00056.warc.gz	5369460646	download job
knightfoundation.org-inf-20210802-131734-ehj2n-00056.warc.os.cdx.gz	1154385	download
old.reddit.com-inf-20210806-032521-e8ff4-00000.warc.gz	204987676	download job
old.reddit.com-inf-20210806-032521-e8ff4-00000.warc.os.cdx.gz	260825	download
old.reddit.com-inf-20210806-032521-e8ff4-meta.warc.gz	203516	download job
old.reddit.com-inf-20210806-032521-e8ff4-meta.warc.os.cdx.gz	47	download
old.reddit.com-inf-20210806-032521-e8ff4.json	257	download job
sanoesostenibile.barillacfn.com-inf-20210806-022255-3x2lp-00000.warc.gz	511347	download job
sanoesostenibile.barillacfn.com-inf-20210806-022255-3x2lp-00000.warc.os.cdx.gz	5198	download
sanoesostenibile.barillacfn.com-inf-20210806-022255-3x2lp-meta.warc.gz	6418	download job
sanoesostenibile.barillacfn.com-inf-20210806-022255-3x2lp-meta.warc.os.cdx.gz	47	download
sanoesostenibile.barillacfn.com-inf-20210806-022255-3x2lp.json	260	download job
santachiaralab.unisi.it-inf-20210806-014007-a4wid-00000.warc.gz	10815	download job
santachiaralab.unisi.it-inf-20210806-014007-a4wid-00000.warc.os.cdx.gz	275	download
santachiaralab.unisi.it-inf-20210806-014007-a4wid-meta.warc.gz	3679	download job
santachiaralab.unisi.it-inf-20210806-014007-a4wid-meta.warc.os.cdx.gz	47	download
santachiaralab.unisi.it-inf-20210806-014007-a4wid.json	253	download job
tik.fail-inf-20210730-172453-4ihu1-00028.warc.gz	5370532418	download job
tik.fail-inf-20210730-172453-4ihu1-00028.warc.os.cdx.gz	234032	download
tik.fail-inf-20210730-172453-4ihu1-00029.warc.gz	5378547134	download job
tik.fail-inf-20210730-172453-4ihu1-00029.warc.os.cdx.gz	233367	download
timeweb.com-inf-20210715-235114-erq28-00135.warc.gz	5369349059	download job
timeweb.com-inf-20210715-235114-erq28-00135.warc.os.cdx.gz	920132	download
timeweb.com-inf-20210715-235114-erq28-00136.warc.gz	5370530974	download job
timeweb.com-inf-20210715-235114-erq28-00136.warc.os.cdx.gz	873872	download
torontoist.com-inf-20210731-223722-ee10n-00030.warc.gz	5371827105	download job
torontoist.com-inf-20210731-223722-ee10n-00030.warc.os.cdx.gz	2041056	download
torontoist.com-inf-20210731-223722-ee10n-00031.warc.gz	5382941708	download job
torontoist.com-inf-20210731-223722-ee10n-00031.warc.os.cdx.gz	1818091	download
urls-transfer.archivete.am-twitter-%23sdgs-shallow-20210613-005138-efxoq-00130.warc.gz	5368727073	download job
urls-transfer.archivete.am-twitter-%23sdgs-shallow-20210613-005138-efxoq-00130.warc.os.cdx.gz	3006613	download
urls-transfer.archivete.am-twitter-%23txlege-shallow-20210714-183735-diq7w-00095.warc.gz	6550993296	download job
urls-transfer.archivete.am-twitter-%23txlege-shallow-20210714-183735-diq7w-00095.warc.os.cdx.gz	1733397	download
urls-transfer.archivete.am-twitter-@ChrisCuomo-shallow-20210804-190038-4whx8-00004.warc.gz	5368733716	download job
urls-transfer.archivete.am-twitter-@ChrisCuomo-shallow-20210804-190038-4whx8-00004.warc.os.cdx.gz	5737899	download
urls-transfer.archivete.am-twitter-@Dotemu-shallow-20210805-181954-a16ix-00001.warc.gz	4083394459	download job
urls-transfer.archivete.am-twitter-@Dotemu-shallow-20210805-181954-a16ix-00001.warc.os.cdx.gz	4296848	download
urls-transfer.archivete.am-twitter-@Dotemu-shallow-20210805-181954-a16ix-meta.warc.gz	4235796	download job
urls-transfer.archivete.am-twitter-@Dotemu-shallow-20210805-181954-a16ix-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@Dotemu-shallow-20210805-181954-a16ix-urls.txt	906137	download
urls-transfer.archivete.am-twitter-@Dotemu-shallow-20210805-181954-a16ix.json	326	download job
urls-transfer.archivete.am-twitter-@SantachiaraLab-shallow-20210806-014101-1w1it-00000.warc.gz	5641087945	download job
urls-transfer.archivete.am-twitter-@SantachiaraLab-shallow-20210806-014101-1w1it-00000.warc.os.cdx.gz	1675407	download
urls-transfer.archivete.am-twitter-@SantachiaraLab-shallow-20210806-014101-1w1it-urls.txt	140104	download
urls-transfer.archivete.am-twitter-@SantachiaraLab-shallow-20210806-014101-1w1it.json	342	download job
urls-transfer.archivete.am-twitter-@scandilicious1-shallow-20210806-020456-dyl3j-00000.warc.gz	73881909	download job
urls-transfer.archivete.am-twitter-@scandilicious1-shallow-20210806-020456-dyl3j-00000.warc.os.cdx.gz	116379	download
urls-transfer.archivete.am-twitter-@scandilicious1-shallow-20210806-020456-dyl3j-meta.warc.gz	75397	download job
urls-transfer.archivete.am-twitter-@scandilicious1-shallow-20210806-020456-dyl3j-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@scandilicious1-shallow-20210806-020456-dyl3j-urls.txt	20224	download
urls-transfer.archivete.am-twitter-@scandilicious1-shallow-20210806-020456-dyl3j.json	342	download job
www.brighteon.com-inf-20210705-000734-abmne-00451.warc.gz	5384804859	download job
www.brighteon.com-inf-20210705-000734-abmne-00451.warc.os.cdx.gz	901886	download
www.brighteon.com-inf-20210705-000734-abmne-00453.warc.gz	6129000546	download job
www.brighteon.com-inf-20210705-000734-abmne-00453.warc.os.cdx.gz	116781	download
www.brighteon.com-inf-20210705-000734-abmne-00454.warc.gz	5371477535	download job
www.brighteon.com-inf-20210705-000734-abmne-00454.warc.os.cdx.gz	596403	download
www.hk01.com-inf-20210706-173959-bdxpx-00222.warc.gz	5368998152	download job
www.hk01.com-inf-20210706-173959-bdxpx-00222.warc.os.cdx.gz	3165834	download
www.interconnections2017.org-inf-20210806-032649-6dtud-00000.warc.gz	39739094	download job
www.interconnections2017.org-inf-20210806-032649-6dtud-00000.warc.os.cdx.gz	113587	download
www.interconnections2017.org-inf-20210806-032649-6dtud-meta.warc.gz	67231	download job
www.interconnections2017.org-inf-20210806-032649-6dtud-meta.warc.os.cdx.gz	47	download
www.interconnections2017.org-inf-20210806-032649-6dtud-wpull.log.gz	64507	download
www.interconnections2017.org-inf-20210806-032649-6dtud.json	257	download job
www.keepsundayspecial.org.uk-inf-20210806-035906-834gk-00000.warc.gz	114601226	download job
www.keepsundayspecial.org.uk-inf-20210806-035906-834gk-00000.warc.os.cdx.gz	231970	download
www.keepsundayspecial.org.uk-inf-20210806-035906-834gk-meta.warc.gz	142736	download job
www.keepsundayspecial.org.uk-inf-20210806-035906-834gk-meta.warc.os.cdx.gz	47	download
www.keepsundayspecial.org.uk-inf-20210806-035906-834gk.json	253	download job
www.lifesitenews.com-inf-20210705-001013-etqrv-00222.warc.gz	5682490354	download job
www.lifesitenews.com-inf-20210705-001013-etqrv-00222.warc.os.cdx.gz	2420199	download
www.lifesitenews.com-inf-20210705-001013-etqrv-00224.warc.gz	5464364520	download job
www.lifesitenews.com-inf-20210705-001013-etqrv-00224.warc.os.cdx.gz	2744216	download
www.lifesitenews.com-inf-20210705-001013-etqrv-00225.warc.gz	5369758423	download job
www.lifesitenews.com-inf-20210705-001013-etqrv-00225.warc.os.cdx.gz	1923980	download
www.mersenneforum.org-inf-20210714-081158-7gczj-00033.warc.gz	5370603075	download job
www.mersenneforum.org-inf-20210714-081158-7gczj-00033.warc.os.cdx.gz	1266603	download
www.onrpg.com-inf-20210711-045924-8ebh9-00049.warc.gz	5368715382	download job
www.onrpg.com-inf-20210711-045924-8ebh9-00049.warc.os.cdx.gz	5510287	download
www.rcmt.net-inf-20210802-134634-255h2-00003.warc.gz	5372749047	download job
www.rcmt.net-inf-20210802-134634-255h2-00003.warc.os.cdx.gz	3121931	download
www.scandilicious.com-inf-20210806-020436-bgo7q-00000.warc.gz	12382517	download job
www.scandilicious.com-inf-20210806-020436-bgo7q-00000.warc.os.cdx.gz	30428	download
www.scandilicious.com-inf-20210806-020436-bgo7q-meta.warc.gz	22784	download job
www.scandilicious.com-inf-20210806-020436-bgo7q-meta.warc.os.cdx.gz	47	download
www.scandilicious.com-inf-20210806-020436-bgo7q.json	245	download job