Item archiveteam_archivebot_go_20200728050001

Filename	Size
archiveteam_archivebot_go_20200728050001.cdx.gz	47354911	download
archiveteam_archivebot_go_20200728050001.cdx.idx	43302	download
archiveteam_archivebot_go_20200728050001_files.xml	0	download
archiveteam_archivebot_go_20200728050001_meta.sqlite	141312	download
archiveteam_archivebot_go_20200728050001_meta.xml	968	download
ase.tufts.edu-shallow-20200728-021523-ad8tg-00000.warc.gz	35485	download job
ase.tufts.edu-shallow-20200728-021523-ad8tg-00000.warc.os.cdx.gz	715	download
ase.tufts.edu-shallow-20200728-021523-ad8tg-meta.warc.gz	3824	download job
ase.tufts.edu-shallow-20200728-021523-ad8tg-meta.warc.os.cdx.gz	47	download
ase.tufts.edu-shallow-20200728-021523-ad8tg.json	282	download job
beinecke.library.yale.edu-inf-20200727-181453-847gd-00013.warc.gz	5478022040	download job
beinecke.library.yale.edu-inf-20200727-181453-847gd-00013.warc.os.cdx.gz	15294	download
beinecke.library.yale.edu-inf-20200727-181453-847gd-00014.warc.gz	5548787411	download job
beinecke.library.yale.edu-inf-20200727-181453-847gd-00014.warc.os.cdx.gz	20574	download
beinecke.library.yale.edu-inf-20200727-181453-847gd-00017.warc.gz	5368780913	download job
beinecke.library.yale.edu-inf-20200727-181453-847gd-00017.warc.os.cdx.gz	1196725	download
big5.cri.cn-inf-20200719-230814-2nxf5-00066.warc.gz	5384847831	download job
big5.cri.cn-inf-20200719-230814-2nxf5-00066.warc.os.cdx.gz	20019	download
ektoplazm.com-inf-20200704-233408-66i1h-00084.warc.gz	5523632091	download job
ektoplazm.com-inf-20200704-233408-66i1h-00084.warc.os.cdx.gz	17343	download
ezfm.cri.cn-inf-20200726-015445-d14vm-00044.warc.gz	5648359495	download job
ezfm.cri.cn-inf-20200726-015445-d14vm-00044.warc.os.cdx.gz	1457	download
forum.bitcoin.com-inf-20200719-011400-e6clt-00029.warc.gz	5368764332	download job
forum.bitcoin.com-inf-20200719-011400-e6clt-00029.warc.os.cdx.gz	5969931	download
forum.index.hu-inf-20200725-081034-2s530-00004.warc.gz	5369334766	download job
forum.index.hu-inf-20200725-081034-2s530-00004.warc.os.cdx.gz	7009660	download
forums.bohemia.net-inf-20200603-013635-egbvu-00127.warc.gz	6229397918	download job
forums.bohemia.net-inf-20200603-013635-egbvu-00127.warc.os.cdx.gz	886957	download
hlj.cri.cn-inf-20200727-220715-29lpx-00001.warc.gz	5369107615	download job
hlj.cri.cn-inf-20200727-220715-29lpx-00001.warc.os.cdx.gz	1555766	download
hlj.cri.cn-inf-20200727-220715-29lpx-00002.warc.gz	1536332610	download job
hlj.cri.cn-inf-20200727-220715-29lpx-00002.warc.os.cdx.gz	347714	download
hlj.cri.cn-inf-20200727-220715-29lpx-meta.warc.gz	1858660	download job
hlj.cri.cn-inf-20200727-220715-29lpx-meta.warc.os.cdx.gz	47	download
hlj.cri.cn-inf-20200727-220715-29lpx.json	239	download job
longnow.org-inf-20200727-174924-25ski-00005.warc.gz	5385692593	download job
longnow.org-inf-20200727-174924-25ski-00005.warc.os.cdx.gz	1197219	download
player.fm-inf-20200501-233943-6recr-00731.warc.gz	5368943187	download job
player.fm-inf-20200501-233943-6recr-00731.warc.os.cdx.gz	242969	download
urls-transfer.notkiska.pw-VimeoHarryPotterVideoPagesSiteUrls.txt-shallow-20200728-021840-7lvgl-00000.warc.gz	45679821	download job
urls-transfer.notkiska.pw-VimeoHarryPotterVideoPagesSiteUrls.txt-shallow-20200728-021840-7lvgl-00000.warc.os.cdx.gz	80042	download
urls-transfer.notkiska.pw-VimeoHarryPotterVideoPagesSiteUrls.txt-shallow-20200728-021840-7lvgl-meta.warc.gz	50071	download job
urls-transfer.notkiska.pw-VimeoHarryPotterVideoPagesSiteUrls.txt-shallow-20200728-021840-7lvgl-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-VimeoHarryPotterVideoPagesSiteUrls.txt-shallow-20200728-021840-7lvgl-urls.txt	929	download
urls-transfer.notkiska.pw-VimeoHarryPotterVideoPagesSiteUrls.txt-shallow-20200728-021840-7lvgl.json	370	download job
urls-transfer.notkiska.pw-facebook-@UFEntomology-shallow-20200727-153921-30c4j-00002.warc.gz	1356036056	download job
urls-transfer.notkiska.pw-facebook-@UFEntomology-shallow-20200727-153921-30c4j-00002.warc.os.cdx.gz	1171536	download
urls-transfer.notkiska.pw-facebook-@UFEntomology-shallow-20200727-153921-30c4j-meta.warc.gz	2728678	download job
urls-transfer.notkiska.pw-facebook-@UFEntomology-shallow-20200727-153921-30c4j-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-facebook-@UFEntomology-shallow-20200727-153921-30c4j-urls.txt	799880	download
urls-transfer.notkiska.pw-facebook-@UFEntomology-shallow-20200727-153921-30c4j.json	338	download job
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-00011.warc.gz	6013345968	download job
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-00011.warc.os.cdx.gz	75891	download
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-00012.warc.gz	5371771142	download job
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-00012.warc.os.cdx.gz	273153	download
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-00013.warc.gz	9242827184	download job
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-00013.warc.os.cdx.gz	1949004	download
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-00014.warc.gz	2622812928	download job
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-00014.warc.os.cdx.gz	73286	download
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-meta.warc.gz	3796852	download job
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v-urls.txt	614728	download
urls-transfer.notkiska.pw-facebook-@longnow-shallow-20200727-180833-e9v6v.json	330	download job
urls-transfer.notkiska.pw-pdl.warnerbros.comdomainHarryPotterMoviePageURLs.txt-shallow-20200728-021306-dnw8c-00000.warc.gz	443296453	download job
urls-transfer.notkiska.pw-pdl.warnerbros.comdomainHarryPotterMoviePageURLs.txt-shallow-20200728-021306-dnw8c-00000.warc.os.cdx.gz	19374	download
urls-transfer.notkiska.pw-pdl.warnerbros.comdomainHarryPotterMoviePageURLs.txt-shallow-20200728-021306-dnw8c-meta.warc.gz	12828	download job
urls-transfer.notkiska.pw-pdl.warnerbros.comdomainHarryPotterMoviePageURLs.txt-shallow-20200728-021306-dnw8c-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-pdl.warnerbros.comdomainHarryPotterMoviePageURLs.txt-shallow-20200728-021306-dnw8c-urls.txt	31395	download
urls-transfer.notkiska.pw-pdl.warnerbros.comdomainHarryPotterMoviePageURLs.txt-shallow-20200728-021306-dnw8c.json	398	download job
urls-transfer.notkiska.pw-twitter-%23BlackTwitter-shallow-20200710-163004-dpwry-00067.warc.gz	5379477285	download job
urls-transfer.notkiska.pw-twitter-%23BlackTwitter-shallow-20200710-163004-dpwry-00067.warc.os.cdx.gz	1066901	download
urls-transfer.notkiska.pw-twitter-%23BlackTwitter-shallow-20200710-163004-dpwry-00068.warc.gz	5406373226	download job
urls-transfer.notkiska.pw-twitter-%23BlackTwitter-shallow-20200710-163004-dpwry-00068.warc.os.cdx.gz	1034574	download
urls-transfer.notkiska.pw-twitter-%23eclipse2017-shallow-20200717-124458-9ofq2-00053.warc.gz	5368751220	download job
urls-transfer.notkiska.pw-twitter-%23eclipse2017-shallow-20200717-124458-9ofq2-00053.warc.os.cdx.gz	4677158	download
urls-transfer.notkiska.pw-twitter-%23lunareclipse-shallow-20200717-120056-2o0pl-00038.warc.gz	5371933094	download job
urls-transfer.notkiska.pw-twitter-%23lunareclipse-shallow-20200717-120056-2o0pl-00038.warc.os.cdx.gz	5720648	download
urls-transfer.notkiska.pw-twitter-%23notmypresident-shallow-20200530-220957-2c0z0-00251.warc.gz	5588586319	download job
urls-transfer.notkiska.pw-twitter-%23notmypresident-shallow-20200530-220957-2c0z0-00251.warc.os.cdx.gz	1225072	download
urls-transfer.notkiska.pw-twitter-%23notmypresident-shallow-20200530-220957-2c0z0-00252.warc.gz	5378605775	download job
urls-transfer.notkiska.pw-twitter-%23notmypresident-shallow-20200530-220957-2c0z0-00252.warc.os.cdx.gz	1875447	download
urls-transfer.notkiska.pw-twitter-%23qanon-shallow-20200531-053932-8yw79-00219.warc.gz	7280721348	download job
urls-transfer.notkiska.pw-twitter-%23qanon-shallow-20200531-053932-8yw79-00219.warc.os.cdx.gz	1852879	download
urls-transfer.notkiska.pw-twitter-%23solareclipse-shallow-20200717-130008-7hu44-00024.warc.gz	5433817298	download job
urls-transfer.notkiska.pw-twitter-%23solareclipse-shallow-20200717-130008-7hu44-00024.warc.os.cdx.gz	2270267	download
urls-transfer.notkiska.pw-twitter-@longnow-shallow-20200727-175651-9b8oi-00014.warc.gz	5379781483	download job
urls-transfer.notkiska.pw-twitter-@longnow-shallow-20200727-175651-9b8oi-00014.warc.os.cdx.gz	398777	download
urls-transfer.notkiska.pw-twitter-@longnow-shallow-20200727-175651-9b8oi-00016.warc.gz	5454922056	download job
urls-transfer.notkiska.pw-twitter-@longnow-shallow-20200727-175651-9b8oi-00016.warc.os.cdx.gz	372831	download
urls-transfer.notkiska.pw-twitter-@longnow-shallow-20200727-175651-9b8oi-00017.warc.gz	5368859368	download job
urls-transfer.notkiska.pw-twitter-@longnow-shallow-20200727-175651-9b8oi-00017.warc.os.cdx.gz	889784	download
www.cs.tufts.edu-shallow-20200728-021048-1hmao-00000.warc.gz	3797	download job
www.cs.tufts.edu-shallow-20200728-021048-1hmao-00000.warc.os.cdx.gz	219	download
www.cs.tufts.edu-shallow-20200728-021048-1hmao-meta.warc.gz	3486	download job
www.cs.tufts.edu-shallow-20200728-021048-1hmao-meta.warc.os.cdx.gz	47	download
www.cs.tufts.edu-shallow-20200728-021048-1hmao.json	257	download job
www.gamestar.de-shallow-20200728-032418-7bmou-00000.warc.gz	1942732	download job
www.gamestar.de-shallow-20200728-032418-7bmou-00000.warc.os.cdx.gz	8203	download
www.gamestar.de-shallow-20200728-032418-7bmou-meta.warc.gz	8706	download job
www.gamestar.de-shallow-20200728-032418-7bmou-meta.warc.os.cdx.gz	47	download
www.gamestar.de-shallow-20200728-032418-7bmou.json	316	download job
www.nrm.se-inf-20200728-015105-7lh8g-00000.warc.gz	525320515	download job
www.nrm.se-inf-20200728-015105-7lh8g-00000.warc.os.cdx.gz	573552	download
www.nrm.se-inf-20200728-015105-7lh8g-meta.warc.gz	407227	download job
www.nrm.se-inf-20200728-015105-7lh8g-meta.warc.os.cdx.gz	47	download
www.nrm.se-inf-20200728-015105-7lh8g.json	285	download job
www.nrm.se-inf-20200728-022704-bloao-00000.warc.gz	994636650	download job
www.nrm.se-inf-20200728-022704-bloao-00000.warc.os.cdx.gz	534508	download
www.nrm.se-inf-20200728-022704-bloao-meta.warc.gz	338350	download job
www.nrm.se-inf-20200728-022704-bloao-meta.warc.os.cdx.gz	47	download
www.nrm.se-inf-20200728-022704-bloao.json	282	download job
www.nrm.se-inf-20200728-024724-djaoz-00000.warc.gz	13625	download job
www.nrm.se-inf-20200728-024724-djaoz-00000.warc.os.cdx.gz	227	download
www.nrm.se-inf-20200728-024724-djaoz-meta.warc.gz	3506	download job
www.nrm.se-inf-20200728-024724-djaoz-meta.warc.os.cdx.gz	47	download
www.nrm.se-inf-20200728-024724-djaoz.json	271	download job
www.nrm.se-inf-20200728-024913-9rrwb-00000.warc.gz	87711810	download job
www.nrm.se-inf-20200728-024913-9rrwb-00000.warc.os.cdx.gz	167498	download
www.nrm.se-inf-20200728-024913-9rrwb-meta.warc.gz	109091	download job
www.nrm.se-inf-20200728-024913-9rrwb-meta.warc.os.cdx.gz	47	download
www.nrm.se-inf-20200728-024913-9rrwb-wpull.log.gz	106380	download
www.nrm.se-inf-20200728-024913-9rrwb.json	279	download job
www.nrm.se-inf-20200728-025554-90xl0-00000.warc.gz	973150557	download job
www.nrm.se-inf-20200728-025554-90xl0-00000.warc.os.cdx.gz	586019	download
www.nrm.se-inf-20200728-025554-90xl0-meta.warc.gz	382728	download job
www.nrm.se-inf-20200728-025554-90xl0-meta.warc.os.cdx.gz	47	download
www.nrm.se-inf-20200728-025554-90xl0.json	292	download job
www.nrm.se-inf-20200728-032241-4igri-00000.warc.gz	4950868	download job
www.nrm.se-inf-20200728-032241-4igri-00000.warc.os.cdx.gz	7741	download
www.nrm.se-inf-20200728-032241-4igri-meta.warc.gz	9095	download job
www.nrm.se-inf-20200728-032241-4igri-meta.warc.os.cdx.gz	47	download
www.nrm.se-inf-20200728-032241-4igri.json	289	download job
www.rodeland.de-inf-20200728-013912-43y0m-00000.warc.gz	6545	download job
www.rodeland.de-inf-20200728-013912-43y0m-00000.warc.os.cdx.gz	312	download
www.rodeland.de-inf-20200728-013912-43y0m-meta.warc.gz	3571	download job
www.rodeland.de-inf-20200728-013912-43y0m-meta.warc.os.cdx.gz	47	download
www2.nrm.se-inf-20200727-180839-4q3oi-00001.warc.gz	2753281775	download job
www2.nrm.se-inf-20200727-180839-4q3oi-00001.warc.os.cdx.gz	3668952	download
www2.nrm.se-inf-20200727-180839-4q3oi-meta.warc.gz	5260858	download job
www2.nrm.se-inf-20200727-180839-4q3oi-meta.warc.os.cdx.gz	47	download
www2.nrm.se-inf-20200727-180839-4q3oi.json	240	download job