题目:有一个包含100亿个URL的文件,假设每个URL占用64B,请找出其中所有重复的URL。 补充问题:某搜索公司一天的用户搜索词汇是海量的(百亿数据量),请设计一种求出每天热门 Top100 词汇的可行办法。