面试题 / 1364 / 7 / 创建于 2年前
如题
借助第三方服务,比如mongo、redis等等,数据插入redis,set类型之类的,在导出就是去过重的
队列命令 慢慢删除重复数据即可 注意这个慢慢 的频率 其实 数据才千万 从中删除重复的 可能百万的样子 你弄个几十秒就足够跑完命令了 。
分治
大数据量 布隆过滤器
我要举报该,理由是:
推荐文章: