讨论数量:
百万题库量不算大啊,不行就蛮干吧 从第一题开始,每7个字建立一个编码,0000000001=>'ABCDEFG' ,后面每道题的7个字先查询在插入,查询存在的话,标记,按平均每道题40~50字计算,这也就每道题40来个编码,总计4000来万数据。。。
每道题平均0.05s处理时间,这算很慢的吧,也就10多个小时跑完了,晚上跑起第二天就好了
100 万条答案,每条 800 字,每连续 7 个字哈希一下记录到位图,大约需要 1000000 * 800 位,也就 100 MB 内存。
不过哈希会冲突,你可以加大内存,或者记录以下原始的 7 个字做一下冲突处理。
推荐文章: