问答 / 0 / 2 / 创建于 4年前
方案一:通过group查询时间段内的cookie(每小时查询一次),然后再继续通过这些cookie作为条件,再继续group今天的cookie,就可以获取,可通过mysql直接实现,时间较长
方案二:通过分页查询累加存储到数组,通过数组进行匹配进新匹配计算,但是数据量一大就内存不足
像这种访问日志建议走 MQ,用户访问时将访问数据写入 MQ,然后消费端对数据进行分析和存储。 对于这种数据量大的且不变的数据可以考虑采用 Clickhouse 这样的列存储数据库,性能比 MySQL 高几十上百倍。
这种不是用redis来做吗?过滤重复存起来就行;然后可以维护一个所有访客的一个数据集当布隆过滤器;每日的访客去判断一下,不存在这个过滤器就是新访客
我要举报该,理由是:
推荐文章: