如何实现mysql实时同步到clickhouse
场景:最近项目项目中的个别表比如日志、订单等相关的表数据越来越大,几乎上千万了,以后可能还会越来越大。很多业务场景已经慢慢支撑不住了,估计以后mysql连接工具打开这个表都会卡,更别说搞一些订单统计报表等等
想法:以前见过别人用clickhouse查询很快很快,原理好像是把mysql同步到clickhouse,然后查clickhouse
方案:想着如何mysql插入,然后同步到clickhouse,针对一些大表把model连接改成clickhouse。但是卡在实时同步到clickhouse这一步了,本地搭建了一个CloudCanal,试了一下好像只insert,不update和delete
比如我mysql更新ID为3的数据,clickhouse这边就会有2条ID为3的数据,一条是原数据,一条更新过的数据。而且这个CloudCanal同步表的时候会额外生成2个字段,一个是_sign,一个_version。
问题求助:如何让mysql实时同步到clickhouse,不是增量同步,是实时同步,并且不生成额外字段。不管是工具,还是啥,大家给我一个方案。我不擅长python或者go等语言,尽可能的有那种现成的工具最好
本作品采用《CC 协议》,转载必须注明作者和本文链接
推荐文章: