一个 issue 为 NutsDB 测试 10 亿数据分享

大家好, 想给大家分享下我最近为 nutsdb 做的数据测试。

测试项目

github 地址: https://github.com/xujiajun/nutsdb

起因

事情起因是这个 issue ,简单说就是内存高了,不够用了。

验证测试一亿条数据

回到正题: 为了验证这个 issue 于是我先测了一个亿的数据量

版本:nutsdb V0.4.0
服务器配置:Ubuntu  16.04 64 位 8 核 64G
数据量:占有 11G 左右 (目前版本没有做压缩)
为了加快测试,没有设置实时 sync,写入速度:25.7w/s

key\value 类似:

key := []byte("namename" + strconv.Itoa(i))
val := []byte("valvalvavalvalvalvavalvalvalvavalvalvalvaval" + strconv.Itoa(i))

测试结果:

Mem : 64430 MB , Free: 63776 MB , Used:176 MB , Usage:0.273957%
start db index cost time:  72.076µs
batch put data cost:  6m29.067011134s
Mem : 64430 MB , Free: 24760 MB , Used:39147 MB , Usage:60.759105%

发现 消耗内存是数据量的 3.46 倍左右,说实话虽然比他说的少几倍,但我还是有点接受不了。怎么办?

解决

于是开发了新的模式 EntryIdxMode:HintBPTSparseIdxMode, 专门为节约内存设计。\
master 分支 已经支持了,有兴趣的欢迎尝试。

那我们单机先来测试 10 亿条数据。

新模式测试 10 亿条数据

版本 :nutsdb master 分支
主机配置:Ubuntu 16.04 64 位 2 核 2G
key\value 类似上面的
为了加快测试,没有设置实时 sync

测试结果:

Mem : 1999 MB , Free: 1786 MB , Used:53 MB , Usage:2.688618%
Mem : 1999 MB , Free: 1695 MB , Used:135 MB , Usage:6.784733%

内存占用只有 82MB,完成 10 亿条数据插入,但是写速度降到 4.35w/s。产生索引数据文件 153G。

最后,欢迎给nutsdb 提 issue,点 Star 关注,提交 PR,谢谢!

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!