城市id应该如何存储？

目前的做法是城市三个id分开存：省、市、县区

开始想着存三个字段，方便搜索，好比搜索某个省的，或某个县区的
但最近发现个情况
如果要查询这个人的家乡的省市县，就会关联[china_area]查询3次表，如果再加个所在地省市县，就会查6次表，这样貌似太浪费了吧！
可是合并在一起，又会影响搜索，大家有什么解决办法吗？

臭鼬

见习助教 167 声望

暂无个人描述~

0 人点赞

从小程序个人账户申请开始，带你一步步进行开发一个微信小程序，直到提交微信控制台上线发布。

从零开始带你一步步开发一个 Go 博客项目，让你在最短的时间内学会使用 Go 进行编码。项目结构很大程度上参考了 Laravel。

推荐文章：

更多推荐...

博客

工作小锦囊系列——如何实现一个车辆预定功能（下） 13 / 15 |

博客

高效办公小技巧——如何批量处理 SQL 文件？ 19 / 10 |

博客

Redis 实用小技巧——如何实现一个排行榜功能 24 / 17 |

博客

经过代理如何获取真实IP 及 laravel 中配置可信代理的原理 16 / 1 |

博客

钱付了，订单还是未支付，用户炸了！——聊聊如何防止支付掉单！ 43 / 25 |

翻译

如何在 Laravel 中创建一个简单的事件流？ 28 / 18 |

讨论数量: 70

见习助教 305 声望

没看明白，区/县编号不是包含了省市编号了吗，为什么还要查三次

1年前评论

臭鼬（楼主）

实际我存的是code码，但意思差不多，给前端数据肯定要变成汉字，那就得关联查询，关联查询三个字段，就会查三次同一张表

MArtian

@臭鼬。。。你做个冗余不行吗？把 code 和汉字都存到用户地址表里，这有什么好纠结的

liuyibao

10 声望

省市区县放在一行，就是最小颗粒度是区/县，搜索？这么少的数据，你太小看数据库的性能了

1年前评论

臭鼬（楼主）

放一行？那搜索的时候只需要某个市的，怎么搞

liuyibao （作者）

@臭鼬可以找一下现在的一些开源库用的表，基本上都是一行的，某个市你不是也要根据省 ID 条件后才有市么，保存最小颗粒度就可以了，数据是有些冗余，不过这个很少变的，用现成的库，别自己创建

Imuyu

课程读者 779 声望

存省份ID，城市ID，县区ID，同时在修改时把省份城市县区名称做冗余字段{"province_name":"北京","city_name":"北京市","district_name":"朝阳区"}用于展示，既方便检索，有在展示的时候不用关联表获取区域名称，唯一缺点就是区域名称发生变更无法及时更新

1年前评论

臭鼬（楼主）

这个方案感觉拆东墙补西墙😄

荭尘宝宝

55 声望

用一张表加个字段parent_id父级id

1年前评论

臭鼬（楼主）

没明白什么意思

cevin

286 声望

用国家统一行政区域划分代码

110110113 每3位拆开。 110北京市110北京市113顺义区

中华人民共和国民政部发布的行政区划代码： www.mca.gov.cn/article/sj/xzqh/202...

1年前评论

臭鼬（楼主）

我知道这个，能聊聊怎么存，怎么关联并且能分开搜索省市县

kis龍

@臭鼬 code 110110113, id, name, 等，查询北京市 code like 110%

臭鼬（楼主）

@kis龍假设查询列表用户同时要有所在省份和市，这个关联查询也只能关联到县区吧

ShanHai1998

@臭鼬在查询市的时候省不就已经带上了？直接用上级的区域code去like查询就好了啊

Junwind

课程读者 520 声望 / 躺平大叔 @ 躺平社区

uid ， uname，省，市，县

1年前评论

helloStar

课程读者 69 声望

前端筛选的时候，后端把区域数据做个级联类型返回，这样前端筛选时，传过来的就是id

1年前评论

臭鼬（楼主）

做列表显示的时候不太行

helloStar （作者）

@臭鼬列表显示就whereIn(array_unique(array_merge(array_column('省')，array_column('市')，array_column('区'))))。一页10条，最多whereIn 30个id，没啥影响的

GeorgeKing

L5.7 译者 716 声望

e.g.:

code: 10010
name: 朝阳区
fullname: 北京市朝阳区
parent_code: 100
-----
code: 1001010
name: XXX 街道
fullname: 北京市朝阳区XXX 街道
parent_code: 10010

fullname 存 string 或者是结构化数据，取决于你在前端怎么用，如果不需要对每个区域丛单独的处理，例如超链接等，那么直接存 string。

1年前评论

臭鼬（楼主）

条件查询怎么解决，查某个市的

GeorgeKing （作者）

@臭鼬你是说模糊查询市级别的地区吗？再加个字段，level 字段用于存储区域级别

臭鼬（楼主）

@GeorgeKing 这个冗余的有点多吧

GeorgeKing （作者）

@臭鼬这个要看你查询的场景了，如果像前面的回答者说的，你只是用于级联选择，确实没必要！空间换时间成本最低，这些冗余数据很少存在更新问题（区域级别不会频繁变动）。

臭鼬（楼主）

@GeorgeKing 如果这么考虑的话，我觉得就冗余到底，三个code存三个字段，在单独存一个string的字段就是省市县的名，需要名字直接这个字段，条件按code三个字段查

GeorgeKing （作者）

@臭鼬三个字段存 code 可能并不是一个好的方案，例如某些直辖市这种，这种设计存在兼容性问题

liuyibao

直辖市也要当成省看待

ShanHai1998

@臭鼬单独查询市级可以按照code长度来筛选的这算取巧

ysxpark

课程读者 11 声望

我们用的每个字行政区都是有拼上上级行政区的, 比如朝阳区冗余了北京北京市朝阳区北京市冗余了北京北京市存三个字段但楼上说的国家统一行政区域划分代码也挺不错的

1年前评论

臭鼬（楼主）

那你们是如何关联数据的，可以单独查某市吗

ysxpark （作者）

@臭鼬想查到市就查外键city_id,这样省级市级都知道了

臭鼬（楼主）

@ysxpark 我好像明白了，那等于存了三个字段，那关联数据得查三遍

ysxpark （作者）

查省市县查一个区id就行了,因为有冗余的上级行政区

如此甚好

76 声望

file

1年前评论

kis龍

西城区 110102 这个可以做 path， 110102 - 110102 % 1000 省， 110102 - 110102 % 100 市

wxf666

66 声望

前端、数据库新手，好奇问一下：

1. 这种表结构不行嘛？

id	level	name	parent_id	child_id_begin	child_id_end
110000000000	0	北京市	0	110000000001	119999999999
110100000000	1	市辖区	110000000000	110100000001	110199999999
110101000000	2	东城区	110100000000	110101000001	110101999999
110102000000	2	西城区	110100000000	110102000001	110102999999
110105000000	2	朝阳区	110100000000	110105000001	110105999999

其中，parent_id、child_id_begin、child_id_end 都可自动生成

1.1 查询广东深圳下的所有区

`SQLite` 代码

SELECT c.id, c.name
  FROM cn_area a
  JOIN cn_area b ON b.id BETWEEN a.cid_begin AND a.cid_end AND b.level = 1 AND b.name LIKE '%深圳%'
  JOIN cn_area c ON c.id BETWEEN b.cid_begin AND b.cid_end AND c.level = 2
 WHERE a.level = 0 AND a.name LIKE '%广东%';

速度

数据库	表大小	用时
`SQLite`	3640 行，无索引，84 KB	0.006 秒

结果

id	name
440301000000	市辖区
440303000000	罗湖区
440304000000	福田区
440305000000	南山区
440306000000	宝安区
440307000000	龙岗区
440308000000	盐田区
440309000000	龙华区
440310000000	坪山区
440311000000	光明区

2. 不能在前端查询数据嘛？

2.1 作为数据库提供

SQLite 有提供 wasm 版，可不依赖后端就能完成查询

整个数据库大小才 84 KB，gzip 压缩后 42 KB，感觉代价不算大？

2.2 作为 `json` 提供

使用以下 SQL：

SELECT json_group_object(format('%d,%s', a.id, a.name),
       (SELECT json_group_object(format('%d,%s', b.id, b.name),
               (SELECT json_group_object(format('%d,%s', c.id, c.name), json('{}'))
                  FROM cn_area c
                 WHERE c.level = 2
                   AND c.id BETWEEN b.cid_begin AND b.cid_end))
          FROM cn_area b
         WHERE b.level = 1
           AND b.id BETWEEN a.cid_begin AND a.cid_end))
  FROM cn_area a
 WHERE a.level = 0;

输出格式化后的 json（大小：106 KB，gzip 后 27 KB）：

{
  "110000000000,北京市": {
    "110100000000,市辖区": {
      "110101000000,东城区": {},
      "110102000000,西城区": {},
      "110105000000,朝阳区": {},

`js` 查询

Object.entries(data)
    .filter(([k]) => k.includes('广东')).flatMap(i => Object.entries(i[1]))
    .filter(([k]) => k.includes('深圳')).flatMap(i => Object.entries(i[1]))
    .map(([k]) => k.split(','))

结果

[
  [ '440301000000', '市辖区' ],
  [ '440303000000', '罗湖区' ],
  [ '440304000000', '福田区' ],
  [ '440305000000', '南山区' ],
  [ '440306000000', '宝安区' ],
  [ '440307000000', '龙岗区' ],
  [ '440308000000', '盐田区' ],
  [ '440309000000', '龙华区' ],
  [ '440310000000', '坪山区' ],
  [ '440311000000', '光明区' ]
]

1年前评论

臭鼬（楼主）

你文字最多，准没错😄，但是你一句话点醒了我【SQLite 有提供 wasm 版，可不依赖后端就能完成查询】，后端完全可以不用去关联查询，让前端通过js解析

wxf666 （作者）

@臭鼬别别别，我是新手，来讨论请教的。原本只知道 SQLite 官网提供了 wasm 版本。又搜了搜，发现这个 sql.js 库也可浏览器内使用 SQLite。这俩 wasm 版本都才几百 KB，感觉代价还可以

wxf666 （作者）

你具体都是些啥需求？

给定地方编号，获取地方全称？

如：110101001015，应给出『北京市市辖区东城区东华门街道王府井社区居委会』?
给出某省/市/区/…，查出往下一级的市/区/县/…？
模糊查询xx省/市/区/…，得到其编号？
（进而通过➀得到全称？）

臭鼬（楼主）

@wxf666
我想的这样存储，条件查询随便查，给前端就是这个code码，js直接解析
Laravel

臭鼬（楼主）

@wxf666 需求是，查询用户或是用户列表能查到所在城市的名称（包括省、市、县区），同时也可以支持省、市、县区任意一个条件查询，不是模糊查询

wxf666 （作者）

根据地区编号，计算路径全称，可以用 (Recursive) CTE （(递归)公共表表达式） 完成：

WITH RECURSIVE
  query(id) AS (
    VALUES (110101000000)
  ),

  parent_of(id, path) AS (
    SELECT pid, name
      FROM query
      JOIN cn_area USING(id)
     UNION ALL
    SELECT pid, name || path
      FROM parent_of
      JOIN cn_area USING(id)
  )

SELECT path
  FROM parent_of
 WHERE id = 0;

省市区任意一个条件精确查询，加个索引就好
（好奇，用户会输入完整的省市区名，让你去精确匹配嘛？比如，用户会打【广西壮族自治区】？）

wxf666 （作者）

@臭鼬或者，其实这样也不慢啊：

SELECT format('%d: %s%s%s%s%s', a.id, e.name, d.name, c.name, b.name, a.name)
  FROM cn_area a
  LEFT JOIN cn_area b ON b.id = a.pid
  LEFT JOIN cn_area c ON c.id = b.pid
  LEFT JOIN cn_area d ON d.id = c.pid
  LEFT JOIN cn_area e ON e.id = d.pid;

我拿 5 级 66W 行试了试，每一行获取全称，在我垃圾 8 代 i5 低压 CPU 笔记本上，只需要 4 秒

输出：

110000000000: 北京市
110100000000: 北京市市辖区
110101000000: 北京市市辖区东城区
110101001000: 北京市市辖区东城区东华门街道
110101001001: 北京市市辖区东城区东华门街道多福巷社区居委会
110101001002: 北京市市辖区东城区东华门街道银闸社区居委会
110101001005: 北京市市辖区东城区东华门街道东厂社区居委会
110101001006: 北京市市辖区东城区东华门街道智德社区居委会
110101001007: 北京市市辖区东城区东华门街道南池子社区居委会
110101001009: 北京市市辖区东城区东华门街道灯市口社区居委会

wxf666 （作者）

@臭鼬试了试在浏览器内，直接在 66W 行地区内，模糊搜索名称，0.2 秒左右（本地是 0.1 秒左右）

wxf666 （作者）

@臭鼬回这个帖子说吧。【通过cdn引入城市数据文件，然后前端里面拿后端给的code码去解析就行】你都用到后端了，为啥不让后端继续给出名字呢？你也看到了，就算是 66W 行的 5 级地区表，浏览器都能每秒 LEFT JOIN 超过十万次，何况你服务器端 3K 行的 3 级地区表呢？

wxf666 （作者）

@臭鼬我觉得前端引入小型数据库，是为了：

提高响应速度、提升用户体验

比如，刚选好【北京】，就能马上显示【东城区、西城区、朝阳区……】，而不是再等 0.几秒
减轻服务器无谓的压力

比如，前端引入一个几百 KB 的 SQLite，和几十 KB 的数据库文件，就能纯前端实现选择地区

但我觉得，你【前端查询后端传来的 code 代表的全称是啥】，好像没达到这俩目标？

（既提高不了啥响应速度，也没减轻多少后端压力？）

臭鼬（楼主）

@wxf666 你看看这个，只有100kb

Laravel

wxf666 （作者）

@臭鼬为啥不在后端就查出来路径全称呢？这样前端连这 100 KB 也不用引入了

臭鼬（楼主）

@wxf666 第一我不用写代码，第二前前端费这点性能九牛一毛，

wxf666 （作者）

@臭鼬这。。后端加几行 LEFT JOIN，就能顺便提取出路径全称了吧。。也算不上几行代码啊。。

我又试了试，如果不输出每一行全称（减少输出带来的性能降低），浏览器端的 SQLite 是可以每秒 LEFT JOIN 超过 160W 次的，更别提你服务器上的高档 MySQL 之类的了

Aoyamakiri

Laravel 9.x 译者 33 声望

一般存IP在需要的时候再查

1年前评论

wxf666

66 声望

@臭鼬噢，我贴一下如何生成这个 66W 行数据库的备忘。（若你感兴趣，也可花一两分钟试一试）

下载并解压大佬爬好的数据：raw.githubusercontent.com/zhiguang...
运行下列 SQL，等待几秒钟，即可生成 new.db（3 级数据为 84 KB，5 级数据为 16.8 MB）：

（下面是 bash 脚本示例）

#!/bin/bash

sqlite3 :memory: <<'EOF'

-- 采用 UTF-16 存储中文，体积较小
PRAGMA encoding = 'UTF-16';

-- 导入 csv 文件至临时表 t，第一行作为列名
.import --csv 2021-flatten-VILLAGE-data.csv t

-- 建表
CREATE TABLE cn_area (
    id          INTEGER  PRIMARY KEY,
    level       INT      NOT NULL,
    name        TEXT     NOT NULL,
    _MASK       JSON     NOT NULL AS ('[1000000000000,10000000000,100000000,1000000,1000]'),
    pid         INT      NOT NULL AS (id - id % _MASK ->> level),
    cid_end     INT      AS (id + _MASK ->> (level + 1) - 1),
    cid_begin   INT      AS (id + 1)
);

-- 按格式抽取并添加需要的数据
INSERT INTO cn_area (id, level, name)
SELECT CASE WHEN code + 0 > 99 THEN code ELSE code * 10000000000 END,
        '{
            "PROVINCE": 0,
            "CITY": 1,
            "COUNTY": 2,
            "TOWN": 3,
            "VILLAGE": 4
        }' ->> ('$.' || level),
        name
FROM t
-- 如果只需要 3 级，可以过滤：
-- WHERE level IN ('PROVINCE', 'CITY', 'COUNTY')
;

-- 丢掉临时表
DROP TABLE t;

-- 整理紧实数据库后，写入磁盘
VACUUM INTO 'new.db';
EOF

1年前评论

php_yt

1.1k 声望

用户表字段。只存一个字段较好，因为北京直辖是没有第三级区级 code 的。

地区文字显示及地名模糊搜索。地区代码表增加全称冗余，如某省某市、某省某市某县。

三级联动。1/不查库，直接缓存全三级数据，或缓存前两级省级地级。2/查库，地区代码表加 level 字段省级1地级2区级3，由上一级向下一级查时，去掉各级的数字位，如省查市以河北为例，前两位13为省级位，like 13% and level = 2，地级查区级以石家庄市为例，前四位为地级，like 1301% and level=3。

由下一级查上一级，如 130102 为例（石家庄市长安区），那么省级 code 为 13+0000，地级 code 为 1301+00，select id,code,level from areas where code in (130102, 130100, 130000) ，再以 level 字段区别三级。

1年前评论

wxf666

为啥都要冗余【地区全名】呢？

连浏览器端几百 KB 的 SQLite，都能在 66W 行的 5 级地区数据库内：

每秒计算出 40W 行【地区编号】对应的【地区全名】
0.1 秒在 66W 行内模糊搜索

更不要说服务器上几百 MB 高端的 MySQL 数据库，只查询 3 级地区库了。。

为啥都这么看不起数据库呢。。

一个人的江湖

Laravel 8.x 译者 344 声望 / 开发 @ 一个人的江湖

CREATE TABLE `areas` (
    `id` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
    `area_id` INT(11) NOT NULL COMMENT '地区id',
    `name` VARCHAR(30) NOT NULL COMMENT '地区名称',
    `short_name` VARCHAR(20) NOT NULL DEFAULT '' COMMENT '地区简称',
    `path` TINYINT(4) NOT NULL DEFAULT '1' COMMENT '路径，省1 市2 区3',
    `area_code` VARCHAR(4) NOT NULL COMMENT '区号',
    `spell` VARCHAR(50) NOT NULL COMMENT '拼音',
    `letter` VARCHAR(15) NOT NULL COMMENT '简拼',
    `first_letter` VARCHAR(1) NOT NULL COMMENT '首字母',
    `status` TINYINT(4) NOT NULL DEFAULT '1' COMMENT '状态 1-正常 2-禁用',
    `parent_id` INT(11) NOT NULL DEFAULT '0' COMMENT '父ID，如果是省份，则父ID为0',
    PRIMARY KEY (`id`) USING BTREE,
)
COMMENT='地区表'
COLLATE='utf8mb4_general_ci'
ENGINE=InnoDB;

1年前评论

liuyibao

10 声望

太多的简单问题复杂化

1年前评论

wxf666

我也觉得是。一个简单的 cn_area(id, level, name) 表，SQLite 暴力查都没性能问题。。

yjrowe

见习助教 10 声望 / 业余搬砖工 @ 码农公司

用MySQL视图可以试试，比如区县视图，包含省市区

1年前评论

zds

见习助教 62 声望 / Developer @ MineAdmin

懒加载

1年前评论

markyanggang

19 声望

这个不就是无限分级么一个表就行有个关键的uuid与pid就行 uuid pid name

1年前评论

wxf666

为嘛要搞 uuid 呢？不能是普通的 AutoIncrement，或者直接拿区划代码做主键吗？

markyanggang （作者）

@wxf666 不要杠...

markyanggang （作者）

@wxf666 正常这东西都是生成josn 前端直接查询匹配的

wxf666

@markyanggang 不是杠，是真的数据库和前端新手，不太懂 uuid、Auto Increment、区划代码做主键，分别适合什么场景，会有啥后果（目前不喜欢 uuid 做主键，太大；喜欢区划代码做主键，又小又快，还能节省索引）

wxf666

@markyanggang 为啥不用些诸如 SQLite 的数据库，替代 json 存储和 js 查询呢？

感觉加载一个 gzip 后 200 ~ 300 KB 的 SQLite，和 400 KB 的 4 级地区库，就能在浏览器上，利用几十行的 SQL 完成：

省市区街道 4 级联动
在 4.5W 条地区数据内 10 毫秒模糊搜索名称
5 毫秒内识别 7 条地址的省/市/区/街道（模仿地址智能识别库）

看起来引入 SQLite 数据库非常划算啊：

体积小 （SQLite 本身和 4 级库 gzip 后，总共才 600 ~ 700 KB）
速度快
内存占用低 （我加载【地址智能识别】的 4 级 json后，占用大概 20 MB 内存，足够我加载完整的 5 级数据库了）
代码量也少 （上面那些功能，总共加起来少于 100 行 SQL）

lizzj

13 声望

id(自增) code(非重) name(北京) alias_name(京) level (province,city,county,town,) 四级 pid(省默认为0), province_id, province_name, city_id, city_name, county_id, county_name, town_id, town_name, area_path(北京市--北京市--xx区--xx街道--xx)

最后输出的时候 Transformer 遇到北京市--北京市的这种情况直接删除一个

1年前评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

城市id应该如何存储？

目前的做法是城市三个id分开存：省、市、县区

推荐文章：

1. 这种表结构不行嘛？

1.1 查询广东深圳下的所有区

`SQLite` 代码

速度

结果

2. 不能在前端查询数据嘛？

2.1 作为数据库提供

2.2 作为 `json` 提供

`js` 查询

结果

输出：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

城市id应该如何存储？

目前的做法是城市三个id分开存：省、市、县区

推荐文章：

1. 这种表结构不行嘛？

1.1 查询广东深圳下的所有区

SQLite 代码

速度

结果

2. 不能在前端查询数据嘛？

2.1 作为数据库提供

2.2 作为 json 提供

js 查询

结果

输出：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录

`SQLite` 代码

2.2 作为 `json` 提供

`js` 查询