一些键值对转字典或表格（实在是想不出来了，不是那种标准格式的键值对，求大佬给个思路）

问答 / 0 / 7 / 创建于 3年前

一些键值对转字典或表格（实在是想不出来了，不是那种标准格式的键值对）
如上图，a没有值（不只是第一个键没有值，后边的键不一定有没有值），距离b两个空格，
后续的b和c都有值，且与值之间两个空格，
但是也有不听话的(d)，有值但中间三个空格
需要处理成:
a:
b:1
c:2
d:3
类似的就可以，主要是键值对出来就可以了
最后附上类似字符串：
a: b: 1 c: 2 d: 3

quinn_

11 声望

暂无个人描述~

0 人点赞

推荐文章：

更多推荐...

置顶

[进度 100.00%] Python Masonite 4.0 中文翻译召集（Python 中的类 Laravel 框架） 15 / 19 |

公告

Python Masonite 框架中文翻译召集（Python 中的类 Laravel 框架） 24 / 25 |

博客

收集了一些各大网站 python 的登陆方式,希望对学习 python 的小白，和想写爬虫的你们有所帮助,,本项目用于研究和分享各大网站的模拟登陆方式 17 / 5 |

翻译

Python 3.7 的一些新特性 10 / 2 |

链接

快速掌握一个语言最常用的 50% 11 / 1 |

翻译

使用 Python 一步步搭建自己的区块链 22 / 1 |

Jason990420

1.9k 声望 / 個人 @ 個人

最佳答案

正则式最重要的就是找出问题的规则, 原问题与后面再提出的问题, 很明显两者的规则不一样, 也就是说你先问了一个不相关的问题, 这会浪费彼此的时间.

import re
import pprint

text = '主题: 安全 ID: NT AUTHORITY\SYSTEM 帐户名: SNAB 账户域: BIZ 登陆类型: 5 登录失败的账户: 安全ID: NULL SID'

# Split by white spaces if Chinese/English/digit characters and ':' after it.
regex1 = re.compile(r"\s+(?=[\u4e00-\u9fa5_A-Za-z0-9]+:)")
items = regex1.split(text)

# Split each item by ":" and white spaces, also the special case when no value.
regex2 = re.compile(r":\s+")
result = list(map(lambda x:regex2.split(x) if ' ' in x else [x, ''], items))

pprint.pprint(dict(result))

{'ID': 'NT AUTHORITY\\SYSTEM',
 '主题': '安全',
 '安全ID': 'NULL SID',
 '帐户名': 'SNAB',
 '登录失败的账户:': '',
 '登陆类型': '5',
 '账户域': 'BIZ'}

3年前评论

quinn_ （楼主）

很抱歉起初因为数据保密的原因举了一个不相关的例子，现在这个答案很接近了，很感谢您的再次回答，我会将其选为正确答案，谢谢

讨论数量: 7

Jason990420

1.9k 声望 / 個人 @ 個人

import re

text = 'a:  b:  1  c:  2  d:    3'

regex = re.compile(r"""
    (\w+)   # 1st Capturing Group, matches any [a-zA-Z0-9_], between one and unlimited times
    :       # matches the character :
    \s+     # matches any [\r\n\t\f\v ], between one and unlimited times
    (\w*)   # 2nd Capturing Group, matches any [a-zA-Z0-9_], between zero and unlimited times
    (?!:)   # Negative Lookahead, Assert that the Regex below does not match
    """,
    re.VERBOSE,
)
items = regex.findall(text)
result = dict(items)
print(result)

{'a': '', 'b': '1', 'c': '2', 'd': '3'}

3年前评论

quinn_ （楼主）

很感谢您提供的正则的思路，但是原始数据并不是简单的a,b,c,1,2,3。奈何我就是学不会正则，我放一下原始数据，您看下能不能分离。

例:
主题: 安全 ID: NT AUTHORITY\SYSTEM 帐户名: SNAB 账户域: BIZ 登陆类型: 5 登录失败的账户: 安全ID: NULL SID

我这边发出去后，所有空格显示只有一个空格，我以为哦截一个图
Python

quinn_ （楼主）

如果不能分离的话，我觉得可以把每个key都写进一个列表，然后通过key来找vaule，然后输出，感觉可以实现

Jason990420

1.9k 声望 / 個人 @ 個人

正则式最重要的就是找出问题的规则, 原问题与后面再提出的问题, 很明显两者的规则不一样, 也就是说你先问了一个不相关的问题, 这会浪费彼此的时间.

import re
import pprint

text = '主题: 安全 ID: NT AUTHORITY\SYSTEM 帐户名: SNAB 账户域: BIZ 登陆类型: 5 登录失败的账户: 安全ID: NULL SID'

# Split by white spaces if Chinese/English/digit characters and ':' after it.
regex1 = re.compile(r"\s+(?=[\u4e00-\u9fa5_A-Za-z0-9]+:)")
items = regex1.split(text)

# Split each item by ":" and white spaces, also the special case when no value.
regex2 = re.compile(r":\s+")
result = list(map(lambda x:regex2.split(x) if ' ' in x else [x, ''], items))

pprint.pprint(dict(result))

{'ID': 'NT AUTHORITY\\SYSTEM',
 '主题': '安全',
 '安全ID': 'NULL SID',
 '帐户名': 'SNAB',
 '登录失败的账户:': '',
 '登陆类型': '5',
 '账户域': 'BIZ'}

3年前评论

quinn_ （楼主）

很抱歉起初因为数据保密的原因举了一个不相关的例子，现在这个答案很接近了，很感谢您的再次回答，我会将其选为正确答案，谢谢

sxyclys

课程读者 0 声望 / 产品经理 @ 寰烁股份

    text = '主题: 安全 ID: NT AUTHORITY\SYSTEM 帐户名: SNAB 账户域: BIZ 登陆类型: 5 登录失败的账户: 安全ID: NULL SID'
    text_list = text.split(' ')
    target_dict = dict()
    print(text_list)
    for cu in text_list:
        if ':' in cu:
            cu_key = cu.replace(':', '')
            target_dict[cu_key] = None
        else:
            if cu != '':
                if target_dict[cu_key] is None:
                    target_dict[cu_key] = cu
                else:
                    target_dict[cu_key] = target_dict[cu_key] + ' ' + cu
    print(target_dict)

结果

{'主题': '安全', 'ID': 'NT AUTHORITY\\SYSTEM', '帐户名': 'SNAB', '账户域': 'BIZ', '登陆类型': '5', '登录失败的账户': None, '安全ID': 'NULL SID'}

3年前评论

quinn_ （楼主）

可能我描述的有些问题，我想要的答案应该是
‘主题’:’’,’安全 ID’:’NT AUTHORITY\SYSTEM’,’帐户名’:’SNAB’,’账户域’: ‘BIZ’,’登陆类型’:’5’,’登录失败的账户’:’’,’安全ID’:’NULL SID’

因为有些key没有值，比如主题、登陆失败的账户。
并且上一个人已经给出了类似正确的答案并且我已经将他选为问题的答案，感谢您的方案

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

一些键值对转字典或表格（实在是想不出来了，不是那种标准格式的键值对，求大佬给个思路）

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

一些键值对转字典或表格（实在是想不出来了，不是那种标准格式的键值对，求大佬给个思路）

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录