分析 curl 结果时遇到的问题

请求一个curl结果

var=`curl -l "http://www.kuaidi100.com/query?type=yuantong&postid=11111111111"`

意图是想对返回的json数据进行如下处理：
匹配出结果中的几对key-value

#错误示例
$val | grep -o -P '\"abstract\":.*?(?=,)'

结果是提示文件名过长，且可能存在的空格会导致commond not found
显然这里我是使用错误了

将请求的结果保存在文件中再读取：

cat file |  grep -o -P '\"abstract\":.*?(?=,)'

可以取到结果，但事实上整个流程是在循环中进行的

sudo rm -rf data/res.log
while read query
    do
        var=$(command)
        echo 'kw:'$query',var:'$var >> data/res.log;
    done < querys.log

还是希望能直接在循环中直接处理完结果

尝试把grep的操作拼接在var中即：

var=`curl -l "http://www.kuaidi100.com/query?type=yuantong&postid=11111111111" | grep -o -P '\"context\":.*?(?=,)'`

#之前随便找的一个api接口，没想到失效了，这里备一份
{
    "message": "ok",
    "nu": "11111111111",
    "ischeck": "1",
    "com": "yuantong",
    "status": "200",
    "condition": "F00",
    "state": "3",
    "data": [
        {
            "time": "2020-01-09 09:43:08",
            "context": "查无结果",
            "ftime": "2020-01-09 09:43:08"
        }
    ]
}

确实可以取到想要的结果。
但是，如果想要取多对数据应该怎么处理？
望不吝赐教，感谢！

grep

crhhoho

课程读者 29 声望

暂无个人描述~

0 人点赞

我们将带你从零开发一个项目并部署到线上，本课程教授 Web 开发中专业、实用的技能，如 Git 工作流、Laravel Mix 前端工作流等。

从零开始带你一步步开发一个 Go 博客项目，让你在最短的时间内学会使用 Go 进行编码。项目结构很大程度上参考了 Laravel。

推荐文章：

更多推荐...

博客

整理一些Linux相关知识，防止自己脑瘫 | 持续更新... 38 / 8 |

博客

Linux 实用小技巧 —— 如何判断 Crontab 是否正常执行 12 / 10 |

博客

Linux 操作必备 150 个命令 18 / 2 |

博客

Nginx统计访问IP并排序 33 / 11 |

翻译

博客

最好的 Linux 桌面版---- Windows 10 安装体验 39 / 21 |

acHao

版主 844 声望

最佳答案

原始问题中使用 shell 的 grep ，grep 确实学习起来有些困难，是个渐进和经验积累的过程。就处理json来说支持楼上建议。就作者原始问题，我有个使用 grep 的解决办法，抛砖引玉。

原问中处理的关键是 grep ，而且使用 -o 选项保证只输出匹配，-P 选项使用 perl 语言正则表达式，这里它主要使用了 perl 中的锚定断言功能，即正则表达式最后的 '?(?=,)' 那部分。

对于想取多对数据的需要，我们可以使用正则中'或'匹配功能，如上问题中提供的网址取回的json数据，想取 ftime，context 和 location 的键值对，可将正则表达式写成 '\"(ftime|context|location)\":.*?(?=,|})' ，可试试如下2个命令：

$ var=`curl -l "http://www.kuaidi100.com/query?type=yuantong&postid=11111111111"` 
$ echo $var | grep -o -P '\"(ftime|context|location)\":.*?(?=,|})'

我的输出：

"ftime":"2020-01-13 20:02:36"
"context":"【嘉兴市】 快件离开 【嘉兴中转部】 已发往 【广州中心】"
"location":""
"ftime":"2020-01-13 20:00:41"
"context":"【嘉兴市】 快件已经到达 【嘉兴中转部】"
"location":""
"ftime":"2020-01-13 18:21:01"
"context":"【嘉兴市】 快件离开 【平湖】 已发往 【佛山中心】"
"location":""
"ftime":"2020-01-13 17:26:25"
"context":"【嘉兴市】 【平湖】（0573-85095087、0573-85086225） 的 小范（15857303586） 已揽收"
"location":""

不知是否是需要的结果。

6年前评论

crhhoho （楼主）

十分感谢，回答得很完整。您的回答完全满足我目前所需

讨论数量: 3

LzqCOOL

66 声望

你输入的命令可以给出相应的结果!

下面是我对问题的回答：

该链接http://baike.baidu.com/api/openapi/BaikeLemmaCardApi?scope=103&format=json&appid=379020&bk_key=%E9%93%B6%E9%AD%82&bk_length=600，我开始访问是返回errno 2，通过搜索知道这是百度百科的接口，可能还要权限，然后就无法知道该JSON数据格式。
对于一个JSON数据，要原生操作需要技巧，可使用awk，但想简单处理应该使用别人的轮子，比如 jq （shell下的json解释）。
最后实觉得linux下处理麻烦，可使用python，网络请求，处理json易如反掌。

6年前评论

crhhoho （楼主）

感谢回答！这个问题提出来前其实已经用python解决了，再提出来主要是想解决它。因为我对shell不了解，有点搜索无门的感觉。所以提出来希望能得到些指点

Wi1dcard

管理员 2.1k 声望

用 jq 吧。

6年前评论

acHao

版主 844 声望

原始问题中使用 shell 的 grep ，grep 确实学习起来有些困难，是个渐进和经验积累的过程。就处理json来说支持楼上建议。就作者原始问题，我有个使用 grep 的解决办法，抛砖引玉。

原问中处理的关键是 grep ，而且使用 -o 选项保证只输出匹配，-P 选项使用 perl 语言正则表达式，这里它主要使用了 perl 中的锚定断言功能，即正则表达式最后的 '?(?=,)' 那部分。

对于想取多对数据的需要，我们可以使用正则中'或'匹配功能，如上问题中提供的网址取回的json数据，想取 ftime，context 和 location 的键值对，可将正则表达式写成 '\"(ftime|context|location)\":.*?(?=,|})' ，可试试如下2个命令：

$ var=`curl -l "http://www.kuaidi100.com/query?type=yuantong&postid=11111111111"` 
$ echo $var | grep -o -P '\"(ftime|context|location)\":.*?(?=,|})'

我的输出：

"ftime":"2020-01-13 20:02:36"
"context":"【嘉兴市】 快件离开 【嘉兴中转部】 已发往 【广州中心】"
"location":""
"ftime":"2020-01-13 20:00:41"
"context":"【嘉兴市】 快件已经到达 【嘉兴中转部】"
"location":""
"ftime":"2020-01-13 18:21:01"
"context":"【嘉兴市】 快件离开 【平湖】 已发往 【佛山中心】"
"location":""
"ftime":"2020-01-13 17:26:25"
"context":"【嘉兴市】 【平湖】（0573-85095087、0573-85086225） 的 小范（15857303586） 已揽收"
"location":""

不知是否是需要的结果。

6年前评论

crhhoho （楼主）

十分感谢，回答得很完整。您的回答完全满足我目前所需

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

分析 curl 结果时遇到的问题

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

分析 curl 结果时遇到的问题

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录