正则表达式解析http的bodyContent输出key-value

概述

近来一个同事给了一个文本要求写一个正则表达式解析。
文本如下

bodyContent:----------------------------964864704429906130621362
Content-Disposition: form-data; name="messageid"

PO
----------------------------964864704429906130621362
Content-Disposition: form-data; name="method"

putPOData
----------------------------964864704429906130621362
Content-Disposition: form-data; name="timestamp"

2022-02-16 13:48:19
----------------------------964864704429906130621362
Content-Disposition: form-data; name="format"

json
----------------------------964864704429906130621362
Content-Disposition: form-data; name="data"

{"xmldata":{"header":[{"CUSTOMERID":"201","EXPECTSTORAGEDATE":"","INOUTTYPE":1,"NOTES":"2019-2020下单提货","ORDERNO":"1001A2100000002DSYYS","ORDERTYPE":"21-Cxx-01","POCREATIONTIME":"2022-02-16 11:08:24","POREFERENCE2":"","POREFERENCE4":"CD20122021600131","SUPPLIERID":"201S10068","SUPPLIER_NAME":"xxx股份有限公司","USERDEFINE2":"陈xx","USERDEFINE3":"0124011","WAREHOUSEID":"WH01","detailsItem":[{"CUSTOMERID":"201","LOTATT01":"","LOTATT02":"","LOTATT04":"","LOTATT06":"浙械注准20192400498","LOTATT07":"肌钙蛋白I测定试剂盒(免疫荧光干式定量法)","LOTATT08":"N","NOTES":"","ORDEREDQTY":10,"ORDEREDQTY_EACH":10,"ORDERNO":"CD20122021600131","SKU":"694117919349","USERDEFINE1":"1001A2100000002DSYYT","USERDEFINE2":"1001A2100000002DSYYS"}]}]}}
----------------------------964864704429906130621362
Content-Disposition: form-data; name="OperationCode"

FLUXWMSJSAPI.operation
----------------------------964864704429906130621362--

这是一个http的body内容块，我稍微删除了几段，期望解析得到：
messageid：PO
method：putPOData
timestamp：2022-02-16 13:48:19
等。

思路

找出要匹配的文本块，类似：

name="messageid"

PO

首先将要查找的部分用通配符替换，把要匹配的部分用括号括起来。

name="(\S+)"[\n\r]+([ \S]+)

其中：

\S 表示非换行符
\n\r 表示换行和回车符
+ 表示至少一次
因为timestamp和data的内容部分的日期部分有空格，所以后面用到了[ \S]+

可以将正则表达式和文本拷贝到超好用的正则测试网站，输出结果符合预期：

image.png

如果不合适就调整正则表达式，根据表达式全集去调整。
要得到代码，可以使用正则表达式在线测试|菜鸟工具

image.png

需要稍作调整，
比如javascript语言部分：

<script>
// 定义 正则 RegExp 对象
var pattern = new RegExp('name="(\\S+)"[\\n\\r]+([ \\S]+)',"g");
// 简化写法
// var pattern = /name="(\S+)"[\n\r]+([ \S]+)/g;

// 用 `` 括起长文本
var str = `
这里是长文本
`;

//console.log(str);
console.log(pattern);

// 匹配结果
var arr = null;
while(arr = pattern.exec(str)){
    console.log(arr[1]);
    console.log(arr[2]);
    console.log('\n\r');
}
</script>

用到了pattern.exec()和while循环。

php语言的写法：

<?php
$str = '这里是长文本';
// 或者使用
$str = <<<heredoc
这里是长文本
heredoc;
$isMatched = preg_match_all('/name="(\S+)"[\n\r]+([ \S]+)/', $str, $matches);
var_dump($str, $isMatched, $matches);
// $isMatched 匹配数量
// $matches 匹配结果，二维数组
// $matches[0] 是最外层的字符串 $matches[1]匹配的第1个括号  $matches[2]匹配的第2个括号

用到长文本表示，preg_match_all()。

java语言：

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;


public class ZhengzeTest {

    public static String txt2String(File file) {
        StringBuilder result = new StringBuilder();
        try {
            BufferedReader br = new BufferedReader(new FileReader(file));//构造一个BufferedReader类来读取文件
            String s = null;
            while ((s = br.readLine()) != null) {//使用readLine方法，一次读一行
                result.append(System.lineSeparator() + s);
            }
            br.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
        return result.toString();
    }

    public static void main(String[] args) {
        File file = new File("D:\\java\\code\\java-example\\src\\helloworld.txt");
        String str = txt2String(file);
//        System.out.println(str);

        String pattern = "name="(\\S+)"[\\n\\r]+([ \\S]+)";
        Pattern r = Pattern.compile(pattern);
        Matcher m = r.matcher(str);
        while (m.find()) { // 多个匹配结果，此处用while循环遍历
//            System.out.println(m.group(0)); // 匹配的完整字符串
            System.out.println(m.group(1)); // 匹配的第1个括号的内容，此处为key
            System.out.println(m.group(2)); // 匹配的第2个括号的内容，此处为value
            System.out.println();
        }
    }
}

用到了文件操作，while。

得到期望的结果：

image.png

最后编辑于：2022.02.18 14:49:43

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,772评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,458评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,610评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,640评论 1赞 276
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,657评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,590评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,962评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,631评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,870评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,611评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,704评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,386评论 4赞 319
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,969评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,944评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,179评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 44,742评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,440评论 2赞 342

正则表达式解析http的bodyContent输出key-value

概述

思路

推荐阅读更多精彩内容