最近因工作需要,需要在数据库中对某些字段进行Url编码,但个人未找到官方函数,瞄了下Url编码的原理,索性自己用凑合着用的正则知识写了个凑合着用的自定义函数,话不多说,代码先行:
PostgreSQL函数:
CREATE OR REPLACE FUNCTION "public"."fun_urlencode"("s_value" text )
RETURNS "pg_catalog"."varchar" AS $BODY$
DECLARE
s_hex varchar(64);
s_Result varchar(2048);
i_valuelen int;
i_len int;
BEGIN
s_Result :='';
i_valuelen :=LENGTH(s_value);
i_len :=1;
while i_len <= i_valuelen
LOOP
s_hex := substr(s_value, i_len, 1);
s_Result :=s_Result ||
case when s_hex ~ '^(?![;|/|?|:|@|&|=|+|$|,|<|>|#|%|"|{ }|||\|^|[|]|`|:])([\x00-\xff])'
then s_hex when s_hex ~ '[\s]' then '+'
else regexp_replace(encode(s_hex::bytea,'hex'),'(?=(?:[\x00-\xff]{2})+$)','%','g')
end;
i_len :=i_len+1;
END LOOP;
return s_Result;
end;
$BODY$
LANGUAGE plpgsql VOLATILE
COST 100;
通过查询发现urlencode的规则大致是将需要转换的内容(ASCII码形式之外的内容),用十六进制表示法转换出来,并在每个字符前加上%开头,其中需要注意的是先排除特殊字符、以及空格特殊处理;
所以我这里先用正则匹配字符串符合ASCII码的字符且排除须转义特殊字符,然后判断“+”,最后转为16进制的字符每隔两位加上%进行拼接,至此编码后的字符就出来了。
下面是我通过C#进行验证的结果:
C#代码
static void Main(string[] args)
{
var strDecode = "2020年01月07日,+-, ():@祝大家在新的一年里 工作顺利、家庭幸福!";
var strEncode = "2020%e5%b9%b401%e6%9c%8807%e6%97%a5%ef%bc%8c%2b-%2c+()%3a%40%e7%a5%9d%e5%a4%a7%e5%ae%b6%e5%9c%a8%e6%96%b0%e7%9a%84%e4%b8%80%e5%b9%b4%e9%87%8c+%e5%b7%a5%e4%bd%9c%e9%a1%ba%e5%88%a9%e3%80%81%e5%ae%b6%e5%ba%ad%e5%b9%b8%e7%a6%8f%ef%bc%81";
Console.WriteLine("原字符串:");
Console.WriteLine(strDecode);
Console.WriteLine("数据库编码:");
Console.WriteLine(strEncode);
Console.WriteLine("C#编码:");
Console.WriteLine(HttpUtility.UrlEncode(strDecode, Encoding.UTF8));
Console.WriteLine("C#解码:");
Console.WriteLine(HttpUtility.UrlDecode(strEncode, Encoding.UTF8));
Console.ReadKey();
}
测试结果:
因为只是满足了我目前的需求,有无隐藏的问题以及效率方面没有去深究,如果有更好的做法或者写法求指点一二。
相关借鉴链接:
1、url原理:https://www.jianshu.com/p/8435fac043d6
2、url中允许哪些符号:https://www.zhihu.com/question/24474922/answer/33358420