Linux shell中提取文件名和路径

前言

有个软件叫HLAreporter,它真的搞人,基本上就是shell脚本联合起来的,关键是居然还有各种小问题,其中之一就是关于文件名和目录名这个,导致程序只能在软件本身的目录运行,然后各种bug,于是我就修改了一部分,里面对文件名和目录名进行了处理。通常的操作是由路径中提取出文件名,从路径中提取出目录名,提取文件后缀名,相对路径转换为绝对路径等等。

下面介绍几种方法进行相关的操作,这些我都使用过的。
首先假设我的文件全称:/home/luna/Desktop/Software/softHLA/HLAreporter.v103/HLAreporter.sh.

获取文件名

使用${}${str##*/}

这个命令的作用就是去掉变量str从左边算起的最后一个/字符及其左边的内容,返回的值是从左边算起的最后一个/(不含该字符)的右边的所有内容,例子很简单:

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103/HLAreporter.sh
file=${str##*/}
echo $file
HLAreporter.sh ## 运行结果

使用awk语句

因为在ubuntu下面,路径都是以/为隔开的,那么我们就以/为分隔符,然后把最后部分打印,赋值,例子如下:

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103/HLAreporter.sh
file=`echo $str | awk -F "/" '{print $NF}'`
echo $file
HLAreporter.sh

使用官方函数basename

bash shell本身提供了basename命令,可以直接获取路径名最后的文件名,实现代码如下:

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103/HLAreporter.sh
file=$(basename $str)
echo $file
HLAreporter.sh

后缀和文件名分开

使用${}

在这里分别使用/.作为分隔符来进行处理,代码如下:

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103/HLAreporter.sh
file=${str##*/}
filename=${file%.*}
suffix=${file##*.}
echo $file, $filename, $suffix
HLAreporter.sh, HLAreporter, sh

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103.tar.gz
file=${str##*/}
filename=${file%%.*}
suffix=${file#*.}
echo $file, $filename, $suffix
HLAreporter.v103.tar.gz, HLAreporter, v103.tar.gz

用的是Shell的参数扩展(Parameter Extension)功能,解释如下:

${str##*/}: 从左边开始删除str中最大匹配(longest matching pattern) */ 的字符串
${str%/*}:从右边开始删除str中最小匹配(shortest matching pattern) /* 的字符串
${file##*.}:从左边开始删除file中最大匹配(longest matching pattern) *. 的字符串
${file%.*}:从右边开始删除file中最小匹配(shortest matching pattern) .* 的字符串
${file%%.*}:从右边开始删除file中最大匹配(longest matching pattern) .* 的字符串
${file#*.}:从左边开始删除file中小匹配(shortest matching pattern) *. 的字符串
#:表示从左边算起第一个
%:表示从右边算起第一个
##:表示从左边算起最后一个
%%:表示从右边算起最后一个
换句话来说,#总是表示左边算起,%总是表示右边算起。

参数扩展有多种形式,在shell编程中可以用作参数的拼接,字符串的替换,参数列表截取,变量初值等操作,这里不再详述,请参考右边的功能列表和官方文档.

参数扩展功能列表

参数形式 扩展后
x{y,z} xy xz
${x}{y, z} {x}y{x}z
{x}{y,z} {x}y{x}${z}
${param#pattern} 从param前面删除pattern的最小匹配
${param##pattern} 从param前面删除pattern的最大匹配
${param%pattern} 从param后面删除pattern的最小匹配
${param%%pattern} 从param后面删除pattern的最大匹配
${param/pattern/string} 从param中用string替换pattern的第一次匹配,string可为空
${param//pattern/string} 从param中用string替换pattern的所有匹配,string可为空
${param:3:2} 截取$param中索引3开始的2个字符
${param:3} 截取$param中索引3至末尾的字符
${@:3:2} 截取参数列表$@中第3个开始的2个参数
${param:-word} param为空或未设置,则参数式返回word,param不变
${param:+word} param为非空,则参数式返回word,param不变
${param:=word} param为空或为设置,则参数式返回word,同时param设置为word
${param:?message} 若$param为空或为设置,则输出错误信息message,若包含空白符,则需引号

获取路径名

使用${}${str%/*}

去掉变量var从右边算起的第一个'/'字符及其右边的内容,返回从右边算起的第一个'/'(不含该字符)的左边的内容。使用例子及结果如下:

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103/HLAreporter.sh
path=${str%/*}
echo $path
/home/luna/Desktop/Software/softHLA/HLAreporter.v103

使用awk语句

分隔符,混合正则表达式:

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103/HLAreporter.sh
path=`echo $str | awk -F '/[^/]*$' '{print $1}'`
echo $path
/home/luna/Desktop/Software/softHLA/HLAreporter.v103
## 或者使用for循环
path=`echo $str | awk 'BEGIN{res=""; FS="/";}{ for(i=2;i<=NF-1;i++) res=(res"/"$i);} END{print res}'`
/home/luna/Desktop/Software/softHLA/HLAreporter.v103

使用官方函数dirname

bash shell本身提供了basename命令,可以直接获取路径名最后的文件名,实现代码如下:

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103/HLAreporter.sh
path=$(dirname $str)
echo $path
/home/luna/Desktop/Software/softHLA/HLAreporter.v103

获取文件夹下的文件名

str=/home/luna/Desktop/Software/softHLA/HLAreporter.v103
if [ -d "$str" ]; then
    for file in $(ls $str/)
    do
        echo $file
    done
fi
HLAfreq.sh
HLAreporter.README
HLAreporter.sh
HLAreporter_manual
Hydra-Version-0.5.3
Init.sh
bam2fastq-1.1.0
bin
database
docs
freq
mytest
qualityprofile
results
samtools
ssake_v3-8-tar
temp

相对路径转换为绝对路径

对于 Linux 系统,绝对路径和相对路径的判断十分简单:是否以斜线开头;
绝对路径以 / 开头;
相对路径不以 / 开头;

script=../../../HLAreporter.sh
dir=$(cd $(dirname $script); pwd)
or
dir=`cd $(dirname $script); pwd`
or
dir=echo `cd $(dirname $script); pwd`
echo $dir
/home/luna/Desktop/Software/softHLA/HLAreporter.v103

参考

Shell 截取文件名和后缀

Linux shell 之 提取文件名和目录名的一些方法

Perl4::CoreLibs

                                —— dulunar 后记于 2019.11
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343