百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

原来批量重命名文件shell里有这么多讲究

nanshan 2024-11-06 11:15 17 浏览 0 评论

根据您可用的非标准工具的不同,有许多不同的方法可以实现这一目标。即使只使用标准的 POSIX 工具,您仍然可以执行大多数简单的情况。我们先展示可移植工具的示例。

您可以使用循环和一些参数扩展来执行大多数非递归的批量重命名,示例如下:

# POSIX
# 将所有的*.foo重命名为*.bar
for f in *.foo; do mv -- "$f" "${f%.foo}.bar"; done

要在实际执行之前检查命令会做什么,可以在 mv 之前添加 echo。这适用于本页上几乎所有的示例,因此我们不再重复提及。

# POSIX
# 这将从所有文件中删除扩展名.zip。
for file in ./*.zip; do mv "$file" "${file%.zip}"; done

"--" 和 "./*" 用于防止以 "-" 开头的问题文件名。您只需要其中一个,不需要同时使用两个,选择您喜欢的即可。

以下是使用 Bash 特定的参数扩展的一些类似示例:

# Bash
# 将所有的空格替换为下划线
for f in *\ *; do mv -- "$f" "${f// /_}"; done

有关处理文件名中不方便字符的更多技巧,请参阅 FAQ#20。

# Bash
# 将 "foo" 替换为 "bar",即使它不是扩展名
for file in ./*foo*; do mv "$file" "${file//foo/bar}"; done

以上所有示例都为每个文件调用一次外部命令 mv(1),因此它们可能不像某些非标准实现那样高效。

递归重命名文件

如果您想要递归地重命名文件,这将变得更具挑战性。以下示例演示了如何将所有*.foo文件递归重命名为*.bar:

# Bash
# 还需要GNU或BSD的find(1)
# 递归地将所有*.foo文件更改为*.bar

find . -type f -name '*.foo' -print0 | while IFS= read -r -d '' f; do
  mv -- "$f" "${f%.foo}.bar"
done

此示例使用Bash 4的globstar?而不是GNU find:

# Bash 4
# 递归地将所有文件中的"foo"替换为"bar"。
# "foo"不能出现在目录名中!

shopt -s globstar
for file in /path/to/**/*foo*; do
    mv -- "$file" "${file//foo/bar}"
done

递归重命名最棘手的部分是确保您不会更改路径名的目录部分,因为像这样的操作注定会失败:

mv "./FOO/BAR/FILE.TXT" "./foo/bar/file.txt"

因此,任何递归重命名命令都应仅更改每个路径名的文件名部分,如下所示:

mv "./FOO/BAR/FILE.TXT" "./FOO/BAR/file.txt"

如果您还需要重命名目录,应该单独进行。此外,递归目录重命名应该以深度优先(仅在每个实例中更改目录名的最后组件)或多次进行。在一般情况下,深度优先效果更好。

以下是一个使用深度优先递归的示例脚本(将名称中的空格转换为下划线,但您只需要更改ren()?函数来执行您想要的任何操作),以重命名文件和目录。同样,可以轻松修改它,使其仅在文件或仅在目录上执行操作,或者仅在具有特定扩展名的文件上执行操作,以避免或强制覆盖文件等等:

# Bash
ren() {
  local newname
  newname=${1// /_}
  [[ $1 != "$newname" ]] && mv -- "$1" "$newname"
}

traverse() {
  local file
  cd -- "$1" || exit
  for file in *; do
    [[ -d $file ]] && traverse "$file"
    ren "$file"
  done
  cd .. || exit
}

# 主程序
shopt -s nullglob dotglob
traverse /path/to/startdir

另一种递归重命名所有包含空格的目录和文件的方法:

find . -depth -name "* *" -exec bash -c 'dir=${1%/*} base=${1##*/}; mv "$1" "$dir/${base// /_}"' _ {} \;

或者,如果您的find版本支持,以下方式更高效,因为它一次运行一个bash而不是每个文件运行一个bash:

find . -depth -name "* *" -exec bash -c 'for f; do dir=${f%/*} base=${f##*/}; mv "$f" "$dir/${base//空格转换为下划线}"; done' _ {} +

大写和小写

要使用标准工具将文件名转换为小写,您需要能够接受混合大小写的文件名作为输入,并将其转换为小写版本作为输出。在Bash 4及更高版本中,有一种参数展开的方法可以实现:

# Bash 4
for f in *[[:upper:]]*; do mv -- "$f" "${f,,}"; done

否则,tr(1)可能会有所帮助:

# tolower - 将文件名转换为小写
# POSIX
for file do
    [ -f "$file" ] || continue                # 忽略不存在的文件名
    newname=$(printf %s "$file" | tr '[:upper:]' '[:lower:]')     # 转换为小写
    [ "$file" = "$newname" ] && continue      # 无需操作
    [ -f "$newname" ] && continue             # 不要覆盖现有文件
    mv -- "$file" "$newname"
done

这个示例将无法处理以换行符结尾的文件名,因为CommandSubstitution会将其吞掉。解决这个问题的方法是在命令替换中附加一个字符,然后在之后将其删除。例如:

newname=$(printf %sx "$file" | tr '[:upper:]' '[:lower:]')
newname=${newname%x}

我们使用了高级范围表示法,因为在某些locales上,tr在使用A-Z范围时可能会表现得非常奇怪:

imadev:~$ echo Hello | tr A-Z a-z
héMMó

为了确保在使用范围时不会遇到意外情况,要么使用高级范围表示法,要么将区域设置为C。

imadev:~$ echo Hello | LC_ALL=C tr A-Z a-z
hello
imadev:~$ echo Hello | tr '[:upper:]' '[:lower:]'
hello
# 这两种方法都可以。

请注意,GNU tr不支持多字节字符(如非ASCII UTF-8字符)。因此,在GNU系统上,您可能更喜欢使用:

# GNU
sed 's/.*/\L&/g'
# POSIX
awk '{print tolower($0)}'

这种技术也可用于替换文件名中的所有不需要的字符,例如使用'_'(下划线)。脚本与上面的示例相同,只需更改"newname=..."这一行即可。

# renamefiles - 重命名文件名包含异常字符的文件
# POSIX
for file do
    [ -f "$file" ] || continue            # 忽略非常规文件等
    newname=$(printf '%s\n' "$file" | sed 's/[^[:alnum:]_.]/_/g' | paste -sd _ -)
    [ "$file" = "$newname" ] && continue  # 无需操作
    [ -f "$newname" ] && continue         # 不要覆盖现有文件
    mv -- "$file" "$newname"
done

方括号[]中的字符类包含我们要保留的所有字符(^后面的字符);根据需要进行修改。[:alnum:]范围表示当前区域设置的所有字母和数字。但请注意,它不会替换不构成有效字符的字节(如使用错误字符集编码的字符)。

以下是一个修改后的示例,使用参数展开代替sed:

# renamefiles(更高效、不太便携的版本)
# Bash/Ksh/Zsh
for file in "$@"; do
   [[ -f "$file" ]] || continue
   newname=${file//[![:alnum:]_.]/_}
   [[ "$file" = "$newname" ]] && continue
   [[ -e "$newname" ]] && continue
   [[ -L "$newname" ]] && continue
   mv -- "$file" "$newname"
done

需要注意的是,所有这些示例都涉及到竞态条件。如果在[ -e "$newname" ...?和mv "$file" ...?之间创建了一个现有文件,那么该文件可能会被覆盖。解决此问题超出了本页面的范围,但可以通过为mv命令添加-i?选项和(GNU特定的)-T?选项来减轻其影响。

最后,关于更改文件名大小写的说明:在使用GNU mv时,在许多文件系统上,尝试将文件重命名为其小写或大写等效名称可能会失败。(例如,在使用FAT或NTFS文件系统的DOS/Windows系统上的Cygwin,以及在使用HFS+处于不区分大小写模式的Mac OS X系统上的GNU mv。还有在挂载了Windows/Mac文件系统的Linux系统上,以及可能是其他许多设置。)GNU mv在尝试重命名之前会检查目标名称,并且由于文件系统的映射,它认为目标“已经存在”:

mv README Readme    # 在FAT文件系统等上使用GNU mv会失败

解决此问题的方法是将文件重命名两次:首先将其重命名为与原始名称完全不同的临时名称,然后再重命名为所需名称。

mv README tempfilename &&
mv tempfilename Readme

非标准工具

如果您的计算机上安装了mmv(1)实用程序,您可以使用以下命令将文件名转换为小写:

# 将所有文件名转换为小写
mmv "*" "#l1"

一些GNU/Linux发行版提供了rename(1)命令,但语法在不同的发行版之间有所差异。Debian使用perl rename脚本(以前包含在Perl中,现在不再包含),将其安装为prename(1)和rename(1)。Red Hat使用完全不同的rename(1)命令。

prename脚本非常灵活。例如,可以用它来将文件名转换为小写:

# 将所有文件名转换为小写
prename '$_=lc($_)' ./*

或者也可以使用:

# 将所有文件名转换为小写
prename 'y/A-Z/a-z/' ./*

如果要让prename在处理UTF-8编码的文件时使用Unicode而不是ASCII:

# 使用Unicode规则将所有文件名转换为小写
PERL_UNICODE=SA rename '$_=lc' ./*

要使用当前locale字符集对文件名进行操作:

rename 'BEGIN{use Encode::Locale qw(decode_argv);decode_argv} $_=lc'

(请注意,它仍然不会使用locale的大小写转换规则。例如,在土耳其语环境中,I将被转换为?,而不是i)。

或者递归地进行操作:

# 递归地将所有文件名转换为小写(假设find实现支持非标准的-execdir谓词)
#
# 注意:这不会更改目录名。这是因为-execdir在运行命令之前会将当前目录更改为父目录。这意味着尽管有+,但每个文件重命名都会执行一个prename命令。
find . -type f -name '*[[:upper:]]*' -execdir prename '$_=lc($_)' {} +

更高效和可移植的方法:

find . -type f -name '*[[:upper:]]*' -exec prename 's{[^/]*$}{lc()}e' {} +

或者将所有下划线替换为空格:

prename 's/_/ /g' ./*_*

使用$EDITOR(来自moreutils)以交互方式重命名文件:

vidir

或者递归地进行操作:

find . -type f | vidir -

(注意:vidir无法处理文件名中包含换行符的情况。)

更多

如果您觉得文章内容对你有一点帮助可以关注我,我在头条平台会持续分享更多实用的shell技巧和最佳实践,如果想系统的快速学习shell的各种高阶用法和生产环境避坑指南可以看看《shell脚本编程最佳实践》专栏,专栏里有更多的实用小技巧和脚本代码分享。

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: