在命令行中运行R脚本,可以使用Rscript practice.R
的方式,其中practice.R是我们希望运行的脚本。在Linux和Unix系统中,有一种更简介的方式,即通过在脚本第一行添加#! /usr/bin/env Rscript
的方式,来告诉操作系统这段脚本的要调用Rscript来运行。此时只要进入到practice.R所在的路径中,使用命令./practice.R便可以直接运行这段代码。类似地,如果是一段Python3脚本的话,我们可以使用#! /usr/bin/env Python3
argparse is an R package which provides a command line parser to be used with Rscript to write "#!" shebang scripts that gracefully accept positional and optional arguments and automatically generate usage.
argparse包分为三个步骤:
- 使用
ArgumentParser()
创建一个参数解析对象 - 使用
add_argument()
为前面的对象增加参数 - 通过
parse_args()
把解析对象赋值并在后续程序中调用
我们可以先把下面的脚本储存成为example.R,这段脚本的作用是输出若干个随机数,具体的随机分布与输出参数数量由命令行参数决定。
#! /usr/bin/env Rscript
library(argparse)
# 创建参数解析对象
parser <- ArgumentParser()
# 设置参数
# 设置第一个参数verbose,缩写为v,其作用是告诉脚本是否打印完整的计算过程,其缺省值为TRUE
parser$add_argument("-v", "--verbose", action="store_true", default=TRUE,
help="Print extra output [default]")
# 设置第二个参数quietly,缩写为q,其作用是修改verbose参数,当调用改参数时,verbose被修改为FALSE,从而导致不再打印计算过程
parser$add_argument("-q", "--quietly", action="store_false",
dest="verbose", help="Print little output")
# 设置第三个参数count,缩写为c,这是一个整数参数,缺省值5,在后续的代码中被用作确定输出随机数的个数
parser$add_argument("-c", "--count", type="integer", default=5,
help="Number of random normals to generate [default %(default)s]",
metavar="number")
# 设置第四个参数generator,无缩写,用于确定调用何种随机分布,缺省值rnorm对应于正态分布
parser$add_argument("--generator", default="rnorm",
help = "Function to generate random deviates [default \"%(default)s\"]")
# 设置第五个参数mean,无缩写,浮点数,用于确定正态分布的均值,缺省值为0
parser$add_argument("--mean", default=0, type="double",
help="Mean if generator == \"rnorm\" [default %(default)s]")
# 设置第五个参数sd,无缩写,浮点数,用于确定正态分布的标准差,缺省值为1
parser$add_argument("--sd", default=1, type="double",
metavar="standard deviation",
help="Standard deviation if generator == \"rnorm\" [default %(default)s]")
# 调用解析器,此时args就被赋值为命令行参数输入的相应值
args <- parser$parse_args()
# 根据verbose确定是否打印计算过程
if ( args$verbose ) {
write("writing some verbose output to standard error...\n", stderr())
}
# 根据其他参数,确定输出随机数的类型与次数
if( args$generator == "rnorm") {
cat(paste(rnorm(args$count, mean=args$mean, sd=args$sd), collapse="\n"))
} else {
cat(paste(do.call(args$generator, list(args$count)), collapse="\n"))
}
cat("\n")
首先修改脚本的权限,为其添加可执行权限
sudo chmod +x example.R
然后便可以使用了
- 查看帮助
./example.R --help
- 执行脚本
./practice.R
使用参数输出3个正态分布随机数
./practice.R --mean=10 --sd=10 --count=3
也可以输出均匀分布随机数,并且选择不打印计算过程
./practice.R --quiet -c 4 --generator="runif"
参考:
Data Science at the Command Line
argparse: Command line optional and positional argument parser