Skip to content

命令行提交作业

本章主要介绍如何使用命令行eshell进行输入文件的上传,脚本的修改以及作业的提交等操作。

一、上传输入文件

可通过以下三种方式快速上传计算所需的输入文件

  1. 将计算所需的输入文件拖入E-shell命令行区域

15.png

16.png

  1. 使用rz上传命令,上传输入文件。(注:rz命令仅能上传10MB以下的文件)

17.png

  1. 使用平台的文件管理进行上传,具体操作如下

打开控制台>文件管理,参考如下图:

1.png2.png

选择需要上传到哪个资源,点击上传>选择上传方式>选择本地电脑需要上传的文件>点击打开即可上传文件

3.png

更多上传文件方式您可以参考新手指南->上传算例或输入文件,以及进阶指南->文件管理进阶

二、修改脚本

脚本分为普通脚本与图形脚本,本节将以vasp脚本为例,讲述普通脚本如何修改,以starccm图形脚本为例,讲述图形脚本如何修改。

脚本获取方法一:自助购买软件,下单所需软件后,脚本路径为:~/apprepo/软件名/软件版本/case/软件名.slurm(例如:~/apprepo/vasp/6.3.2-optcell_intelmpi2017_hdf5_libxc/case/vasp.slurm)

脚本获取方法二:自定义安装软件,安装完成后咨询在线工程师,编写脚本

  1. 普通脚本(以自助下单的vasp为例)

进入输入文件所在的文件夹,需执行复制脚本命令,将脚本与输入文件放置到同一文件夹下:cp 脚本路径 ./

例如:cp /public/home/wangyg3/apprepo/vasp/6.3.2-optcell_intelmpi2017_hdf5_libxc/case/vasp.slurm ./

复制后,执行查看文件夹下文件命令进行检查:ls

执行命令查看脚本内容:vi 脚本名

2-1.png

脚本内容:

2-2.png

参数含义举例
-J作业名-J vasp
-N提交作业的节点数-N 1
--ntasks-per-node=每节点所用核心数境--ntasks-per-node=32
-p队列名-p kshcnormal
module purge清理当前加载的所有环境module purge
source执行文件source env.sh
  1. 图形脚本(以starccm图形脚本为例)

进入作业提交。

8.png

创建Linux图形。

9.png

在图形管理那一栏,复制相应的主机号和端口。这边复制为vadmin32:2注意:每次开启的都不一样。 10.png

修改下面的脚本,将下面的脚本中的vadmin30:1改为复制的vadmin32:2:

shell
#!/bin/bash
#SBATCH -J starccm+           # 作业的名称 可根据需要自行命名
#SBATCH -p xahcnormal         # 在指定分区中分配资源,根据所拥有的资源修改
#SBATCH -N 1                  # 申请的节点数1个
#SBATCH --ntasks-per-node=32  # 每个节点运行4个任务,使用4个核心

export DISPLAY=vadmin30:1

APP="/work/home/jsyadmin/apprepo/starccmplus/17.06.007-none/app/17.06.007-R8/STAR-CCM+17.06.007-R8/star/bin/starccm+ -power -mesa"

WDIR=`pwd`   #获取当前目录
cd $WDIR

NP=$SLURM_NPROCS
NNODE=`srun hostname |sort |uniq | wc -l`
LOG_FILE=$WDIR/job_${NP}c_${NNODE}n_$SLURM_JOB_ID.log
HOSTFILE=$WDIR/hosts_$SLURM_JOB_ID
srun hostname |sort |uniq -c |awk '{printf "%s:%s\n",$2,$1}' > $HOSTFILE

###############运行主程序
$APP  -machinefile $HOSTFILE -np $NP -rsh ssh  -mpidriver intel

将脚本中的APP后面的路径,改成个人的starccm+的启动路径。

三、提交作业

集群上面推荐是使用slurm命令和slurm脚本提交作业。

1、使用sbatch命令提交作业

准备好输入文件和slurm脚本。

使用命令sbatch slurm脚本名提交作业。

shell
sbatch vasp.slurm  #脚本名可以换成自己的脚本名

12.png

2、查看作业运行状态

使用命令squeue查看作业运行状态。

shell
squeue

13

3、取消作业

先通过squeue查看JOBID,如上图JOBID为27532270,使用命令scancel JOBID取消作业。

shell
scancel 27532270

再次查看作业已经取消。

14.png