系统环境:Ubuntu 10.04 LTS x86_64 硬件环境:32cpu 目的:安装Torque 2.4.x
1. 解压源码包 tar xzf torque-2.4.6.tar.gz 2. 编译并安装至/usr/local/torque目录下,安装需要root权限 cd torque-2.4.6/ ./configure --prefix=/usr/local/torque make -j 8 sudo -s make install ./torque.setup root 3. 配置环境,以计算机名Node1为例 gedit /etc/hosts 添加或修改 127.0.0.1 Node1 localhost gedit /etc/profile 添加: #Torque
export PATH=/usr/local/torque/bin:/usr/local/torque/sbin PATH source /etc/profile
默认情况下,Torque的主目录在 /var/spool/torque下 因此,到该目录下进行其他环境变量的设置: cd /var/spool/torque vi server_priv/nodes 添加: Node1 np=32 即计算机名和CPU数目 vi mom_priv/config 添加: $pbs_server = 127.0.0.1vi server_name 添加: Node1 4. 启动client daemon pbs_mom 5. 重启pbs server daemon qterm pbs_server 6. 启动scheduler daemon pbs_sched 7. 检查服务是否正确启动 ps -aux | grep pbs #check all is running
qstat -q #check the presence of the queue
qmgr -c 'p s' #check server & queue settings
pbsnodes -a #check if the nodes are listed and up8. 配置列队 qmgr -c "set queue batch resources_default.walltime = 360:00:00"
qmgr -c "set server query_other_jobs = True"
qmgr -c "set queue batch resources_max.ncpus=32"9. 测试列队 首先退出root exit source /etc/profile echo "sleep 30" | qsub
qstat 10. 配置开启启动 cd到torque-2.4.6/contrib/init.d目录下 vi debian.pbs_mom 将DAEMON=/usr/local/sbin/$NAME改为DAEMON=/usr/local/torque/sbin/$NAME 相同的,修改 debian.pbs_sched和debian.pbs_server的DAEMON=/usr/local/sbin/$NAME为DAEMON=/usr/local/torque/sbin/$NAME 将这三个文件复制到/etc/init.d/目录下 sudo cp debian.pbs_mom /etc/init.d/pbs_mom sudo cp debian.pbs_sched /etc/init.d/pbs_sched sudo cp debian.pbs_server /etc/init.d/pbs_server sudo update-rc.d pbs_server defaults sudo update-rc.d pbs_mom defaults sudo update-rc.d pbs_sched defaults 装得还是有点迷糊,不过好在这次成功了。 提交列队后: mxio@Node1:~$ qstat
Job id Name User Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
2.localhost STDIN mxio 0 R batch 补记: 让torque发送任务信息邮件 系统要求安装好sendmail 因此: sudo apt-get install sendmail sudo apt-get install mailutils 此时测试是否启动 ps aux |grep sendmail 显示: root 1592 0.0 0.0 90476 2556 ? Ss 16:39 0:00 sendmail: MTA: accepting connections
mxio 2570 0.0 0.0 7628 956 pts/0 S+ 16:49 0:00 grep --color=au
to sendmail
You have mail in /var/mail/mxio
测试是否可以正常发送邮件: 编写一般的邮件: 显示: Cc,抄送,跳过按enter Subject: 输入内容,完成后按ctrl+D结束编辑发送 当目标邮箱接收到邮件后,说明配置正确。 如果之前没有配置sendmail,那么torque需要重新编译安装,正常顺序即可 编写PBS时添加: 即可接收 其中:-m abe a 是任务终止邮件 b是任务开始邮件 e是任务结束邮件,正常情况下,全开abe会接收到2封邮件 -M 是目标邮件地址 接收任务结束的邮件: Torque Qmgr设置: qmgr -c 'p s' 查看列队设置 qmgr -c 'set server xxx=xxx' 设置server列队参数 qmgr -c 'unset server xxx' 取消server xxx的设置 qmgr -c 'set server managers += mxio@Node1' qmgr -c 'set server operators += mxio@Node1' 在"="号前加"+"表示附加条件,本例为添加mxio为管理员 qmgr create queue xxx 建立xxx列队 qmgr delete queue xxx 删除xxx列队 qmgr -c 'set server mail_from = mxio' 设置发送邮件人,这样发件人就是 mxio 进入 sendmail的设置环节,需要root身份: su - vi /etc/mail/submit.mc 将:dnl MASQUERADE_AS()dnl 改为: MASQUERADE_AS(`126.com')dnl
其中126.com就是选用邮箱的地址 这样完整的发件人邮箱地址就是 : mxio@126.com注意的地方就是:上面两行括号里的点不是两个单引号. 而是一个 ` 和 一个单引号 ' 保存 service sendmail restart 如此设置,提交列队如果请求发送邮件的话,那么发件人就是你设置的这个“虚假”的邮箱地址,但是它又真实存在,这样用户回发的邮件就可以回复到这个“虚假”的地址上,方便管理员查收邮件。 Sendmail发送很慢的问题 vi /etc/hosts 添加 127.0.0.1 localhost.localdomain localhost yourhostname 这样设置服务器别名,sendmail就绕过DNS查找主机名的A记录和反向域名记录,从而发送邮件就快了。
|