yuinh2007 发表于 2014-3-7 10:26:19

在workstation上安装torque

系统环境:Ubuntu 10.04 LTS x86_64硬件环境:32cpu目的:安装Torque 2.4.x
1. 解压源码包tar xzf torque-2.4.6.tar.gz2. 编译并安装至/usr/local/torque目录下,安装需要root权限cd torque-2.4.6/./configure --prefix=/usr/local/torquemake -j 8sudo -smake install./torque.setup root3. 配置环境,以计算机名Node1为例gedit /etc/hosts添加或修改127.0.0.1 Node1 localhostgedit /etc/profile添加:#Torque
export PATH=/usr/local/torque/bin:/usr/local/torque/sbin:$PATHsource /etc/profile
默认情况下,Torque的主目录在 /var/spool/torque下因此,到该目录下进行其他环境变量的设置:cd /var/spool/torquevi server_priv/nodes添加:Node1 np=32即计算机名和CPU数目vi mom_priv/config添加:$pbs_server = 127.0.0.1vi server_name添加:Node14. 启动client daemonpbs_mom5. 重启pbs server daemonqtermpbs_server6. 启动scheduler daemonpbs_sched7. 检查服务是否正确启动ps -aux | grep pbs #check all is running
qstat -q #check the presence of the queue
qmgr -c 'p s' #check server & queue settings
pbsnodes -a#check if the nodes are listed and up8. 配置列队qmgr -c "set queue batch resources_default.walltime = 360:00:00"
qmgr -c "set server query_other_jobs = True"
qmgr -c "set queue batch resources_max.ncpus=32"9. 测试列队首先退出rootexitsource /etc/profileecho "sleep 30" | qsub
qstat10. 配置开启启动cd到torque-2.4.6/contrib/init.d目录下vi debian.pbs_mom将DAEMON=/usr/local/sbin/$NAME改为DAEMON=/usr/local/torque/sbin/$NAME相同的,修改 debian.pbs_sched和debian.pbs_server的DAEMON=/usr/local/sbin/$NAME为DAEMON=/usr/local/torque/sbin/$NAME将这三个文件复制到/etc/init.d/目录下sudo cp debian.pbs_mom /etc/init.d/pbs_momsudo cp debian.pbs_sched /etc/init.d/pbs_schedsudo cp debian.pbs_server /etc/init.d/pbs_serversudo update-rc.d pbs_server defaultssudo update-rc.d pbs_mom defaultssudo update-rc.d pbs_sched defaults 装得还是有点迷糊,不过好在这次成功了。提交列队后:mxio@Node1:~$ qstat
Job id                  Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
2.localhost               STDIN            mxio                   0 R batch补记:让torque发送任务信息邮件系统要求安装好sendmail因此:sudo apt-get install sendmailsudo apt-get install mailutils此时测试是否启动 ps aux |grep sendmail显示:root      15920.00.0904762556 ?      Ss   16:39   0:00 sendmail: MTA: accepting connections         
mxio      25700.00.0   7628   956 pts/0    S+   16:49   0:00 grep --color=au
to sendmail
You have mail in /var/mail/mxio
测试是否可以正常发送邮件:编写一般的邮件:mail test@mail.com显示:Cc,抄送,跳过按enterSubject: 输入内容,完成后按ctrl+D结束编辑发送当目标邮箱接收到邮件后,说明配置正确。如果之前没有配置sendmail,那么torque需要重新编译安装,正常顺序即可编写PBS时添加:#PBS -m abe -M test@mail.com即可接收其中:-m abea 是任务终止邮件 b是任务开始邮件 e是任务结束邮件,正常情况下,全开abe会接收到2封邮件-M 是目标邮件地址接收任务结束的邮件:Torque Qmgr设置:qmgr -c 'p s'查看列队设置qmgr -c 'set server xxx=xxx' 设置server列队参数qmgr -c 'unset server xxx' 取消server xxx的设置qmgr -c 'set server managers += mxio@Node1'qmgr -c 'set server operators += mxio@Node1'在"="号前加"+"表示附加条件,本例为添加mxio为管理员qmgr create queue xxx 建立xxx列队qmgr delete queue xxx 删除xxx列队qmgr -c 'set server mail_from = mxio' 设置发送邮件人,这样发件人就是 mxio下面设置 发送邮件的 domain,因为默认发送邮件的邮箱地址是 adm@localhost.domainname 这样邮件是不能回复的进入 sendmail的设置环节,需要root身份:su -vi /etc/mail/submit.mc将:dnl MASQUERADE_AS()dnl改为:MASQUERADE_AS(`126.com')dnl
其中126.com就是选用邮箱的地址 这样完整的发件人邮箱地址就是 : mxio@126.com注意的地方就是:上面两行括号里的点不是两个单引号. 而是一个 ` 和 一个单引号 '保存service sendmail restart如此设置,提交列队如果请求发送邮件的话,那么发件人就是你设置的这个“虚假”的邮箱地址,但是它又真实存在,这样用户回发的邮件就可以回复到这个“虚假”的地址上,方便管理员查收邮件。Sendmail发送很慢的问题vi /etc/hosts 添加127.0.0.1 localhost.localdomain localhost yourhostname这样设置服务器别名,sendmail就绕过DNS查找主机名的A记录和反向域名记录,从而发送邮件就快了。
页: [1]
查看完整版本: 在workstation上安装torque