物探论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1195|回复: 0

[工作站组建] 在workstation上安装torque

[复制链接]
发表于 2014-3-7 10:26:19 | 显示全部楼层 |阅读模式
系统环境:Ubuntu 10.04 LTS x86_64
硬件环境:32cpu
目的:安装Torque 2.4.x

1. 解压源码包
tar xzf torque-2.4.6.tar.gz
2. 编译并安装至/usr/local/torque目录下,安装需要root权限
cd torque-2.4.6/
./configure --prefix=/usr/local/torque
make -j 8
sudo -s
make install
./torque.setup root
3. 配置环境,以计算机名Node1为例
gedit /etc/hosts
添加或修改
127.0.0.1 Node1 localhost
gedit /etc/profile
添加:
#Torque
export PATH=/usr/local/torque/bin:/usr/local/torque/sbinPATH
source /etc/profile
默认情况下,Torque的主目录在 /var/spool/torque下
因此,到该目录下进行其他环境变量的设置:
cd /var/spool/torque
vi server_priv/nodes
添加:
Node1 np=32
即计算机名和CPU数目
vi mom_priv/config
添加:
$pbs_server = 127.0.0.1
vi server_name
添加:
Node1
4. 启动client daemon
pbs_mom
5. 重启pbs server daemon
qterm
pbs_server
6. 启动scheduler daemon
pbs_sched
7. 检查服务是否正确启动
ps -aux | grep pbs #check all is running
qstat -q #check the presence of the queue
qmgr -c 'p s' #check server & queue settings
pbsnodes -a  #check if the nodes are listed and up
8. 配置列队
qmgr -c "set queue batch resources_default.walltime = 360:00:00"
qmgr -c "set server query_other_jobs = True"
qmgr -c "set queue batch resources_max.ncpus=32"
9. 测试列队
首先退出root
exit
source /etc/profile
echo "sleep 30" | qsub
qstat
10. 配置开启启动
cd到torque-2.4.6/contrib/init.d目录下
vi debian.pbs_mom
将DAEMON=/usr/local/sbin/$NAME改为DAEMON=/usr/local/torque/sbin/$NAME
相同的,修改 debian.pbs_sched和debian.pbs_server的DAEMON=/usr/local/sbin/$NAME为DAEMON=/usr/local/torque/sbin/$NAME
将这三个文件复制到/etc/init.d/目录下
sudo cp debian.pbs_mom /etc/init.d/pbs_mom
sudo cp debian.pbs_sched /etc/init.d/pbs_sched
sudo cp debian.pbs_server /etc/init.d/pbs_server
sudo update-rc.d pbs_server defaults
sudo update-rc.d pbs_mom defaults
sudo update-rc.d pbs_sched defaults
装得还是有点迷糊,不过好在这次成功了。
提交列队后:
mxio@Node1:~$ qstat
Job id                    Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
2.localhost               STDIN            mxio                   0 R batch  
补记:
让torque发送任务信息邮件
系统要求安装好sendmail
因此:
sudo apt-get install sendmail
sudo apt-get install mailutils
此时测试是否启动 ps aux |grep sendmail
显示:
root      1592  0.0  0.0  90476  2556 ?        Ss   16:39   0:00 sendmail: MTA: accepting connections         
mxio      2570  0.0  0.0   7628   956 pts/0    S+   16:49   0:00 grep --color=au
to sendmail
You have mail in /var/mail/mxio
测试是否可以正常发送邮件:
编写一般的邮件:
显示:
Cc,抄送,跳过按enter
Subject: 输入内容,完成后按ctrl+D结束编辑发送
当目标邮箱接收到邮件后,说明配置正确。
如果之前没有配置sendmail,那么torque需要重新编译安装,正常顺序即可
编写PBS时添加:
#PBS -m abe -M test@mail.com
即可接收
其中:-m abe
a 是任务终止邮件 b是任务开始邮件 e是任务结束邮件,正常情况下,全开abe会接收到2封邮件
-M 是目标邮件地址
接收任务结束的邮件:
Torque Qmgr设置:
qmgr -c 'p s'  查看列队设置
qmgr -c 'set server xxx=xxx' 设置server列队参数
qmgr -c 'unset server xxx' 取消server xxx的设置
qmgr -c 'set server managers += mxio@Node1'
qmgr -c 'set server operators += mxio@Node1'  在"="号前加"+"表示附加条件,本例为添加mxio为管理员
qmgr create queue xxx 建立xxx列队
qmgr delete queue xxx 删除xxx列队
qmgr -c 'set server mail_from = mxio' 设置发送邮件人,这样发件人就是 mxio
下面设置 发送邮件的 domain,因为默认发送邮件的邮箱地址是 adm@localhost.domainname 这样邮件是不能回复的
进入 sendmail的设置环节,需要root身份:
su -
vi /etc/mail/submit.mc
将:dnl MASQUERADE_AS()dnl
改为:
MASQUERADE_AS(`126.com')dnl
其中126.com就是选用邮箱的地址 这样完整的发件人邮箱地址就是 : mxio@126.com
注意的地方就是:上面两行括号里的点不是两个单引号. 而是一个 ` 和 一个单引号 '
保存
service sendmail restart
如此设置,提交列队如果请求发送邮件的话,那么发件人就是你设置的这个“虚假”的邮箱地址,但是它又真实存在,这样用户回发的邮件就可以回复到这个“虚假”的地址上,方便管理员查收邮件。
Sendmail发送很慢的问题
vi /etc/hosts 添加
127.0.0.1 localhost.localdomain localhost yourhostname
这样设置服务器别名,sendmail就绕过DNS查找主机名的A记录和反向域名记录,从而发送邮件就快了。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|物探论坛 ( 鄂ICP备12002012号 微信号:iwutan )

GMT+8, 2024-4-19 05:23 , Processed in 0.069917 second(s), 15 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表