物探论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1020|回复: 0

[工作站组建] 作业管理系统Torque在工作站/单机上的安装和使用

[复制链接]
发表于 2014-3-7 10:22:16 | 显示全部楼层 |阅读模式
系统要求:Ubuntu12.04+或者Mint14+

具体设置:

1.获取本地Hostname,echo $HOSTNAME。修改hosts,注销127.0.1.1.

127.0.0.1 localhost改成127.0.0.1 localhost xxxxx torqueserver calnode1。其中,xxxx是HOSTNAME。

2.安装torque包,apt的干活:

$ sudo apt-get install torque-common libtorque2 libtorque2-dev torque-server torque-scheduler torque-mom torque-client

3.初始化:

$ sudo qterm // 先终止服务

$ sudo bash /usr/share/doc/torque-common/torque.setup $USER torqueserver // 建立默认服务器和队列,并把自己列为管理员

$ qmgr -c 'print server' // 查看默认配置的服务和队列

第三个命令,会列出一些列的东西,暂时无视掉。

4.配置计算节点,服务节点(其实就是本机了)

下面的步骤都要切换到root权限配置,即便是sudo 也会提示权限不足。

(1)创建服务节点

创建server_name文件,指明服务节点的名称为torqueserver

# echo "torqueserver" > /var/spool/torque/server_name

(2)添加计算节点

创建server_priv/nodes文件,指定利用名为calnode的节点的4个核做计算(具体几个核视个人情况而定)

# echo "calnode1 np=4" > /var/spool/torque/server_priv/nodes

(3)配置计算节点

创建mom_priv/config文件,告诉mom向IP为127.0.0.1的服务节点汇报

# echo "$pbs_server = 127.0.0.1” > /var/spool/torque/mom_priv/config

5.结束配置,第一次启动。

首先,关闭所有服务,

$sudo pkill "pbs_*"

第一次启动

$ sudo qterm -t quick #输入y。

启动所有服务

$sudo pbs_server

$sudo pbs_sched

$sudo pbs_mom

6.测试作业

$ echo 'sleep 20' | qsub

$ qstat

如果进程状态是R,则说明没有问题。

以后重启的时候记得启动pbs_server pbs_sched pbs_mom三个进程,或者添加到开机启动项里去。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|物探论坛 ( 鄂ICP备12002012号 微信号:iwutan )

GMT+8, 2024-4-27 00:38 , Processed in 0.278215 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表