Materials Studio 的linux集群安装过程

标签:
转自文件软件备注终端 |
分类: 产品技术 |
前言:
按照此教程安装前,请您先阅读关于Linux系统中的vi、chmod等命令的使用方法,将有助您的理解。
一. 安装配置RHEL 5.5环境,安装好后需要配置下面的rpm包(详细可参考MS说明文档中的system requirement)
1
2
3
4
5
|
a. gcc(安装vmtools必备) b. glibc-2.3.4-2.43 (32-bit and
64-bit) c. libgcc-3.4.6-11 (32-bit and
64-bit) d. libstdc++-33-3.4.6-11 (32-bit and
64-bit) e. compat-libstdc++-33-3.2.3-47.3 (32-bit) |
二. 为本地用户添加sudo命令使用权限,运行命令 su root,输入root用户的登录密码后,使用vi命令进行下面的修改:
1
2
3
|
vi /etc/sudoers 于root ALL=(ALL) ALL这一行下面添加一行user ALL=(ALL)
ALL user即你在系统安装过程中新建的用户。 |
修改后,则成功添加相应用户使用sudo命令的权限,在往后的安装中可方便进行提权操作。
三.
配置环境变量(可选步骤,方便系统命令的执行),方法可参考:
《在Linux里设置环境变量的方法(export PATH)》
四. 于各节点安装HP-MPI,安装方法:
a. 挂载MS安装光盘,对应系统版本进入下列相应目录进行安装,下面是版本信息:
1
2
3
|
UNIX/Linux/hpmpi/ for older IA32 Linux UNIX/Linux_x86_64/hpmpi/ for IA32 Linux systems with
x86_64 UNIX/Linux_IA64/hpmpi/ for IA64 Linux. |
b. 安装时需要使用root用户进行安装,终端运行su root后输入密码登录为root,使用下面安装命令示例:
1
|
rpm -ivh
/UNIX/Linux_x86_64/hpmpi/hpmpi-2.03.01.00-20090402r.x86_64.rpm |
c. 安装后出现下面提示即成功安装
http://ce.sysu.edu.cn/hope2008/Education/UploadFiles_5303/201101/2011012117063271.pngStudio
五. 配置SSH或RSH免认证登录,配置过程:
a. SSH免认证登录的配置:
i. 测试是否已经安装SSH,于终端(Terminal)中输入ssh localhost后回车,若出现下面提示:
http://ce.sysu.edu.cn/hope2008/Education/UploadFiles_5303/201101/2011012117064638.pngStudio
则表示已经安装SSH。若提示失败,则需要放入安装光盘进行安装,详细可问谷哥。下面开始免认证登录的设置。
ii. 于终端中输入ssh-keygen -t rsa,此时它会提示你生成SSH的密钥。
http://ce.sysu.edu.cn/hope2008/Education/UploadFiles_5303/201101/2011012117094770.pngStudio
iii. 此时无须设置密码,你只需要点击回车就可以了,生成的公钥和私钥会保存~/.ssh/目录下。
iv. 进入目录~/.ssh/(命令:cd ~/.ssh/),运行命令:
1
|
cp id_rsa.pub authorized_keys,将公钥进行复制。 |
v. 同样地,在其他节点上运行上面的命令,将各节点中得到的authorized_keys中的内容复制出来,汇总到一个文件中,命名为authorized_keys,并放置于各节点的~/.ssh/目录下(覆盖原有文件)。
vi. 修改该目录下的文件权限以及目录权限,运行命令:
1
2
|
chmod 600 * chmod 700 . |
vii. 再修改home目录的权限为只读,运行命令:
1
2
|
cd ~ chmod 755. |
viii. 在各节点的对应目录重复以上命令,如成功的话,对localhost(或者其他节点机器名)进行ssh连接则不会再出现密码提示,如图:
ix. 为加快SSH连接速度,使用 vi 命令(需要root权限)修改 /etc/hosts文件,命令如下:
1
|
sudo vi /etc/hosts |
x. 将127.0.0.1后对应的主机名删除,添加集群中各节点的IP地址和机器名,示例如下:
1
2
3
4
5
6
|
# Do not remove the following line, or various
programs # that require network functionality will
fail. 127.0.0.1 ::1 192.168.2.160 192.168.2.161 |
保存后退出即可。
xi. SSH免认证登录可使用expect脚本或WinSCP等软件进行简化,留意后续教程。
b. RSH免认证登录配置:参考《在centos 5上如何配置rsh,rcp,scp多节点互通_无须密码》以及MS安装光盘中的Info目录里的《Installing Materials Studio on Linux systems》
c. 由于RSH属于无加密登录,因此推荐使用SSH登录
六. 以集群模式安装MS,下面参考《Materials Studio 5.0 LINUX 版小集群并行安装手记》
1. 先将MS文件上传到主节点。可以以打包的形式上传,也可以先做成ISO,我一般是习惯先做成ISO上传,以免出现权限不够的问题,遇到权限不够的时候改变文件属性,加上执行权限就可以了。
2. 上传后将ISO文件挂载到某一目录下,如果想挂到根目录下mnt目录下的iso目录中,命令示例如下:
1
2
|
mkdir /mnt/iso mount -o loop -t iso9660 ms50_unix.iso
/mnt/iso |
3. 在主节点上切换到MS安装用户,这里用的是hope,然后到换到/mnt/iso/UNIX下执行
1
2
|
./Install --type cluster 或是直接./mnt/iso/UNIX/Install --type cluster |
--type cluster这个参数是并行时必须的加的参数,另一个要注意的就是要用非root用户安装。
4. 如果执行上述命令后出现无法安装的提示,可使用下列命令进行提权:
1
|
chmod 777 /mnt/iso/ -R |
5. 安装过程中其他基本上用默认的就可以,但有一个临时文件夹建议不要放在共享目录下,每个节点放一个tmp,这样可以减少节点间的通信量,提高性能。比如说我的安装目录是/home/hope/Accelrys/MaterialsStudio50,Accelrys是我要共享给其他节点的目录,那tmp我就放在/home/hope/下,用MS的用户创建,保证可写入。其他每个节点的用户目录下都创建一个tmp目录。
6. 安装完成后将Accelrys目录共享给其他节点,方法如下:
1
2
|
编辑/etc/exports,加入下面一行内容: /home/msi/Accelrys *(rw,no_root_squash) |
7. 然后重启nfs服务,service nfs restart。如出现错误提示,则参考《Linux下配置安装NFS》文章中检查portmap服务是否已经启动或者运行命令是否有root权限。
8. 然后到其他节点上使用root用户登录,执行挂载命令:
1
|
mount -t nfs 主节点名:/home/hope/Accelrys/
/home/hope/Accelrys/ |
若出现错误提示,则检查该节点是否已经新建Accelrys文件夹、防火墙是否已经关闭以及SELinux功能是否已经关闭。
9. 导入证书。在安装光盘中找到msi.lic文件,将licenses文件中里第一行中的机器名改为你的主节点的机器名后,文件名改为msi.lic放到/home/hope/Accelrys/LicensePack/Licenses里。在Terminal中运行:
1
|
/home/hope/Accelrys/LicensePack/linux/bin/lp_admin |
然后在图形界面下进行证书的导入。
http://ce.sysu.edu.cn/hope2008/Education/UploadFiles_5303/201101/2011012117290717.jpgStudio
如果没有图形界面的话,使用下面命令可以启用命令行的Licenses administration Tools:
1
2
3
4
|
<</CODE> MS_INSTALL>/bin/license_admin
-cw or <</CODE> MS_INSTALL>/bin/license_admin
--console-wizard <</CODE> MS_INSTALL>即MS的安装目录 |
10. 修改/home/hope/Accelrys/MaterialsStudio50/share/data下的machines.LINUX,写上各节点的机器名:CPU数。
11. 修改/home/hope/Accelrys/MaterialsStudio50/etc/Gateway/root_default/dsd/conf里两个文件里的CPU数为你各节点CPU总数。
12. 重新启动网关,进入/home/msi/Accelrys/MaterialsStudio50/etc/Gateway,执行
1
|
./msgateway_control_18888 restart |
13. 由于之前安装的时候没有将Gateway注册为自动启动服务的话,可执行下面的命令:
1
2
|
cp
/home/hope/Accelrys/MaterialsStudio55/etc/Gateway/msgateway_control_18888
/etc/rc.d/init.d/msgateway_control_18888 /sbin/chkconfig --add
msgateway_control_18888 |
14. 至此,MS的集群安装基本完成。
备注:
1. 防火墙配置要注意,测试时请先关闭防火墙及SELinux
2. SSH免认证配置需要仔细进行权限配置,一般出问题了都是权限的问题。
3.
上述过程中,NFS和Portmap服务没有注册为自动启动,nfs共享目录也没有进行自动挂载,当节点关机后需要重新进行挂载。同样,License服务也没有注册为系统服务,重启后可能需要重新启动License认证服务。
4. 关于RHEL 5.5的安装过程以及VMTools的安装待续。
转自:http://ce.sysu.edu.cn/hope2008/Education/ShowArticle.asp?ArticleID=10292