多机使用dockerswarm部署多个容器并行openmpi

将镜像导出到node节点,并开启nfs

docker save > openmpi.tar mrwangwei/centos-openmpi:v1
scp openmpi.tar node1:/usr/local/src/code/
scp openmpi.tar node2:/usr/local/src/code/
docker load < openmpi.tar

yum install nfs-utils -y

vi /etc/exports
/usr/local/src/code 192.168.220.0/16(rw,no_root_squash)
systemctl restart rpcbind
systemctl restart nfs

初始化docker swarm环境

docker swarm init --advertise-addr 192.168.220.132

--------------------------------------------------------------------------
Swarm initialized: current node (dxn1zf6l61qsb1josjja83ngz) is now a manager.

To add a worker to this swarm, run the following command:

docker swarm join \
--token SWMTKN-1-49nj1cmql0jkz5s954yi3oex3nedyz0fb0xx14ie39trti4wxv-8vxv8rssmk743ojnwacrr2e7c \
192.168.220.132:2377

To add a manager to this swarm, run 'docker swarm join-token manager' and follow the instructions.
--------------------------------------------------------------------------

docker swarm join \
--token SWMTKN-1-49nj1cmql0jkz5s954yi3oex3nedyz0fb0xx14ie39trti4wxv-8vxv8rssmk743ojnwacrr2e7c \
192.168.220.132:2377

docker node list

使用docker-compose文件创建容器

vi docker-compose.yaml

version: "3.2"
services:
  mpi_master:
    image: mrwangwei/centos-openmpi:v1
    command: /bin/bash -c "/usr/sbin/sshd -D"
    deploy:
      replicas: 1
      placement:
        constraints:
          - node.role == manager
    networks:
      - mpi_overlay
    volumes:
      - "mpi_code:/usr/local/src/code"
    ports:
     - "22"

  mpi_node:
    image: mrwangwei/centos-openmpi:v1
    command: /bin/bash -c "/usr/sbin/sshd -D"
    deploy:
      replicas: 2
      placement:
        constraints:
          - node.role == worker
    volumes:
      - "mpi_code:/usr/local/src/code"
    networks:
        - mpi_overlay

networks:
  mpi_overlay:

volumes:
  mpi_code:
    driver: local
    driver_opts:
      type: "nfs"
      o: "addr=192.168.220.132,rw"
      device: ":/usr/local/src/code"

启动部署docker swarm

docker stack deploy --compose-file docker-compose.yaml example

docker service ls

docker service ps --no-trunc {serviceName}

docker exec -it /bin/bash
source /etc/profile
cd /usr/local/src/code/
dig tasks.mpi_node | grep ^tasks|awk '{print $5}' > machines
cat machines
ssh-keygen -t rsa
ssh-copy-id ...
ssh-copy-id ...
mpicc main.c
mpirun -np 10 --oversubscribe --allow-run-as-root --machinefile machines --prefix /usr/local/openmpi a.out

docker stack rm example

main.c

#include <stdio.h>
#include <mpi.h>

int main(int argc, char *argv[])
{
        int myrank, nprocs;
        char name[10];
        int name_len;
        int i,j,k,sum=0;
        MPI_Init(&argc, &argv);
        MPI_Comm_size(MPI_COMM_WORLD, &nprocs);
        MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
        MPI_Get_processor_name(name, &name_len);
        printf("core[%3d] of [%3d] in {%s},  in dir[ ~/托腮etMPI ]\n", myrank, nprocs, name);
        /* for(i =0 ; i<10000; i++) */
                /* for(j=0 ;j< myrank ; j++) */
                        /* sum +=j; */
        /* printf("core[%3d], sum= %12d\n", myrank,sum ); */

        MPI_Finalize();

        return 0;
}

lammps测试
docker-compose.yaml

```yaml
version: "3"
services:
  mpi_master:
    image: lammps-gpu:deepmd
    command: /bin/bash -c "/usr/sbin/sshd -D"
    deploy:
      replicas: 1
      placement:
        constraints:
          - node.role == manager
    networks:
      - mpi_overlay
    volumes:
      - "mpi_code:/root/lammps-data"
    working_dir: /root/lammps-data/
  
  mpi_node:
    image: lammps-gpu:deepmd
    command: /bin/bash -c "/usr/sbin/sshd -D"
    deploy:
      replicas: 2
      placement:
        constraints:
          - node.role == worker
    volumes:
      - "mpi_code:/root/lammps-data"
    networks:
        - mpi_overlay

networks:
  mpi_overlay:

volumes:
  mpi_code:
    driver: local
    driver_opts:
      type: "nfs"
      o: "addr=192.168.220.132,rw"
      device: ":/root/lammps-data"
```

```shell
docker stack deploy --compose-file docker-compose.yaml lammps
docker service ls
# 进入master容器中进行配置
source activate dpdev
cd /root/lammps-data/CH.airebo
yum -y install bind-utils
dig tasks.mpi_node | grep ^tasks|awk '{print $5}' > machines
ssh-keygen -t rsa -f ~/.ssh/id_rsa -P ''
ssh-copy-id $(cat machines | awk 'NR==1')
ssh-copy-id $(cat machines | awk 'NR==2')
mpirun --machinefile machines -np 56 /opt/lammps-3Mar20/src/lmp_mpi -in opt.in
mpirun --machinefile machines -np 28 /opt/lammps-3Mar20/src/lmp_mpi -sf gpu -pk gpu 2 -in gpu-opt.in
```

https://github.com/moby/moby/issues/37855
https://my.oschina.net/u/1787735/blog/4374958

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,302评论 5 470
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,232评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,337评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,977评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,920评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,194评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,638评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,319评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,455评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,379评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,426评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,106评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,696评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,786评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,996评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,467评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,043评论 2 341

推荐阅读更多精彩内容