Docker com Bumblebee no Fedora

Eu tenho um Notebook (Xiaomi Mi Notebook Pro) com um Nvidia MX150. Portanto, está utilizando a tecnologia Optimus da Nvidia. Como uma distribuição, eu uso o Fedora 28.

Bumblebee

Portanto, instalei o Bumblebee para aproveitar as vantagens desta tecnologia.

Ele deve ser instalado corretamente, pois posso inicie o glmark2 via optirun ou primusrun. Também executando cat /proc/acpi/bbswitch saídas ON. Portanto, a GPU Nvidia deve realmente estar em execução.

Docker

Para instalar o docker, segui as instruções em https://docs.docker.com/install/linux/docker-ce/fedora/#install-docker-ce

Executar docker run hello-world produz o que deveria, então o docker também funciona.

nvidia -docker2

Eu instalei o nvidia-docker2 no Fedora com estes comandos:

curl -s -L https://nvidia.github.io/nvidia-docker/centos7/nvidia-docker.repo | \ sudo tee /etc/yum.repos.d/nvidia-docker.repo sudo dnf install nvidia-docker2 sudo pkill -SIGHUP dockerd

Pacotes nvidia instalados

Para verificar quais pacotes nvidia estão instalados, executo este comando:

rpm -qa "*nvidia*"

Resultado: akmod-nvidia-396.51- 1.fc28.x86_64
nvidia-container-runtime-2.0.0-1.docker18.06.1.x86_64
nvidia-driver-396.51-1.fc28.x86_64
kmod-nvidia-4.17.9-200.fc28.x86_64-396.45-1.fc28.x86_64
kmod-nvidia-4.17.14-202.fc28.x86_64-396.51-1. fc28.x86_64
nvidia-docker2-2.0.3-1.docker18.06.1.ce.noarch
nvidia-driver-libs-396.51-1.fc28.x86_64
nvidia-container-runtime-hook-1.4.0-1.x86_64
libnvid ia-container1-1.0.0-0.1.rc.2.x86_64
kmod-nvidia-4.17.12-200.fc28.x86_64-396.45-1.fc28.x86_64
libnvidia-container-tools-1.0.0-0.1.rc.2.x86_64

O docker de teste está sendo executado com GPU Nvidia

Infelizmente, o docker não é executado atualmente com a GPU Nvidia:

optirun docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi

Recebo este erro:

docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "process_linux.go:402: container init caused \"process_linux.go:385: running prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig --device=all --compute --utility --require=cuda>=9.0 --pid=26115 /var/lib/docker/overlay2/c00aa7855e42deee545cb07531a571538e0d051d38f45e36584a1c850dd47680/merged]\\\\nnvidia-container-cli: initialization error: driver error: failed to process request\\\\n\\\"\"": unknown.

O que estou perdendo?

Por enquanto, não tenho ideia de onde está o erro. Acho que pode ser um problema com a CUDA versão.

Resposta

A única “correção” que encontrei (mais como uma solução alternativa) é garantir que a placa nvidia seja carregada / selecionada primeiro por meio de seleção principal:

sudo prime-select nvidia

Parece que está derrotando o propósito de usar abelha