Eu tenho um Notebook (Xiaomi Mi Notebook Pro) com um Nvidia MX150. Portanto, está utilizando a tecnologia Optimus da Nvidia. Como uma distribuição, eu uso o Fedora 28.
Bumblebee
Portanto, instalei o Bumblebee para aproveitar as vantagens desta tecnologia.
Ele deve ser instalado corretamente, pois posso inicie o glmark2 via optirun
ou primusrun
. Também executando cat /proc/acpi/bbswitch
saídas ON
. Portanto, a GPU Nvidia deve realmente estar em execução.
Docker
Para instalar o docker, segui as instruções em https://docs.docker.com/install/linux/docker-ce/fedora/#install-docker-ce
Executar docker run hello-world
produz o que deveria, então o docker também funciona.
nvidia -docker2
Eu instalei o nvidia-docker2 no Fedora com estes comandos:
curl -s -L https://nvidia.github.io/nvidia-docker/centos7/nvidia-docker.repo | \ sudo tee /etc/yum.repos.d/nvidia-docker.repo sudo dnf install nvidia-docker2 sudo pkill -SIGHUP dockerd
Pacotes nvidia instalados
Para verificar quais pacotes nvidia estão instalados, executo este comando:
rpm -qa "*nvidia*"
- Resultado: akmod-nvidia-396.51- 1.fc28.x86_64
- nvidia-container-runtime-2.0.0-1.docker18.06.1.x86_64
- nvidia-driver-396.51-1.fc28.x86_64
- kmod-nvidia-4.17.9-200.fc28.x86_64-396.45-1.fc28.x86_64
- kmod-nvidia-4.17.14-202.fc28.x86_64-396.51-1. fc28.x86_64
- nvidia-docker2-2.0.3-1.docker18.06.1.ce.noarch
- nvidia-driver-libs-396.51-1.fc28.x86_64
- nvidia-container-runtime-hook-1.4.0-1.x86_64
- libnvid ia-container1-1.0.0-0.1.rc.2.x86_64
- kmod-nvidia-4.17.12-200.fc28.x86_64-396.45-1.fc28.x86_64
- libnvidia-container-tools-1.0.0-0.1.rc.2.x86_64
O docker de teste está sendo executado com GPU Nvidia
Infelizmente, o docker não é executado atualmente com a GPU Nvidia:
optirun docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
Recebo este erro:
docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "process_linux.go:402: container init caused \"process_linux.go:385: running prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig --device=all --compute --utility --require=cuda>=9.0 --pid=26115 /var/lib/docker/overlay2/c00aa7855e42deee545cb07531a571538e0d051d38f45e36584a1c850dd47680/merged]\\\\nnvidia-container-cli: initialization error: driver error: failed to process request\\\\n\\\"\"": unknown.
O que estou perdendo?
Por enquanto, não tenho ideia de onde está o erro. Acho que pode ser um problema com a CUDA
versão.
Resposta
A única “correção” que encontrei (mais como uma solução alternativa) é garantir que a placa nvidia seja carregada / selecionada primeiro por meio de seleção principal:
sudo prime-select nvidia
Parece que está derrotando o propósito de usar abelha