Deep Learningを行うためにはGPUを使った計算が必須となります。
GPGPUを利用するためにはnvidiia-driverのインストールが必要なのですが、ハードウェアの制御を直接行うためインストールだけでもなかなか大変です。
そこで、誰でも簡単にnvidia-driverをインストールできるように手順をまとめました。
- nvidia-driverのインストール方法
- nvidia-driverのアンインストール方法
- インストール失敗時の対処方法
セキュアブートの設定をオフにする
nvidia-driverをインストールしようとすると、セキュアブートに阻まれるので、設定をオフにする必要があります。
検証モードを解除する
セキュアブートの設定変更画面が表示されるように設定します。
sudo mokutil --disable-validation
「input password:」と一時的なパスワードの作成を求められるので、8~16桁の任意のパスワードを入力します。
このパスワードは次の手順(セキュアブートの設定変更)で聞かれます。
パスワードは一時的なものなので簡単なもので問題ないと思います。
「Secure Boot」をオフにする
セキュアブートの設定変更画面を表示するために、OSを再起動します。
sudo reboot
再起動するとUEFIが表示されるので、なにかキーを押してマネージャを開きます。
「Change Secure Boot state」を選択して、セキュアブートの設定変更をします。
先ほど作成した一時的なパスワードを入力します。
パスワードのN文字目の入力を求められるので、指示に従い1文字を入力した後、「Enter」を押します。
(画面の例では一時的なパスワードの6文字目の入力を求められています。)
パスワードは数回聞かれるので、入力を繰り返します。
次に、「Disable Secure Boot」と聞かれるので、「No」を選択する。
デバイスによって「Enable Secure Boot」など質問文が変わるので、セキュアブートをしないように回答しましょう。
「 insecure mode」でOSを起動する。
「Continue boot」を選択し、インセキュアモードでOSを起動します。
secure bootと表示されていなければ成功です。
その場合はセキュアモードで起動してしまうので、手順を最初からやり直しましょう。
nvidia-driverをインストールする
セキュアブートを解除できたので、ようやくnvidia-driverのインストールができます。
バージョン一覧を表示する
まずは、インストール可能なnvidia-driverのバージョンを調べます。
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
apt-cache search "^nvidia-driver-[0-9]{3}"
インストールできるバージョンの一覧が表示されました。
nvidia-driverをインストールする
aptコマンドを使って任意のバージョンのnvidia-driverをインストールします。
今回はバージョン455のインストールコマンドを記載していますが、「455」の部分には任意のバージョンを入力してください。
sudo apt install nvidia-driver-455
CUDAとの対応は以下のサイト(nvidia公式)で確認する事ができます。
OSを再起動する
nvidia-driverのインストール後には再起動が必要となります。
sudo reboot
以上でnvidia-driverのインストールは完了です。
nvidia-driverの動作確認
nvidia-driverがインストールできているか動作確認してみましょう。
GPUの使用状況を確認する
nvidia-smiコマンドを使ってGPUの使用状況を確認しています。
nvidia-smi
gpuの使用状況が見えれば、成功です。
「Driver Version」が455.38と正しく表示されています。
「Processes」からは画面表示のプロセスにGPUが使われていることが分かります。
nvidia-driverのバージョンの確認する
cat /proc/driver/nvidia/version
Kernel Moduleが「455.38」と表示され、正しくインストールできていることが確認できました。
インストールに失敗した場合
対応していないバージョンを入れてしまったり、違うバージョンをインストールしたくなった場合には、nvidia-driverを一度削除してインストールし直します。
インストール失敗時のゴミを削除する
sudo apt-get --purge remove nvidia-*
コマンドが成功したら、「nvidia-driverのインストール」をやり直します。
「/var/lib/apt/lists/lockが不正」のエラーが出る場合
別のプロセスは存在していないため、なにかしら不正な状態となっていると思われます。
その場合、不要になったパッケージの削除をする必要があります。
sudo apt autoremove
それでもだめな場合は、lockファイルを削除して対応してください。
(危険なため、自己判断で実施をお願いします)
sudo rm /var/lib/apt/lists/lock
sudo rm /var/lib/dpkg/lock
まとめ
DeeplearningでGPUを使った計算をするために、nvidiia-driverのインストールが必要となります。
「insecure mode」でのOS起動方法からnvidia-driverをインストールまでの手順を解説しました。
Deeplearningは環境構築も大変ですが、慣れてしまえば簡単なのでぜひ挑戦してみてください。
コメント