在学校服务器上悠闲地搭了两星期环境都没搭起来(跟没有sudo权限和我有逆反心理有关),上网租了一个服务器一天搞完(也有智力大爆发的成分在)
参考:
1.B站上的视频讲解,UP:heawon-yoon
https://github.com/heawon-yoon/smpl_gaussian_tutorial
2.CSDN上的帮助
https://blog.csdn.net/sichen1997/article/details/138169731
我用的是AUTODL的服务器
镜像选的是miniconda3、Python3.10(Ubantu22.04)、CUDA11.8
租好打开,我是直接使用网页版的JupyterLab(但是非常烦人,一挂梯子就断线,而且校园网慢得要死,每次从GitHub上面下载代码都登不上去,还要我给它开热点,建议有时间的同学用IDE上的插件)
首先初始化一下conda环境
conda init
然后重新打开终端,看到前面有(base)就说明好了
接下来从GitHub上面把代码搞下来
git clone https://github.com/graphdeco-inria/gaussian-splatting –recursive
cd gaussian-splatting
这一步特别要注意,不能从官网上下载zip压缩包然后再直接传到JupyterLab里面,因为如果直接传,会导致submodules里面的包不能以Git仓的形式安装(好像是因为没有建立链接?)
然后创建虚拟环境
conda create -n gaussian python=3.10 -y
conda activate gaussian
接下来安装torch(这个是最烦的,我的大部分错误都出在这些依赖不兼容的问题上,所以一定要看好版本相互之间是否兼容),这个是我用的,实测还是可以的。
conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.8 -c pytorch -c nvidia
这些都没问题了就可以下一步,把C++相关的都装上
sudo apt-get update
sudo apt install build-essential
sudo apt-get install ninja-build
然后有的朋友会发现安了这些相同的还是在装submodules的时候出错,这时候要检查一下你系统的其他跟C++相关的依赖:
nvidia -smi
nvcc –version
gcc –version
g++ –version
make –version
cmake –version
这些命令要得到:服务器安装了CUDA(这个一般都有,并且是CUDA12往上)、nvcc版本要是11.8,gcc要小于12(也就是11点几都可以,我看到有朋友说9.4也可以,不过我没有试)、g++要与gcc同版本(一般都是同版本)、make(这个我忘记了,但是应该不大影响)、cmake3.22.1(我看到有朋友用3.23.0也可以,我的这个3.22.1是可以兼容的)
然后就可以美美装子模块了
pip install submodules/diff-gaussian-rasterization
pip install submodules/simple-knn
这两个都装上,你就基本上已经成功了
然后把需要的依赖都装上,基本上就是缺啥补啥,非常快
pip install plyfile tensorboard tqdm six numpy==1.22
pip install opencv-python
pip install opencv-contrib-python
然后上网站上下载数据集,在项目文件夹里建立一个新文件夹data,把想跑的数据挪进去
训练!(这里用的是卡车数据集)
python train.py -s ./data/tandt/truck
然后实时查看:重新打开一个新的终端窗口
进入自己的这个虚拟环境,打开tensorboard
tensorboard –logdir=./output/XXXX
这个output后面的内容视情况更改,就是在train的那一条代码的结果里的output folder
然后把自己电脑Windows的cmd打开,输入服务器所给的ssh。。。的一段命令,就可以打开命令所给的链接localhost 6006了,这时候就能查看训练结果了!
评论前必须登录!
注册