没想到还是走到了买深度学习服务器这一步了,这里记录一下腾讯云深度学习服务器搭建踩过的坑,整整花了我一天才搞定。
希望小伙伴们以后不要同样浪费时间。
为什么选腾讯云呢,他的特斯拉T4只要2500,隔壁阿里云4000网上,没钱真是玩不起啊。
坑点一
千万不要直接选公用镜像!!!!
腾讯云有提供深度学习配置好驱动的镜像,可以介绍至少几个小时的时间。
直接点镜像市场选择,搜CUDA即可。
看到这里,正当我为了一早上瞎鸡儿装驱动懊悔的时候。下面一个更大的坑还在等着我。
坑点二
千万不要选 ubuntu的镜像!!!
正当我满心欢喜的选个本机常用的ubuntu18系统自带驱动和pytorch的时候,直接发现装完了系统就ssh连不上。然后折腾几个小时以为是自己的问题。
后面反馈腾讯的工程师,说是镜像方的问题,他们也不好解决,建议换个镜像........
然后随便选了个contos的系统就没啥问题了
最好是选CUDA10.2 和 驱动高一些的镜像,pytorch支持的比较好。避免了后面再继续调cuda。