gpu图形服务器,GPU服务器是什么
转自https://ai.futurelab.tv/news/7
硬件型号和配置
本次大赛的地区赛为选手提供免费的GPU计算资源。GPU为金山云P3I.14B1,配置如下:
GPU:特斯拉P4 x 1
Vcpu:至强E5 V414内核
内存:DDR4 120GB
数据磁盘:本地SSD 500GB
软件环境
服务器默认安装:
Ubuntu 16.04-64位
CUDA 9.1
蟒蛇3.7
我们也可以提供CentOS 7.2/3镜像或者CUDA8.0,如果需要请联系助手申请重置。
我们暂时不提供桌面版的Linux。请使用命令行进行操作。
如何登录
Windows环境下,可以使用PuTTY等SSH终端软件登录,配置主机,填写IP地址、用户名和密码登录。
Linux和Mac OS可以使用系统自带的‘终端’直接登录。该命令如下所示:
请将IP地址替换为申请时颁发的IP,并输入正确的用户名和密码登录。ubuntu@111.222.10.123 SSH MAC OS X系统推荐使用Terminus终端,可以获得更好的操作体验。
安装数据磁盘
系统提供的数据盘需要自己挂载。该命令如下所示:
sudomkfs . ext 4/dev/vdbsudomkdir/data sudo mount/dev/vdb/data执行df -h,查看磁盘空间是否挂载在/data目录中,以下载并解压缩数据集。
使用以下命令通过intranet环境高速下载数据集:
跨设备说话人识别训练集WGET 3358172 . 31 . 0 . 3:9090/2019 AF-SR-AI Shell 2 . zip跨设备说话人识别训练集sha 1 sum WGET 3358172 . 31 . 0 . 3:9090/2019 AF-SR-AI Shell 2 . zip . sha1跨设备说话人识别开发集wget http://172 . 31 . 0 . 3:9090/AF 2019-SR-2019
跨设备说话人识别开发集sha 1 sum WGET 3358172 . 31 . 0 . 3:9090/af 2019-SR-DEVSET-2019 03 12 . zip . sha1发现超新星训练集WGET 3358172 . 31 . 0 . 3:9090/af 2019-cv-Training-2019 03 12 . zip发现超新星训练集sha 1 sum WGET 3358172 . 31 . 0 . 3:9099
以图像数据集为例sha1 sum-c af 2019-cv-training-2019 03 12 . zip . sha1
af 2019-cv-training-2019 03 12 . zip:OK输出OK,表示解压后的数据集下载成功:
以图像数据集为例。unziaf 2019-cv-training-2019 03 12 . zip系统会提示输入密码。请联系微信助手获取密码。上传和下载程序和模型。
你可以通过SCP命令远程复制你开发的程序。
在本地打开终端并执行以下命令:
从本地复制到服务器,根据实际情况填写目录和IP地址。SCP-R/my projects/my codes Ubuntu @ 111 . 222 . 10 . 123:/data/copy from remote to local:SCP-R Ubuntu @ 111 . 222 . 10 . 123:/data/my codes/my projects你也可以考虑使用gitlab这样的代码托管平台,Git是用来交付代码的。考虑到比赛期间代码的保密性,建议使用私人仓库。比赛结束后,再考虑要不要改装成公仓。
数据训练后,记得下载并保存训练好的模型,用于测试集的计算,否则你的计算结果可能会丢失。
安装所需的其他程序
您可以使用apt-get命令来安装所需的软件包。
比如安装g sudo apt-get install g,也可以选择下载源代码自己编译。有关详细信息,请参考所需软件包的文档。
安装python包
建议Conda在挂载的数据盘上创建一个环境并安装软件包。
创建环境conda create-p/data/my project in/data/my project进入环境conda activate /data/myproject安装软件包conda安装tensorflow可以安装指定版本的python或软件包conda安装Python=3.6 tensorflow=1.4。