查看: 2213|回复: 0

[开发环境] 平台主机使用的有偿调试及常见问题解答

[复制链接]

665

主题

1234

帖子

6670

积分

xdtech

Rank: 5Rank: 5

积分
6670
发表于 2019-2-25 23:12:30 | 显示全部楼层 |阅读模式
本帖最后由 shaoheshaohe 于 2019-2-25 23:32 编辑

1. 平台主机的有偿调试
收费条件:用户使用平台遇到问题,但这个问题并非平台造成的,而是用户自行决定的某些设置、某些操作造成的。这时,若用户需要我们去诊断问题并解决问题,则属于“有偿调试”的范围。
收费方式:充值50扣20。请用户先充值50,然后我们工作人员进行调试。问题解决后,符合收费条件时,系统后台自动扣除20元调试费。

在您使用“有偿调试”服务之前,为节省您的开支,您可参考以下信息,看能否解决您的问题。

2. 平台主机的常用软件常见问题
(1) PyCharm长时间打不开
请检查你要打开的工程目录,是否包含特别多的文件、特别大的文件。默认,PyCharm会将工程目录的所有文件load进来。如果你的数据集也在这个目录,或者有很大的单文件,那么,PyCharm打开可能要很长时间(>= 30 mins)。

(2) GPU (特别是1080Ti)的利用率偏低
请检查你的CPU利用率。如果CPU利用率很高。那就说明,你的主机,CPU数目偏少,导致GPU无法充分利用。
如何理解此事?GPU是处理数据的,CPU是喂数据的;如果CPU数目不够,GPU就喂不饱,当然利用率就低。
注意:在AI程序中,对数据的预处理,一般是CPU完成的;预处理部分的计算量,可能很大。预处理越复杂的任务,要想充分地利用GPU,必须要选择足够数目的CPU。

(3) X2Go的响应很慢
请检查你的系统资源利用率,包括CPU、内存、硬盘读写。如果你的系统已处于满负荷状态,X2Go响应慢是难以避免的。任何一台电脑,当它的资源已被充分占用时,它响应别的任务,肯定是很慢的。
怎么办:提升主机的位置,如更多CPU、更大内存等。

(4) 程序运行结果无法写入
请检查你的个人云存储空间。当空间已满时,写入操作将会失败。

(5) 程序运行过程中途退出。
最常见的错误是CUDA OOM(out of memory)。也就是,你的显卡,显存容量不够。
另一常见的错误是内存不够。当内存无法满足需求时,例如大矩阵的计算,程序也会异常退出。
怎么办:租用更高配置的主机 ;修改程序,将资源占用的峰值降低到安全范围。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表