Skip to content

常见问题

1.如何将数据集等文件快速传输到容器实例内?
答:容器实例启动后默认挂载用户主目录,容器中可以直接使用用户目录下的文件,您可以通过E-file或者快传上传数据到您账号下,具体操作方式可参考文件管理

2.目前notebook支持几个端口转发服务?
答:目前支持3个端口转发服务,分别是预设的jupyter端口、tensorboard端口以及用户自定义的端口。

3.国产卡配套的镜像启动实例后,为什么没有安装cuda?
答:DTK类比CUDA,是搭配国产加速卡使用的基础环境平台,DTK集成了DCC编译器、经验证和优化的计算库, 支持多种编程语言,同时提供运行、编译、调试和性能分析功能。国产卡环境搭建过程中无需安装cuda。

4.国产异构加速卡DTK版本与CUDA版本有对应关系吗?镜像内没有的依赖该怎么安装?
答:DTK与cuda没有强对应关系,在dtk2304、2310、2404.1 等版本中使用cuda mocker实现了cuda部分接口的模拟。针对镜像内没有的依赖,可以在https://cancon.hpccube.com:65024/4/main/中获取,下载后传输到镜像内,通用安装包可直接pip install, 开发者社区未提供的且直接调度cuda的依赖可以找工程师转码适配。

5.基于国产卡编译算子不能通过怎么办?
答:编译无法通过的原因有很多种,遇到这种文件您可以点击平台右侧的客服按钮或者在服务群联系在线工程师我们并发送报错截图,工程师会协助您进行处理。

6.实例关机镜像保存过程是否消耗机时扣费?
答:容器实例关机过程中,状态为关机中,不消耗机时(不扣费)。

7.实例关机镜像较大,保存不成功该如何处理?
答:可以联系工程师,协助配置保存。

8.notebook按量计费的实例,如果GPU中途价格调整,如何计费?
答:中途调整价格不影响当前实例,其仍然按照提交时的价格统计费用,容器实例结束后,重新启动容器实例,按新的调整价格计费。

9.notebook中系统盘与文件存储的区别是什么?
答:系统盘: 指的是您申请的加速卡所在服务器的数据盘,限制最大使用空间为50GB,容器实例关闭后, 系统盘内存储的数据随镜像一起保存,非该容器实例环境无法访问此部分数据。 文件存储: 指的是共享存储,容器实例外挂目录,实例开机后直接默认挂载,不受实例开关机和镜像保存的影响,灵活便捷,可在500GB免费赠送空间基础上申请扩展空间。

10.容器中降低内存使用率的方式有哪些?
答:(1)清除系统缓存 sync; echo 3 > /proc/sys/vm/drop_caches 这个命令将会清除页面缓存、目录项缓存和 inode 缓存。然后这个操作不会导致任何数据丢失,但可能会使 I/O 操作变慢一段时间。
(2) 释放无用内存在 Python 中释放内存:

shell
import gc 
gc.collect()

如果内存升高是因为运行任务过程中积累了很多垃圾数据,可尝试通过以下命令来强制进行垃圾回收(这个命令适用于 Python 等运行在解释器中的任务)。

11.容器内访问外网下载开源项目,为什么速度不稳定,时快时慢?
答:平台建立专线来提供容器内访问外网主流开源平台能力,保障用户能够稳定访问最新的外部模型、数据及代码资源,但专线资源由平台用户共享,当外网资源请求用户数较多时,可能会产生访问速度波动的情况。

12.关于notebook提供的自定义访问功能,适合于哪些开发场景?
答:Notebook自定义服务是为了满足用户在容器内启动服务并通过接口向外提供服务的场景。用户访问的容器环境底层实际由平台通过K8S系统底层Pod提供,因此,在容器内启动服务后,需要由系统进行代理才能对外提供服务,需要对服务端口与代理端口映射进行配置后,才能在外网进行访问。