Skip to content

数据管理

AI 数据集在模型训练时可使模型进行模式规律学习、优化参数,在评估验证时可依据测试集、验证集来判断模型性能与有效性。进入人工智能-数据管理模块,可创建、管理并使用您的数据集。

一、创建数据集

  1. 进入数据管理模块后,点击“创建数据集”,进入创建页。

1.png

  1. 选择数据集来源:支持选择社区、商城、文件管理和外部数据集仓库。

社区:可从AI社区拉取公开数据集。
商城:可将从商城购买的数据集添加至数据管理中心。
文件管理:可将个人文件,添加为数据集。
外部数据集仓库:可从Hugging Face、魔搭等外部数据集仓库拉取开源数据集。

  1. 填写其他信息:填写数据集名称、英文名等基本信息;同时选择使用区域,将在所选区域创建数据文件,创建完成后可在对应区域使用。

2.png

  1. 上述信息填写完成后,点击“创建”,进入数据集详情,详情页将为您展示创建进度,创建完成后即可管理使用。

3.png

二、管理数据集

创建好的数据集,可在数据列表查看管理

4.png

  1. 查看数据集详情

点击数据集名称,可快捷进入数据集详情,查看数据集介绍、数据集文件等。

5.png

  1. 切换区域

在数据集详情>区域下拉,可进行区域切换,您可按需编辑不同区域内的数据集信息。

6.png

  1. 跨区域同步

如您在区域A创建/维护完成数据集,需要在区域B使用,可点击“跨区域同步”,进行数据集同步。

7.png

  1. 下载数据集

点击更多>下载,可把当前区域数据集文件打包下载至本地。

8.png

  1. 删除数据集

如不再需要数据集,可点击“删除”,删除后将为您释放对应区域存储。

9.png

  1. 发布到社区或商城

如您想将数据集开源,分享给他人使用,可点击“发布到社区”。
如您需要将数据集发布为商用数据,可点击“发布至商城”(前提:已入驻为应用商城服务商 如何入驻?)。

10.png

三、数据集使用

在创建好的容器内,可查看、使用容器区域创建的所有数据集。
①点击数据集插件icon,进入数据集功能区;
②找到所需的数据集,双击可查看数据文件;
③点击复制icon,可快捷复制数据集路径进行使用。

11.png