金山云 > 人工智能开发平台

人工智能开发平台 (KPL)

Kingsoft Cloud Power Learning

金山云人工智能开发平台KPL(Kingsoft Cloud Power Learning,简称KPL),是金山云推出的面向AI开发和应用的一站式人工智能开发生产平台,实现了对数据、算法、算力资源的统一调度管理,构建了完善的开发软件栈,支持数据处理、算法开发、模型训练、模型部署的全流程业务,并提供了大规模分布式训练、自动化模型生成等功能,满足不同开发层次的需要,有效提高计算资源利用率,提升AI开发效率,实现系统的平滑、稳定、可靠运行。

核心优势

  • 分布式架构

    大规模数据训练的分布式架构。通过构建分布式训练架构,优化分布式IO,增加远程文件系统流式读取能力,处理海量数据,构建GPU多机多卡同步训练,实现在各种容器上高速运行大规模分布式训练。

  • 异构支持

    支持异构计算资源。平台支持多种异构资源管理,包括CPU、GPU、NPU、FPGA等,自研了融合管理平台,解决了多类型集群的管理难题,实现了混合调度,可将任务自动调度到异构计算资源中,大大提升计算资源利用率。

  • 全流程一体化

    KPL平台针对中小型企业或者科研院所提供多种组件和工具,支持从支持数据处理、算法开发、模型训练、模型部署的全流程业务,并根据金山云项目开发经验提供案例库,针对大型训练项目提供了分布式加速训练,收敛时间提升20%以上。

  • 快速部署

    KPL平台实现了对计算资源统一智能分配管理,构建了GPU用户配额和限制策略,保证计算资源能根据开发人员的需求进行合理的调度;计算资源按需申请,随用随到,支持GPU共享模式,提升集群整体利用率,通过自定义镜像等功能,实现开发环境的快速部署。

产品功能

  • 自定义工作流模板

    用户可根据需求对数据集、预训练模型、数据预处理、训练、测试、批量推理、编译SDK进行自由排列组合,使用连线确定其关联关系和运行顺序,每个运行节点可单独配置参数,多个节点构成运行流图,可以保存作为某一场景下的任务模板。
  • 自定义算法运行

    支持主流编程语言编写的任意AI算法。自定义的算法可以安装到平台中运行,平台不对算法类型、算法应用场景等都没有任何限制,只进行技术层面的适配。
  • Pipeline运行

    Pipeline是用户执行任务的“操作台”,每个Pipeline相互独立。用户在Pipeline内根据自身需求组合数据、算法、预训练模型、预处理器,调整相关参数,开始运行后任务会按照任务流图运行,并可查看任务运行中和历史任务详情。Pipeline创建后可反复使用。
  • 资源调度与任务管理

    支持资源监控、模型训练等多种类型任务的统一调度管理,每种类型的任务均可根据资源需求实现动态调度,保证任务之间的资源共享与安全隔离。

金山云,开启您的云计算之旅

免费注册