本文摘要:对于AI企业来说,GPU等计算资源便宜,如何提升资源利用率,维护计算力投资?
对于AI企业来说,GPU等计算资源便宜,如何提升资源利用率,维护计算力投资?如何解决问题资源守住,确保资源用于公平合理?如何增加等待时间,提升模型训练效率……这些问题都关系着研发创意的工程进度。且看浪潮AIStation人工智能研发平台用三招“组合拳”超越计算力壁垒,加快企业AI研发进程。某企业AI研发面对的问题某企业有四台8卡GPU服务器供50位开发人员用于,典型的人多资源较少。
具体来说,有以下几大问题:人均严重不足一张GPU卡,GPU用于必须互相协商,研发效率较低;每十多人为一个小组共用一个GPU节点,有可能使有的小组资源空闲而有的小组却无资源能用,导致资源孤岛;缺少优先机制,最重要任务无法获得及时递交;在白天GPU卡完全全部用作研发环境创立,开发人员不能在晚上递交训练任务,模型训练数量十分受限。AIStation三招解决问题企业算力问题AIStation是面向AI企业研发场景的人工智能资源平台,可通过资源配额、GPU分享、排队托管地三招“组合拳”,智能化分配GPU计算资源,提升资源利用率,协助用户提升研发效率。首先,AIStation击破集中的计算资源,获取集群式的池化管理,并设置资源配额策略,构建多用户公平平衡用于资源。AIStation将研发用户区分为5个用户组,每个用户组10人,并根据业务市场需求设置每组和每个用户的用于配额,如可设置每组用于6张GPU卡、40个CPU核。
并对每个用户的研发环境用于时长、同时递交任务数量展开容许。其次,AIStation通过GPU分享策略,可以让多人共用一张GPU卡且彼此之间影响。
AIStation统一管理4台GPU节点,将其中2个节点的16张GPU卡设置为开发资源组,用作研发环境创立,只剩16张GPU卡为训练资源组,用作模型训练。通过分享策略,AIStation可将开发资源组的每张GPU卡切分成8份,每份用于4GRAM。
本文来源:必威betway体育-www.zhao-xing.com