近日,金山云完成基于国产芯片的DeepSeek满血版适配。同时,金山云星流训推平台也已完成DeepSeek满血版的部署,且支持多机部署实现分布式推理。 通过提供稳定且强大的算力支持,金山云能助力模型充分发挥其性能优势,使得其在自然语言处理、智能问答、文本生成等多个领域表现优秀,这将为用户带来更强大、更高效的人工智能体验。 裸金属服务器部署步骤 金山云在搭载国产GPU的裸金属机型上进行了适配,公司提供已预装好包含 DeepSeek满血版和所有依赖环境的自定义镜像,用户只需在金山云裸金属服务器控制台选择地域与机型、选定内置DeepSeek满血版的自定义镜像、配置网络与安全、设置基本信息并确认配置后,即可轻松完成部署。 1.金山云裸金属服务器控制台创建入口 2.金山云裸金属服务器控制台创建流程,选择内置DeepSeek满血版的自定义镜像创建 创建完成后,开发者和企业一键启动模型就能立即投入使用,大大降低了模型的使用门槛。这不仅能让更多开发者和企业快速享用DeepSeek满血版的强大功能,还将加速人工智能项目的落地与应用。 经过测试和验证,DeepSeek满血版在搭载国产GPU的裸金属机型上于多个领域都展现出了不凡的性能。在智能客服场景中,能够快速理解用户的复杂问题,并给出准确且人性化的回答。与其他同类模型相比,在语义理解的准确性和文本生成的流畅性方面都具有明显优势,为各行业的智能化升级提供了有力支持。 金山云星流训推平台多机部署步骤 为加速企业AI规模化落地,金山云推出了模型在线服务功能,提供从模型部署到调用的服务能力。聚焦高效部署与分布式推理协同,该平台可通过智能任务调度与跨节点并行计算,实现模型的高效推理。无需复杂配置,用户即可在公有云环境构建稳定、高性价比的模型服务。 此前金山云星流训推平台已支持DeepSeek蒸馏版的部署,现支持多机部署DeepSeek满血版,可实现分布式推理。 多机部署步骤详情如下: 1. 进入算力平台控制台并创建资源池 2. 进入模型在线服务导航页 3. 点击新建,创建模型在线服务 a. 选择R1或V3模型,平台默认勾选多机部署,用户可自主配置服务副本数以及多机部署的节点数量 b. 填写基本信息、资源、网络等配置 c. 点击确认,模型开始部署 4. 调用模型服务。模型部署成功后,即可对模型进行调用,金山云当前支持接口和WebUI两种调用方式,相应的调用操作流程如下: a. 接口调用,详细步骤见 https://mp.weixin.qq.com/s/K8tt3b7DB30r0yz7Pq9vmA b. WebUI调用,模型部署成功后点击模型名称进入模型概览页,点击访问WebUI即可通过WebUI形式实现模型调用 首次进入WebUI页面需注册用户账号,注册完成后登录即可使用界面实现调用。 (责任编辑:郭健东 )
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com |