DeepSeek(深度求索)

DeepSeek(深度求索)

深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,深度求索团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大模型,并在2024年1月率先开源国内首个MoE大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。和 DeepSeek AI 对话,轻松接入 API。
0230
曹植大语言模型

曹植大语言模型

曹植大模型管理平台(LLMP,large language model platform)可应用于对自研及开源大模型集中管理、调度、扩展;实现模型fine-tuning;实现训练数据管理、模型训练、模型评估、模型服务、指令Prompt工程、模型训练监控、GPU集群监控等的全方位管理,广泛应用于金融、工业制造、政府等具有文本内容 生成场景、知识管理及问答场景的行业,为企业构建规范的大模型管理及训练执行流程,将数据、模型、服务、指令管理及系统监控等流程规范化并实现有效闭环,手把手式引导企业构建完善的大模型运维模式及管理体系。
0150