DeepSeek 是哪个公司的:深度解析幻方科技的 AI 新星

发布时间
最近审校

本文如何维护

本页由独立编辑团队维护。我们会补充简洁摘要、可访问的来源链接,并在高访问页面上根据产品变化持续更新信息。

发布方: Qwen-3 Editorial Team查看编辑政策提交更正

编辑摘要

深入探讨幻方科技旗下的 DeepSeek 如何通过技术创新重塑大语言模型格局

DeepSeek(深度求索)是由幻方科技创立的人工智能公司,专注于大语言模型的研发和创新。公司由幻方科技创始人梁文锋创立,是中国大模型领域极少数专注于基础研究的公司之一。

母公司背景:幻方科技

幻方科技是中国领先的量化私募基金公司:

  • 成立于2016年
  • 总部位于杭州
  • 在AI和量化交易领域有深厚积累
  • 提前储备万张A100芯片用于AI研发

DeepSeek核心技术突破

创新架构

DeepSeek在模型架构上实现重大突破:

  • MLA(多头潜在注意力机制)架构,降低显存占用5%-13%
  • DeepSeekMoE架构实现计算量优化
  • 训练效率提升至业界领先水平

成本优势

通过技术创新大幅降低成本:

  • DeepSeek-V3训练成本仅550万美元
  • 仅用2048块GPU,训练时间不到2个

相关文章