DeepSeek 是哪个公司的:深度解析幻方科技的 AI 新星

Published
Reviewed

How this article is maintained

This page is maintained by an independent editorial team. We add concise summaries, direct source links when available, and update high-traffic articles when product details change.

Publisher: Qwen-3 Editorial TeamRead editorial policySend corrections

Editorial Summary

深入探讨幻方科技旗下的 DeepSeek 如何通过技术创新重塑大语言模型格局

DeepSeek(深度求索)是由幻方科技创立的人工智能公司,专注于大语言模型的研发和创新。公司由幻方科技创始人梁文锋创立,是中国大模型领域极少数专注于基础研究的公司之一。

母公司背景:幻方科技

幻方科技是中国领先的量化私募基金公司:

  • 成立于2016年
  • 总部位于杭州
  • 在AI和量化交易领域有深厚积累
  • 提前储备万张A100芯片用于AI研发

DeepSeek核心技术突破

创新架构

DeepSeek在模型架构上实现重大突破:

  • MLA(多头潜在注意力机制)架构,降低显存占用5%-13%
  • DeepSeekMoE架构实现计算量优化
  • 训练效率提升至业界领先水平

成本优势

通过技术创新大幅降低成本:

  • DeepSeek-V3训练成本仅550万美元
  • 仅用2048块GPU,训练时间不到2个

Related Articles