2025新年开头,中国DeepSeek人工智能软件震惊世界!
1月27日,中国软件DeepSeek(深度求索)应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
DeepSeek 是一家由中国深度求索公司致力于开发高效、高性能的生成式 AI 模型。自 2023 年 7 月成立以来,DeepSeek 在短短一年多的时间里取得了显著的进展,推出了多个引人注目的开源模型,包括 DeepSeek Coder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3 和 DeepSeek-R1。
早在去年12月,该公司推出的DeepSeek-V3通过优化模型架构和基础设施等方式,展现了极致性价比。从该团队正式发布的技术报告来看,包括预训练、上下文长度外推和后训练在内,DeepSeek-V3完整训练只需2.788M H800 GPU小时,其训练成本仅为557万美元,但该模型实现了与GPT-4o和Claude Sonnet 3.5(来自美国人工智能企业Anthropic)等顶尖模型相媲美的性能。
当时著名人工智能科学家卡帕西(Andrej Karpathy)就发文表示,这种级别的能力通常需要接近16000颗GPU的集群,而目前市场上的集群规模更是达到了10万颗GPU左右。
据公开资料了解,DeepSeek(深度求索)创始人梁文峰出生于1980年代广东一个五线城市,本硕就读于浙江大学,攻读人工智能专业。2008年,梁文峰开始致力于量化对冲领域的研究,2015年创立了幻方量化,之后规模扩张迅速,随后2023年7月成立DeepSeek ,据了解,而DeepSeek的创立源于梁文峰在幻方量化时期对AGI的向往和热衷。
DeepSeek的崛起,不仅震动了国内科技界,更引起了美国科技界的广泛关注。知名投资人马克·安德森对DeepSeek R1给予了高度评价,称其为“我见过的最令人惊叹和印象深刻的突破之一”。而AI科技初创公司Scale AI的创始人亚历山大·王更是直言,DeepSeek的AI大模型发布可能会“改变一切”,让美国在人工智能竞赛中的领先地位受到挑战。
据证券时报报道,一名人工智能行业资深业内人士向记者分析称,DeepSeek以200人左右的小团队,且不依靠外部融资,做出了一个有性价比并被全球主流AI界人士所认可的大模型。“一是他们在早期就买了很多算力卡,投入了很多资源做研究;二是他们是做量化的,不像大厂有其他各种各样的盈利需求,也跟他们不构成竞争关系,能更专注于模型开发。”该业内人士表示。
DeepSeek 发展历程
2023 年 7 月:DeepSeek 成立,总部位于杭州。
2023 年 11 月 2 日:发布首个开源代码大模型 DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务。
2023 年 11 月 29 日:推出参数规模达 670 亿的通用大模型 DeepSeek LLM,包括 7B 和 67B 的 base 及 chat 版本。
2024 年 5 月 7 日:发布第二代开源混合专家(MoE)模型 DeepSeek-V2,总参数达 2360 亿,推理成本降至每百万 token 仅 1 元人民币。
2024 年 12 月 26 日:发布 DeepSeek-V3,总参数达 6710 亿,采用创新的 MoE 架构和 FP8 混合精度训练,训练成本仅为 557.6 万美元。
2025 年 1 月 20 日:发布新一代推理模型 DeepSeek-R1,性能与 OpenAI 的 o1 正式版持平,并开源。
2025 年 1 月 26 日:DeepSeek 登顶美区 App Store 免费榜第六,超越 Google Gemini 和 Microsoft Copilot 等产品。
声明:本站属公益性没有商业目的的网站,上列文章仅供个人学习参考。本站所发布文章为原创的均标注作者或来源,未经授权不得转载,许可转载的请注明出处。本站所载文章除原创外均来源于网络,如有未注明出处或标注错误或侵犯了您的合法权益,请及时联系我们!
欢迎关注本站(可搜索)"养鱼第一线"微信公众帐号和微信视频号"养鱼第一线刘文俊视频号"以及头条号"水花鱼@渔人刘文俊"!