DeepSeek
DeepSeek是杭州深度求索公司推出的AI大模型,集成自然语言处理、多模态理解与强化学习技术,支持文本生成、代码开发、数据分析等场景,凭借开源策略与高效推理能力,成为全球增长最快的AI工具之一。
全称:
杭州深度求索人工智能基础技术研究有限公司中文简称:
深度求索英文名:
DeepSeek成立日期:
2023年7月17日创立方:
幻方量化主要业务:
工程和技术研究和试验发展、人工智能应用软件开发、信息技术咨询服务等发展历程
早期发展
2023年4月,幻方量化宣布将全力投入人工智能技术,成立独立研究公司深度求索(DeepSeek)。7月17日,DeepSeek在杭州市拱墅区市场监督管理局登记成立。8月2日,注册资本变更为1000万元,市场主体类型变更为其他有限责任公司。10月,DeepSeek完成Pre-A轮融资,由幻方量化领投。
2024年1月5日,DeepSeek发布首个大模型DeepSeek LLM,包含670亿参数。5月,宣布开源第二代MoE大模型DeepSeek-V2,性能比肩GPT-4Turbo,价格仅为GPT-4的百分之一。9月5日,宣布合并DeepSeek Coder V2和DeepSeek V2 Chat,推出全新的DeepSeek V2.5新模型。11月20日,推理模型DeepSeek-R1-Lite预览版正式上线。12月26日,宣布模型DeepSeek-V3首个版本上线并同步开源。

2025年1月11日,DeepSeek官方App正式发布并上线iOS与安卓应用市场。1月20日,正式发布DeepSeek-R1模型,性能比肩OpenAI o1正式版。1月24日,在Arena排名中升至全类别大模型第三。1月27日,应用登顶15个国家和地区的苹果应用商店免费APP下载排行榜。1月31日,DeepSeek R1 671b作为英伟达NIM微服务预览版发布。2月,DeepSeek-R1、V3、Coder等系列模型陆续上线国家超算互联网平台。2月1日,日活跃用户数突破3000万大关。2月2日,攀升至140个国家的苹果App Store下载排行榜首位。2月9日,App累计下载量超1.1亿次,周活跃用户规模最高近9700万。2月10日,比亚迪宣布“璇玑架构”全面接入DeepSeek。2月16日,深圳市基于政务云环境提供DeepSeek模型应用服务。2月21日,腾讯AI助手“腾讯元宝”完成产品更新,接入DeepSeek-R1满血版等四个模型。2月24日,启动“开源周”,首个开源代码库为FlashMLA。2月26日,宣布开源DeepGEMM。2月27日,发布“开源周”第四日内容:优化的并行策略。2月28日,开源面向DeepSeek全数据访问的推进器3FS。3月14日,荣耀MagicOS的荣耀文档应用正式接入DeepSeek模型满血版。3月24日,DeepSeek V3模型完成小版本升级。4月4日,与清华大学研究团队联合发布论文,提出自我原则点评调优与元奖励模型两项核心技术。4月30日,发布DeepSeek-Prover-V2-671B模型及DeepSeek-Prover-V2-7B(增强模型)模型,以及DeepSeek-ProverBench数据集。5月28日,DeepSeek R1模型完成小版本试升级。7月,用户使用率骤降,官网访问量下滑。8月19日,线上模型版本升级至V3.1。8月21日,正式对外发布DeepSeek-V3.1,包含混合推理架构等变化。9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。10月13日,DeepSeek开源大语言模型入选“2025全球十大工程成就”。10月20日,在开源社区Hugging Face上发布模型DeepSeek-OCR。11月,推出数学推理模型DeepSeekMath-V2。12月1日,同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
2026年1月1日,公布新论文《mHC: Manifold-Constrained Hyper-Connections》,提出新架构mHC。1月27日,团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型。
公司架构
管理人员
经理、董事:裴湉
监事:王苗军
财务负责人:王贤祖
员工人数
2025年,DeepSeek有160名员工。
股东信息
宁波程恩企业管理咨询合伙企业,持股比例99%,认缴出资额990万元
梁文锋,持股比例1%,认缴出资额10万元
对外投资
北京深度求索人工智能基础技术研究有限公司,成立日期2023年5月16日,持股比例100%
宁波程采企业管理咨询合伙企业,成立日期2021年5月14日,持股比例0.1%
主要产品
DeepSeek LLM
包含670亿参数,在一个包含2万亿token的数据集上训练,涵盖中英文。全部开源DeepSeek LLM 7B/67B Base和DeepSeek LLM 7B/67B Chat。
DeepSeek Coder
由一系列代码语言模型组成,每个模型均从零开始在2万亿token上训练,包含87%的代码和13%的中英文自然语言。
DeepSeekMath
以DeepSeek-Coder-v1.5 7B为基础,在数学相关token以及自然语言和代码数据上进行预训练,训练规模达5000亿token。
DeepSeek-VL
开源的视觉-语言模型,采用混合视觉编码器,能够高效处理高分辨率图像。
DeepSeek-VL2
先进的大型混合专家视觉-语言模型系列,在多种任务中展现卓越能力。
DeepSeek-V2
拥有2360亿参数,中文综合能力超过GPT-4,与GPT-4-Turbo、文心4.0等闭源模型处于同一梯队。
DeepSeek-Coder-V2
开源的混合专家代码语言模型,在代码特定任务中达到与GPT4-Turbo相当的性能。
DeepSeek-V2.5
与GPT-4-Turbo、文心4.0等闭源模型在评测中处于同一梯队,英文综合能力与LLaMA3-70B处于同一梯队。
DeepSeek-V3
6710亿参数的专家混合模型,激活参数370亿,在14.8万亿token上预训练。多项评测成绩超越Qwen2.5-72B和Llama-3.1-405B等开源模型。
DeepSeek-R1-Lite预览版
在美国数学竞赛和全球顶级编程竞赛等评测中超越GPT-4o等模型。
DeepSeek-R1模型
性能比肩OpenAI o1正式版,基准测试升至全类别大模型第三。
DeepSeek-Prover-V2-671B模型
使用了更高效的safetensors文件格式,支持多种计算精度,参数达6710亿。
DeepSeek-V3.1
在多项搜索评测指标上取得较大提升,引入混合推理架构,提升思考效率。
DeepSeek-V3.2-Exp
引入稀疏Attention架构,降低计算资源消耗并提升模型推理效率。
DeepSeek-OCR
用来从图像中提取文本,被描述为关于通过光学二维映射来压缩长上下文可行性的初步研究。
DeepSeekMath-V2
基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。
DeepSeek-V3.2
平衡推理能力与输出长度,适合日常使用。
DeepSeek-V3.2-Speciale
DeepSeek-V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力。
DeepSeek-OCR 2
采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分。

业务数据
据某AI产品榜统计数据,DeepSeek应用在上线仅20天后,日活跃用户数达到2215万。2025年2月1日,日活跃用户数突破3000万大关。截至2月9日,App累计下载量超1.1亿次,周活跃用户规模最高近9700万。3月31日,据报道,DeepSeek在2月录得5.247亿次新的网站访问量。7月,全球用户使用率骤降至3%,官网访问量在2月至5月期间下滑63%。2025年二季度,月均下载量从第一季度的8111.3万降至2258.9万,降幅高达72.2%。
定价收益
DeepSeek API定价:每百万输入Tokens 1元(缓存命中)/4元(缓存未命中),每百万输出Tokens 16元。模型优惠期至北京时间2025年2月8日24:00,优惠结束后按每百万输入 tokens 2元,每百万输出 tokens 8元计费。deepseek-reasoner 模型上线即按每百万输入 tokens 4元,每百万输出 tokens 16元计费。2月26日,实行错峰优惠定价,每日优惠时段为北京时间00:30-08:30,DeepSeek-V3降至原价的50%,DeepSeek-R1低至25%。
合作机构
2025年3月,上海消防携手DeepSeek对3类场景开展深度应用。多家银行部署DeepSeek系列模型,应用场景覆盖智能客服、信贷审批、智能营销、风险管理、经营办公等业务领域。
相关评价
行业机构评价
中信证券评价,DeepSeek新一代模型的发布预示着AI大模型应用将逐渐走向普惠,推动AI应用广泛落地。同时,训练效率显著提升,将进一步推动推理算力需求增长。持续看好AI产业链的加速落地机遇,建议关注AI应用、AI Infra、AI算力三大主线。
科技界人士评价
Scale AI创始人Alexander Wang认为,DeepSeek-V3是中国科技界给美国的苦涩教训,当美国休息时,中国科技界仍在工作,以更低的成本、更快的速度和更强的实力迎头赶上。DeepSeek在测试中表现最佳,与美国顶尖模型相当。
游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥称,DeepSeek可能是个国运级别的科技成果。
前谷歌首席执行官埃里克·施密特表示,DeepSeek的崛起标志着全球人工智能竞赛的转折点,证明中国可以用更少的资源与大型科技公司竞争。
美国开放人工智能研究中心首席执行官萨姆·奥尔特曼评价,DeepSeek-R1是一款令人印象深刻的模型,尤其是考虑到其价格与性能的平衡。
小鹏汽车CEO何小鹏认为,DS大模型给全球科技圈带来震撼,既实现了媲美OpenAI的体验,又将成本压缩到极低。未来十年,AI将驱动汽车发生远超电动化的变革。
政界人士评价
俄罗斯外交部长拉夫罗夫表示,中国科学家在人工智能领域取得的成就,包括DeepSeek的出现,超越了美国相关研发人员在该领域的成果。
美国总统特朗普认为,中国人工智能初创公司DeepSeek的崛起应当为美国企业敲响警钟,美国公司需要专注于竞争以赢得胜利。DeepSeek崛起也可能传递了一种积极信号。
印度铁道、通信以及电子和信息技术部长阿什维尼·瓦伊什瑙评价,DeepSeek以其低成本的AI模型震撼了该行业。
十四届全国人大三次会议大会发言人娄勤俭表示,DeepSeek公司取得的重大进展,代表着一批中国公司在人工智能领域的崛起。DeepSeek公司坚持开放开源的技术路线,开源共享推动了人工智能技术在全球的普遍应用,为世界贡献了“中国智慧”。通过DeepSeek这类公司的兴起,可以看到中国在科技发展上的创新性和包容性。
中国证券监督管理委员会主席吴清表示,DeepSeek在全球脱颖而出,不仅使人工智能领域行业深受震动,也让世界、让财经界对中国科技创新的能力有了新的认识,某种程度上带动了对中国资产价值的重估。

学术期刊评价
Nature评价,几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。
获得荣誉
| 荣誉名称 | 获奖时间 |
|---|---|
| 入选2025年度最佳发明榜单 | 2025年10月10日 |
| 2025福布斯中国人工智能科技企业TOP50 | 2025年5月11日 |
相关阅读
DeepSeek作为国内AI领域的技术标杆,其官网及多平台服务正以开放姿态吸引用户深度体验。从技术突破到产品矩阵,从创始人故事到多端适配,以下整合关键信息为你呈现客观解读。
【官网入口与核心功能】
DeepSeek官方网页版支持手机号、邮箱及微信扫码登录,中国大陆手机号可自动完成注册。登录后进入模块化工作台,顶部搜索栏支持自然语言指令输入,例如“生成Python爬虫代码”或“总结技术文档”。中央结果区以卡片形式呈现文本、代码、表格等内容,支持复制、导出为TXT/JSON格式,右侧工具栏可实时调节temperature、max_tokens等参数。文件解析功能支持PDF、DOCX、CSV等格式,上传后可通过“问答式检索”定位合同条款或技术参数,系统自动高亮引用依据。
【在线使用与免登录体验】
无需安装客户端即可通过浏览器调用全部AI能力。用户进入网页版后,在搜索栏输入指令如“将英文翻译成中文:The model achieves SOTA performance”,系统默认启用对话式交互,自动路由至NLP或代码引擎。对生成结果不满意时,可点击卡片右上角齿轮图标调整输出风格,例如将temperature设为0.3以优化翻译准确性。选中部分文字后右键触发“解释”“扩写”等上下文命令,支持对长文本进行分段处理。

【创始人梁文锋的技术信仰】
1985年出生于广东湛江的梁文锋,拥有浙江大学信息与电子工程学系硕士背景,是量化私募领域的技术派代表。2023年创立DeepSeek后,他带领团队突破传统大模型架构,2025年1月发布的DeepSeek-R1模型凭借深度思考与推理能力引发热议。同年他受邀参加国务院总理主持的专家座谈会,其“技术突破应服务于普惠应用”的理念贯穿产品开发始终。区别于烧钱换流量的竞争模式,DeepSeek选择通过API开放平台与开发者共建生态,目前模型调用量已突破百亿次。
【发音与产品矩阵解析】
“DeepSeek”英音读作[ˈdiːpˌsiːk],美音同音,意为“深度求索”。产品矩阵包含三大方向:其一,专业模型线涵盖DeepSeek-V3.2(通用大模型)、DeepSeek Coder V2(代码生成)、DeepSeek Math(数学推理);其二,场景化应用包括网页版、APP及API开放平台;其三,生态合作产品如百度版、元宝集成版。其中百度版融合文心大模型能力,在医疗健康、AI阅读等场景表现突出;元宝版则整合腾讯混元模型,强化社交文案生成功能。
【多平台对比与选择建议】
与豆包、千问等超级应用相比,DeepSeek的核心优势在于技术深度与场景专注度。豆包依托字节生态实现1.72亿月活,擅长多模态创作与全民交互;千问凭借阿里技术积累,在股票分析、专业咨询等领域形成壁垒。而DeepSeek选择差异化路线:网页版与APP提供免费基础服务,API接口面向开发者开放高级功能,例如金融风控、科研文献分析等垂直场景。对于普通用户,网页版足够完成文档处理、语言翻译等日常需求;开发者则可通过API调用R1模型的推理能力,按使用量付费。
【手机端适配与下载指南】
官方安卓版最新为1.6.10版本,应用大小12.6M,支持语音输入、滤镜美颜等附加功能。iOS用户可通过App Store搜索“DeepSeek”下载,安装后授予麦克风、相册等权限即可使用。移动端延续网页版核心功能,优化了触控操作体验,例如长按结果卡片可快速分享至微信、钉钉。实测显示,在4G网络下文档解析响应时间控制在3秒内,代码生成准确率达92%。
【免费体验与数据安全】
所有用户均可免费使用基础功能,包括每日50次文件解析、100次问答交互。高级功能如长文本处理、多轮对话管理需通过实名认证后解锁。数据安全方面,官网采用端到端加密传输,会话记录默认保留30天,用户可手动导出或删除。隐私政策明确禁止数据用于商业广告推送,符合GDPR与《个人信息保护法》要求。

【生态合作与未来布局】
2026年初与百度、腾讯达成的技术合作,标志着DeepSeek从技术供应商向平台服务商转型。百度版接入文心大模型后,智能创作模块的工作总结生成效率提升40%;元宝版则通过微信生态,实现朋友圈文案的一键生成与分享。创始人梁文锋在近期访谈中透露,2026年将重点布局AI Agent开发框架,允许用户自定义工作流,例如构建“市场分析+PPT生成+邮件分发”的全自动流程。
当前DeepSeek正以技术普惠为核心理念,通过多端适配、生态合作降低AI使用门槛。无论是科研人员处理文献,还是职场人士撰写报告,亦或是开发者训练模型,都能在这个开放平台上找到价值支点。[1][2][3][4][5][6][7][8][9][10][11][12][13][14]
词条图片





