DeepSeek

DeepSeek是杭州深度求索公司推出的AI大模型，集成自然语言处理、多模态理解与强化学习技术，支持文本生成、代码开发、数据分析等场景，凭借开源策略与高效推理能力，成为全球增长最快的AI工具之一。

全称：

杭州深度求索人工智能基础技术研究有限公司

中文简称：

深度求索

英文名：

DeepSeek

成立日期：

2023年7月17日

创立方：

幻方量化

主要业务：

工程和技术研究和试验发展、人工智能应用软件开发、信息技术咨询服务等

发展历程

早期发展

2023年4月，幻方量化宣布将全力投入人工智能技术，成立独立研究公司深度求索（DeepSeek）。7月17日，DeepSeek在杭州市拱墅区市场监督管理局登记成立。8月2日，注册资本变更为1000万元，市场主体类型变更为其他有限责任公司。10月，DeepSeek完成Pre-A轮融资，由幻方量化领投。

2024年1月5日，DeepSeek发布首个大模型DeepSeek LLM，包含670亿参数。5月，宣布开源第二代MoE大模型DeepSeek-V2，性能比肩GPT-4Turbo，价格仅为GPT-4的百分之一。9月5日，宣布合并DeepSeek Coder V2和DeepSeek V2 Chat，推出全新的DeepSeek V2.5新模型。11月20日，推理模型DeepSeek-R1-Lite预览版正式上线。12月26日，宣布模型DeepSeek-V3首个版本上线并同步开源。

DeepSeek(图1)

2025年1月11日，DeepSeek官方App正式发布并上线iOS与安卓应用市场。1月20日，正式发布DeepSeek-R1模型，性能比肩OpenAI o1正式版。1月24日，在Arena排名中升至全类别大模型第三。1月27日，应用登顶15个国家和地区的苹果应用商店免费APP下载排行榜。1月31日，DeepSeek R1 671b作为英伟达NIM微服务预览版发布。2月，DeepSeek-R1、V3、Coder等系列模型陆续上线国家超算互联网平台。2月1日，日活跃用户数突破3000万大关。2月2日，攀升至140个国家的苹果App Store下载排行榜首位。2月9日，App累计下载量超1.1亿次，周活跃用户规模最高近9700万。2月10日，比亚迪宣布“璇玑架构”全面接入DeepSeek。2月16日，深圳市基于政务云环境提供DeepSeek模型应用服务。2月21日，腾讯AI助手“腾讯元宝”完成产品更新，接入DeepSeek-R1满血版等四个模型。2月24日，启动“开源周”，首个开源代码库为FlashMLA。2月26日，宣布开源DeepGEMM。2月27日，发布“开源周”第四日内容：优化的并行策略。2月28日，开源面向DeepSeek全数据访问的推进器3FS。3月14日，荣耀MagicOS的荣耀文档应用正式接入DeepSeek模型满血版。3月24日，DeepSeek V3模型完成小版本升级。4月4日，与清华大学研究团队联合发布论文，提出自我原则点评调优与元奖励模型两项核心技术。4月30日，发布DeepSeek-Prover-V2-671B模型及DeepSeek-Prover-V2-7B（增强模型）模型，以及DeepSeek-ProverBench数据集。5月28日，DeepSeek R1模型完成小版本试升级。7月，用户使用率骤降，官网访问量下滑。8月19日，线上模型版本升级至V3.1。8月21日，正式对外发布DeepSeek-V3.1，包含混合推理架构等变化。9月29日，DeepSeek-V3.2-Exp模型正式发布并开源。10月13日，DeepSeek开源大语言模型入选“2025全球十大工程成就”。10月20日，在开源社区Hugging Face上发布模型DeepSeek-OCR。11月，推出数学推理模型DeepSeekMath-V2。12月1日，同时发布两个正式版模型：DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

2026年1月1日，公布新论文《mHC: Manifold-Constrained Hyper-Connections》，提出新架构mHC。1月27日，团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文，并开源DeepSeek-OCR 2模型。

公司架构

管理人员

经理、董事：裴湉
监事：王苗军
财务负责人：王贤祖

员工人数

2025年，DeepSeek有160名员工。

股东信息

宁波程恩企业管理咨询合伙企业，持股比例99%，认缴出资额990万元
梁文锋，持股比例1%，认缴出资额10万元

对外投资

北京深度求索人工智能基础技术研究有限公司，成立日期2023年5月16日，持股比例100%
宁波程采企业管理咨询合伙企业，成立日期2021年5月14日，持股比例0.1%

主要产品

DeepSeek LLM

包含670亿参数，在一个包含2万亿token的数据集上训练，涵盖中英文。全部开源DeepSeek LLM 7B/67B Base和DeepSeek LLM 7B/67B Chat。

DeepSeek Coder

由一系列代码语言模型组成，每个模型均从零开始在2万亿token上训练，包含87%的代码和13%的中英文自然语言。

DeepSeekMath

以DeepSeek-Coder-v1.5 7B为基础，在数学相关token以及自然语言和代码数据上进行预训练，训练规模达5000亿token。

DeepSeek-VL

开源的视觉-语言模型，采用混合视觉编码器，能够高效处理高分辨率图像。

DeepSeek-VL2

先进的大型混合专家视觉-语言模型系列，在多种任务中展现卓越能力。

DeepSeek-V2

拥有2360亿参数，中文综合能力超过GPT-4，与GPT-4-Turbo、文心4.0等闭源模型处于同一梯队。

DeepSeek-Coder-V2

开源的混合专家代码语言模型，在代码特定任务中达到与GPT4-Turbo相当的性能。

DeepSeek-V2.5

与GPT-4-Turbo、文心4.0等闭源模型在评测中处于同一梯队，英文综合能力与LLaMA3-70B处于同一梯队。

DeepSeek-V3

6710亿参数的专家混合模型，激活参数370亿，在14.8万亿token上预训练。多项评测成绩超越Qwen2.5-72B和Llama-3.1-405B等开源模型。

DeepSeek-R1-Lite预览版

在美国数学竞赛和全球顶级编程竞赛等评测中超越GPT-4o等模型。

DeepSeek-R1模型

性能比肩OpenAI o1正式版，基准测试升至全类别大模型第三。

DeepSeek-Prover-V2-671B模型

使用了更高效的safetensors文件格式，支持多种计算精度，参数达6710亿。

DeepSeek-V3.1

在多项搜索评测指标上取得较大提升，引入混合推理架构，提升思考效率。

DeepSeek-V3.2-Exp

引入稀疏Attention架构，降低计算资源消耗并提升模型推理效率。

DeepSeek-OCR

用来从图像中提取文本，被描述为关于通过光学二维映射来压缩长上下文可行性的初步研究。

DeepSeekMath-V2

基于DeepSeek-V3.2-Exp-Base构建，通过LLM验证器自动审查生成的数学证明，并利用高难度样本持续优化性能。

DeepSeek-V3.2

平衡推理能力与输出长度，适合日常使用。

DeepSeek-V3.2-Speciale

DeepSeek-V3.2的长思考增强版，结合了DeepSeek-Math-V2的定理证明能力。

DeepSeek-OCR 2

采用创新的DeepEncoder V2方法，让AI能够根据图像的含义动态重排图像的各个部分。

DeepSeek(图2)

业务数据

据某AI产品榜统计数据，DeepSeek应用在上线仅20天后，日活跃用户数达到2215万。2025年2月1日，日活跃用户数突破3000万大关。截至2月9日，App累计下载量超1.1亿次，周活跃用户规模最高近9700万。3月31日，据报道，DeepSeek在2月录得5.247亿次新的网站访问量。7月，全球用户使用率骤降至3%，官网访问量在2月至5月期间下滑63%。2025年二季度，月均下载量从第一季度的8111.3万降至2258.9万，降幅高达72.2%。

定价收益

DeepSeek API定价：每百万输入Tokens 1元（缓存命中）/4元（缓存未命中），每百万输出Tokens 16元。模型优惠期至北京时间2025年2月8日24:00，优惠结束后按每百万输入 tokens 2元，每百万输出 tokens 8元计费。deepseek-reasoner 模型上线即按每百万输入 tokens 4元，每百万输出 tokens 16元计费。2月26日，实行错峰优惠定价，每日优惠时段为北京时间00:30-08:30，DeepSeek-V3降至原价的50%，DeepSeek-R1低至25%。

合作机构

2025年3月，上海消防携手DeepSeek对3类场景开展深度应用。多家银行部署DeepSeek系列模型，应用场景覆盖智能客服、信贷审批、智能营销、风险管理、经营办公等业务领域。

获得荣誉

荣誉名称	获奖时间
入选2025年度最佳发明榜单	2025年10月10日
2025福布斯中国人工智能科技企业TOP50	2025年5月11日

相关阅读

DeepSeek作为国内AI领域的技术标杆，其官网及多平台服务正以开放姿态吸引用户深度体验。从技术突破到产品矩阵，从创始人故事到多端适配，以下整合关键信息为你呈现客观解读。

【官网入口与核心功能】
DeepSeek官方网页版支持手机号、邮箱及微信扫码登录，中国大陆手机号可自动完成注册。登录后进入模块化工作台，顶部搜索栏支持自然语言指令输入，例如“生成Python爬虫代码”或“总结技术文档”。中央结果区以卡片形式呈现文本、代码、表格等内容，支持复制、导出为TXT/JSON格式，右侧工具栏可实时调节temperature、max_tokens等参数。文件解析功能支持PDF、DOCX、CSV等格式，上传后可通过“问答式检索”定位合同条款或技术参数，系统自动高亮引用依据。

【在线使用与免登录体验】
无需安装客户端即可通过浏览器调用全部AI能力。用户进入网页版后，在搜索栏输入指令如“将英文翻译成中文：The model achieves SOTA performance”，系统默认启用对话式交互，自动路由至NLP或代码引擎。对生成结果不满意时，可点击卡片右上角齿轮图标调整输出风格，例如将temperature设为0.3以优化翻译准确性。选中部分文字后右键触发“解释”“扩写”等上下文命令，支持对长文本进行分段处理。

DeepSeek(图4)

【创始人梁文锋的技术信仰】
1985年出生于广东湛江的梁文锋，拥有浙江大学信息与电子工程学系硕士背景，是量化私募领域的技术派代表。2023年创立DeepSeek后，他带领团队突破传统大模型架构，2025年1月发布的DeepSeek-R1模型凭借深度思考与推理能力引发热议。同年他受邀参加国务院总理主持的专家座谈会，其“技术突破应服务于普惠应用”的理念贯穿产品开发始终。区别于烧钱换流量的竞争模式，DeepSeek选择通过API开放平台与开发者共建生态，目前模型调用量已突破百亿次。

【发音与产品矩阵解析】
“DeepSeek”英音读作[ˈdiːpˌsiːk]，美音同音，意为“深度求索”。产品矩阵包含三大方向：其一，专业模型线涵盖DeepSeek-V3.2（通用大模型）、DeepSeek Coder V2（代码生成）、DeepSeek Math（数学推理）；其二，场景化应用包括网页版、APP及API开放平台；其三，生态合作产品如百度版、元宝集成版。其中百度版融合文心大模型能力，在医疗健康、AI阅读等场景表现突出；元宝版则整合腾讯混元模型，强化社交文案生成功能。

【多平台对比与选择建议】
与豆包、千问等超级应用相比，DeepSeek的核心优势在于技术深度与场景专注度。豆包依托字节生态实现1.72亿月活，擅长多模态创作与全民交互；千问凭借阿里技术积累，在股票分析、专业咨询等领域形成壁垒。而DeepSeek选择差异化路线：网页版与APP提供免费基础服务，API接口面向开发者开放高级功能，例如金融风控、科研文献分析等垂直场景。对于普通用户，网页版足够完成文档处理、语言翻译等日常需求；开发者则可通过API调用R1模型的推理能力，按使用量付费。

【手机端适配与下载指南】
官方安卓版最新为1.6.10版本，应用大小12.6M，支持语音输入、滤镜美颜等附加功能。iOS用户可通过App Store搜索“DeepSeek”下载，安装后授予麦克风、相册等权限即可使用。移动端延续网页版核心功能，优化了触控操作体验，例如长按结果卡片可快速分享至微信、钉钉。实测显示，在4G网络下文档解析响应时间控制在3秒内，代码生成准确率达92%。

【免费体验与数据安全】
所有用户均可免费使用基础功能，包括每日50次文件解析、100次问答交互。高级功能如长文本处理、多轮对话管理需通过实名认证后解锁。数据安全方面，官网采用端到端加密传输，会话记录默认保留30天，用户可手动导出或删除。隐私政策明确禁止数据用于商业广告推送，符合GDPR与《个人信息保护法》要求。

DeepSeek(图5)

【生态合作与未来布局】
2026年初与百度、腾讯达成的技术合作，标志着DeepSeek从技术供应商向平台服务商转型。百度版接入文心大模型后，智能创作模块的工作总结生成效率提升40%；元宝版则通过微信生态，实现朋友圈文案的一键生成与分享。创始人梁文锋在近期访谈中透露，2026年将重点布局AI Agent开发框架，允许用户自定义工作流，例如构建“市场分析+PPT生成+邮件分发”的全自动流程。

当前DeepSeek正以技术普惠为核心理念，通过多端适配、生态合作降低AI使用门槛。无论是科研人员处理文献，还是职场人士撰写报告，亦或是开发者训练模型，都能在这个开放平台上找到价值支点。^[1]^[2]^[3]^[4]^[5]^[6]^[7]^[8]^[9]^[10]^[11]^[12]^[13]^[14]