首页 > 百科 > 豆包(AI助手)

豆包(AI助手)

百科
2026年4月6日 清欢
      豆包是字节跳动公司自主研发的综合性人工智能产品矩阵,核心包含豆包大模型(原名 “云雀”)与豆包 AI 智能助手两大核心板块,依托字节跳动自研技术基座,覆盖个人消费级与企业级全场景,是国内首批通过算法备案的 AI 产品之一,也是国内使用量最大、应用场景最丰富的 AI 产品矩阵之一。

一、基本信息

  • 官方名称:豆包(Doubao)
  • 开发主体:字节跳动科技(北京)有限公司
  • 核心定位:多模态 AI 基础设施(豆包大模型)+ 全场景 AI 智能助手(豆包 AI 助手),兼顾个人用户与企业客户需求
  • 技术基底:基于 Transformer 架构的混合专家(MoE)大语言模型,核心为字节跳动自研的 “云雀”(Skylark)大模型,无外部开源模型或第三方技术依赖
  • 官方渠道:官网(www.doubao.com)、全平台客户端(iOS/Android/Windows/macOS)、网页版及浏览器插件
  • 核心特性:中文优化能力突出、多模态融合、低时延响应、高性价比,支持跨平台同步使用

二、核心构成与技术体系

(一)豆包大模型

      豆包大模型是字节跳动自研的多模态大模型家族,原名 “云雀”,定位为 AI 基础设施,支撑全场景 AI 能力落地,于 2024 年 5 月 15 日在 “2024 春季火山引擎 Force 原动力大会” 上正式发布,后续持续迭代升级,形成了覆盖通用与细分领域的完整模型矩阵。
  • 模型家族构成:包含 2 个通用模型(豆包通用模型 Pro、豆包通用模型 Lite)与 7 个细分领域模型(角色扮演模型、语音识别模型、语音合成模型、声音复刻模型、文生图模型、Function Call 模型、向量化模型),共计 9 个核心模型,可满足不同场景的差异化需求。
  • 技术特点:采用大规模稀疏 MoE 架构,等效 7 倍激活参数的 Dense 模型性能,训练成本降低 90%;具备动态注意力机制,支持 32K 上下文窗口(可扩展至百万级 token),长文本处理能力突出;实现端到端语音处理,支持低时延对话、情绪承接与方言理解;集成多模态融合技术,可高效处理文本、图像、音频、视频等多类型输入输出。
  • 核心能力:覆盖自然语言理解与生成、代码创作(支持 30 + 编程语言,准确率达 95%)、数学推理(可解决 AIME 级别证明,GSM8K 测试表现超越 GPT-4)、语音处理、图像生成与分析、复杂任务自动化等,适用于企业级服务、科研、教育及工业等多领域。
  • 商业化定价:主力模型在企业市场定价为 0.0008 元 / 千 Tokens,处理 1500 多个汉字仅需 0.8 厘,比行业低 99%,TPM 限额为同规格模型的 2.7 倍到 8 倍,大幅降低企业接入门槛。

(二)豆包 AI 智能助手

      豆包 AI 智能助手是基于豆包大模型开发的全场景应用载体,采用 “智能助手 + 场景化工具” 模式,覆盖日常生活、学习、办公等个人场景,同时通过火山引擎向企业客户开放 API 接口,实现商业化落地。
  • 多端覆盖:支持网页版、iOS 版、安卓版、Windows 桌面版、macOS 桌面版及浏览器插件,可通过手机号码、抖音账号、苹果账号登录,实现跨设备同步使用。
  • 核心功能矩阵
    • 对话问答:支持复杂问题解答、多轮对话及专业领域咨询(法律、医疗、技术等),中文理解准确率达 96%;
    • 内容创作:涵盖文本生成(文章、报告、邮件等)、图像生成与编辑(基于 SeedEdit 模型)、音乐生成(11 种风格可选)、视频生成(基于 PixelDance、Seaweed 模型);
    • 学习辅导:覆盖 K12 至高等教育,提供解题答疑、语言学习(中英日韩等 119 种语言)、考试策略指导;
    • 办公辅助:支持 AI 划词、网页总结、脑图生成、会议纪要快速整理(2 小时会议纪要 5 分钟搞定)、PPT 生成等功能;
    • 开发辅助:代码补全、调试建议、算法解释及技术文档生成,集成 MarsCode 编程助手能力;
    • 交互升级:支持语音输入、语音通话、实时视频通话,基于端到端语音大模型,交互流畅度接近真人,平均响应延迟控制在 800 毫秒以内。
     

三、发展历程(官方公开)

  • 2016 年:字节跳动成立人工智能实验室(AI Lab),聚焦自然语言处理、机器学习、数据挖掘等领域研究,为豆包的研发奠定技术基础;
  • 2023 年 6 月:字节跳动内部测试 AI 对话类产品 “Grace”,处于完善优化阶段;
  • 2023 年 8 月:“Grace” 新版本更名为 “豆包”,启动小范围邀请测试,支持多账号登录,具备基础文本生成与语音播报功能;
  • 2024 年 5 月 15 日:在火山引擎 Force 原动力大会上,豆包大模型正式发布,豆包 APP 总下载量突破 1 亿次,大模型开启商业化进程;
  • 2024 年 6 月 3 日:豆包推出 Windows/macOS 桌面客户端,新增快捷启动、AI 划词、AI 搜索功能;
  • 2024 年 8 月 – 11 月:陆续上线音乐生成、脑图生成、语音输入、图片上传、视频生成内测等功能,10 月推出首款 AI 智能体耳机 Ola Friend,11 月底豆包 APP 累计用户规模超 1.6 亿;
  • 2025 年 1 月 – 3 月:发布端到端语音大模型,升级实时语音通话功能;开源 SuperGPQA 知识推理基准测试;抖音 APP 测试接入豆包 AI 能力,开放两大超级入口;测试新版 “深度思考” 功能;
  • 2025 年 4 月 – 12 月:深度思考和文生图 3.0 模型通过火山引擎开放 API;上线实时视频通话功能;发布豆包大模型 1.8,在视觉推理等任务中表现突出;12 月豆包日均活跃用户(DAU)突破 1 亿大关,月活跃用户达 1.5742 亿,居中国 AI 应用产品首位;
  • 2026 年 2 月 14 日:豆包大模型 2.0 正式发布,围绕大规模生产环境使用需求做系统性优化;同期上线视频生成模型 Seedance 2.0。

四、应用场景与市场表现

(一)应用场景

  • 个人场景:日常对话、内容创作(文案、小说、歌词等)、学习辅导(解题、语言学习)、办公效率提升(会议纪要、文档处理)、娱乐生成(音乐、视频、图像)等;
  • 企业场景:通过火山引擎向企业客户开放服务,应用于智能客服、自动化文档处理、风险预测、医疗影像分析、司法文书生成、制造业流程优化等领域,已在字节跳动内部 50 多个业务场景应用验证;
  • 特色场景:与故宫博物院合作开发 “文物解说官”;为比亚迪等企业提供车辆故障诊断等智能服务;在全国 15 个法院部署,辅助法官处理案例检索等工作。

(二)市场表现

  • 用户规模:截至 2024 年 11 月底,豆包 APP 累计用户超 1.6 亿;2025 年 3 月底,豆包大模型日均调用量达 12.7 万亿次;2025 年 8 月,月活跃用户达 1.5742 亿,居中国 AI 应用产品首位;2025 年 12 月,豆包日均活跃用户(DAU)突破 1 亿大关,成为国内首个 DAU 破亿的 AI 原生应用,累计服务用户超 3 亿,覆盖全球 100 多个国家和地区。
  • 商业成果:截至 2025 年底,豆包大模型已服务超 10 万家企业客户,覆盖互联网、金融、医疗、教育、制造等 20 多个行业,企业客户复购率达 85% 以上;2026 年第一季度,豆包相关业务营收同比增长 300%,成为字节跳动新兴业务增长核心引擎之一。
  • 行业认可:多次通过国内权威 AI 评测,在中文理解、数学推理、代码生成等维度稳居行业前列;先后获得 “2024 年度最佳 AI 产品”“中国人工智能创新应用标杆” 等多项行业奖项;豆包大模型通过国家网络安全等级保护三级认证,算法及数据安全符合《生成式人工智能服务管理暂行办法》要求,相关技术专利累计申请超 2000 项。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧

猜你喜欢

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索