瓜5网百科 - 让权威随处可见！

瓜5网百科是瓜5网内置的百科功能，和瓜5网的内容生态深度融合，让大家在逛瓜5网的时候就能够随时看到权威的内容。

发布百科

最新百科

OpenAI Codex

百科

Codex 是由 OpenAI 研发的系列 AI 辅助软件开发工具及智能体系统，核心聚焦软件工程领域，依托 OpenAI 迭代优化的大语言模型，为开发者提供全流程编码辅助服务，产品形态覆盖云端服务、本地客户端、IDE 插件等多场景，核心价值在于降低编码门槛、提升开发效率，替代开发者完成重复性、机械性编码任务，同时辅助处理复杂软件工程相关工作。发展历程 2021 年 8 月，OpenAI 正式发布 Codex，该版本以 GPT-3 为基础模型进行专项优化，定位为代码自动补全工具，可无缝集成于 Visual Studio Code、Neovim 等主流 IDE，同时成为 GitHub Copilot 的核心驱动技术。其训练数据源自 5400 万个 GitHub 仓库中的 159GB Python 代码，具备将自然语言指令转化为多编程语言代码的核心能力，标志着 AI 辅助编码进入规模化应用阶段。 2025 年 4 月 16 日，OpenAI 在 GitHub 上以 Apache 2.0 许可证开源 Codex CLI，这是一款可本地运行的 AI 智能体工具，同时配套推出仅通过 API 提供的 Codex-mini-latest 模型 —— 该模型基于 o4-mini 优化，专门适配 Codex CLI 的本地运行场景，大幅降低了普通开发者的使用门槛，让本地场景的 AI 编码辅助成为可能。 2025 年 5 月 16 日，OpenAI 推出 Codex 研究预览版，这是一款基于云端的专业化软件工程智能体，由 OpenAI o3 版本 Codex-1 模型提供技术支持（该模型针对软件工程场景进行专项优化）。初期仅面向 ChatGPT Pro、Enterprise 及 Team 版用户开放，后续逐步拓展至 Plus 版和 Edu 版用户，此次升级标志着 Codex 从单纯的代码补全工具，正式升级为可自主处理复杂软件工程任务的智能体系统，实现了功能的跨越式提升。 2026 年 2 月，Codex 迎来密集升级：2 月 2 日推出 macOS 桌面应用，主要用于管理多个编码智能体及处理长期编码任务，进一步完善本地应用生态；2 月 5 日发布 GPT-5.3-Codex 模型，整合前沿编程性能与推理能力，运行速度较上一版本提升 25%；2 月 12 日推出 GPT-5.3-Codex-Spark，这是一款基于 Cerebras 芯片的低延迟版本，运行速度较早期版本提升 15 倍，也是 OpenAI 首个未使用 NVIDIA 芯片的生产级模型，初期作为研究预览版面向 ChatGPT Pro 用户开放。 2026 年 3 月，OpenAI 发布 GPT-5.4-Codex 模型，同时推出 Codex Security 专项功能，这是一款专注于识别并修复软件漏洞的应用安全智能体，填补了 Codex 在代码安全领域的空白。据 OpenAI 官方披露，截至 2026 年 3 月，Codex 每周活跃用户已超过 200 万，且计划将其与 ChatGPT、浏览器整合为单一桌面 “超级应用”，进一步拓展其应用边界，不再局限于软件开发领域。核心技术与工作机制技术核心 Codex 的核心技术依托 OpenAI 迭代升级的大语言模型，不同发展阶段采用不同基础模型：早期版本以 GPT-3 为基础，2025 年推出的云端智能体采用 o3 版本 Codex-1 模型，2026 年逐步迭代至 GPT-5.3 及 GPT-5.4 系列 Codex 专属模型。所有模型均针对软件工程场景进行专项训练，具备强大的代码理解、生成与优化能力，训练过程采用强化学习方法，在真实世界的各类编码环境中持续训练，确保生成的代码符合人类编码风格与项目规范，能够精准遵从用户指令，并通过反复运行测试直至获得符合要求的结果。工作机制 Codex 的核心运作框架为 “智能体循环（agent loop）”，核心作用是协调用户、模型与工具之间的交互，实现 “用户需求→模型推理→工具调用→结果验证” 的闭环运作。具体流程为：用户输入自然语言指令后，Codex 会自动构建结构化提示词，包含模型行为边界、沙箱权限、工作目录、项目文档等关键信息，随后调用对应模型进行推理；模型根据指令判断是否需要调用终端命令、测试工具等，执行相关操作后将结果反馈至上下文，反复迭代直至完成任务并向用户输出最终结果。所有 Codex 任务均在独立的云沙箱环境中运行，预装用户的代码仓库，支持读取、编辑文件，运行测试框架、代码检查工具及类型校验器等，任务完成时间根据复杂程度介于 1 至 30 分钟之间，用户可实时监控任务进度。任务完成后，Codex 会提交相关更改，并提供终端日志、测试输出等可验证证据，方便用户追踪每一步操作，所有更改需经用户手动审核后，方可进行集成与执行。此外，用户可通过在代码仓库中放置 AGENTS.md 文件，指导 Codex 浏览代码库、执行测试命令及遵循项目标准，进一步提升其任务执行的准确性。值得注意的是，为实现请求无状态与零数据保留（Zero Data Retention），Codex 未使用 Responses API 的优化接口，而是通过 prompt 缓存、上下文压缩等技术，缓解请求大小随对话轮次增长的问题，优先保障用户隐私与数据安全。核心功能与应用场景核心功能 Codex 的功能围绕软件工程全流程展开，核心涵盖七大板块：一是代码生成，可根据自然语言指令生成完整功能代码、补全重复代码，适配多种编程语言；二是代码修复，精准识别代码中的漏洞、语法错误及优化空间，并提出可直接应用的修复方案；三是代码库咨询，实时解答关于代码库结构、功能实现、代码逻辑等相关问题；四是拉取请求建议，结合项目规范，提出合理的代码更改建议，供开发团队审核参考；五是多任务并行处理，可同时处理多个编码任务，且任务间相互隔离，避免干扰；六是终端操作，支持调用 shell 命令、读写文件、运行测试等，实现编码相关任务的自动化执行；七是安全防护，通过 Codex Security 专项功能，识别并修复软件漏洞，保障代码安全。应用场景 Codex 的应用场景覆盖软件开发全流程及多行业场景，核心可分为三大类：一是个人开发者日常编码辅助，帮助个人开发者提升编码效率，减少重复劳动，快速解决编码过程中的各类问题，降低编码难度；二是企业级软件工程管理，辅助开发团队处理复杂代码、优化开发流程、开展代码安全检测，提升团队协作效率，降低研发成本；三是教育场景，为编程学习者提供实时编码指导，帮助学习者快速理解代码逻辑、掌握编程技巧，助力编程知识的高效传递。

AI / AI Agent / AI编程 / Codex / Codex CLI / OpenAI

可灵AI（Kling AI）

百科

可灵 AI（Kling AI）是快手科技（Kuaishou Technology）自研、面向全球创作者的多模态视频生成大模型与创作平台，核心定位为「人人可用的 AI 视频创作引擎」，以文生视频、图生视频、视频续写、高清长时生成、影视级运镜为核心壁垒，覆盖短视频、广告、影视、电商、内容创作全场景，是全球首个面向公众开放的 DiT 架构真实影像级视频生成工具。一、基础权威信息官方全称：可灵 AI（Kling AI）开发主体：快手科技 AI 大模型团队（快手社区科学线），独立事业部，直接向快手 CEO 程一笑汇报上线时间：2024 年 6 月 6 日官网（kelingcn.com）正式发布、开放邀测；2024 年 7 月 24 日全面公测可灵AI 核心定位：降低视频创作门槛，提供零门槛、高画质、长时长、可商用的 AI 视频生成能力，打通从创意到成片的全链路官方入口：网页端 https://kelingcn.com/；iOS/Android「可灵 AI」App；快影 App 内置入口；企业 API 服务核心 Slogan：让每个人都能用 AI 讲出好故事权威认证：Artificial Analysis 全球视频生成榜单文生 / 图生视频双赛道榜首（2025）、两次入选中国互联网创新十大案例（2024-2025）二、核心技术架构（官方技术口径）可灵 AI 采用类 Sora 的 DiT（Diffusion Transformer）架构，以 Transformer 替代传统卷积网络，基于 Flow 扩散基座 + 自研优化，构建中文场景领先的视频生成技术体系：底层基座：自研 DiT 视频大模型，融合 Flow 扩散模型，优化中文提示词理解、长时序一致性、物理运动合理性 3D 时空联合注意力机制（核心专利）：精准建模视频时空维度，模拟重力、光影、流体、碰撞等真实物理规律，解决 AI 视频常见的「扭曲、穿模、动作混乱」问题，支持复杂运镜与长镜头可灵AI 高分辨率长时生成引擎：原生支持1080P/30fps，3.0 版本升级至4K/60fps；单次最长生成 3 分钟，支持多段续写叠加至完整成片多模态输入输出：文生视频、图生视频、视频续写、首尾帧控制、运动笔刷、主体参考、音画同步（含方言口型）、分镜序列生成中文场景专项优化：针对中文语义、短视频节奏、国风 / 写实 / 影视风格、电商商品展示做专项微调，指令遵循度、画面贴合度优于国际竞品算力与效率：依托快手分布式训练集群、算子优化，生成速度、成功率、稳定性处于行业第一梯队三、核心功能模块（官方完整版） 1. AI 视频生成（核心引擎）文生视频：中文自然语言直出，支持 16:9/9:16/1:1 等全比例；内置电影、写实、国风、二次元、3D、电商等 30 + 风格；支持运镜指令（推 / 拉 / 摇 / 移 / 环绕、特写 / 全景）、帧率 / 分辨率调节；单次最长 3 分钟、30fps、1080P（3.0 支持 4K/60fps）可灵AI 图生视频：上传单图 / 多图，保留主体构图，一键生成动态视频、运镜动画、角色动作；支持主体一致性锁定、风格迁移、局部动态控制；解决单图转视频的「画面割裂、主体变形」问题可灵AI 视频续写：上传已有视频片段，AI 基于前序内容、文本指令续写，单次续写 4.5 秒，可无限叠加至完整成片；保持角色、场景、光影一致性，适配剧情、Vlog、广告续剪可灵AI 高级控制工具：首尾帧控制（精准定义起止画面，实现一镜到底）、运动笔刷（局部指定动态区域）、主体参考（多镜头保持 IP / 人物一致）、智能分镜（多镜头序列生成）、方言级对口型、音画同步生成 2. 可图 AI（图像生成模块）文生图、图生图、高清放大、局部重绘、风格迁移；支持 2K/4K 超高清，覆盖海报、封面、IP、电商商品图、概念设计；与视频生成模型同源，风格统一、无缝衔接 3. 创作生态与协作创意圈：百万级用户作品库，一键复用提示词、参数、风格、模板会员体系：免费版（每日基础灵感值）、黄金会员（66 元 / 月，660 灵感值、高清去水印、优先生成）、黑金会员（3.0 专属，4K/60fps、全功能、API 权限）可灵AI 企业服务：私有化部署、API 接口、定制模型、商用授权、专属技术支持；服务超 3 万家企业，覆盖广告、影视、电商、游戏、教育等行业快手生态联动：一键发布至快手主站、快影，享流量扶持、创作者激励、共创计划四、核心权威优势全球首个公众可用 DiT 真实影像模型：区别于实验室 Demo，可灵是首个面向 C 端 / 小 B 开放、可落地的 DiT 视频生成工具，生成质量、稳定性、可用性领先行业中文场景绝对领先：中文提示词理解、短视频适配、国风 / 本土风格、电商 / 广告模板、方言口型等本土化能力，国际竞品无法替代长时高清 + 物理真实：3 分钟 / 1080P/30fps（3.0 达 4K/60fps）+3D 时空注意力，解决行业「短时长、低清、动作混乱」痛点，接近影视级标准可灵AI 全链路创作闭环：从文本 / 图片→视频生成→剪辑 / 配音→发布 / 商用，一站式完成，无需跨平台商用合规保障：个人 / 企业商用授权清晰，生成内容无版权纠纷，支持广告、影视、电商等商业场景五、核心应用场景短视频创作：快手 / 抖音 / 视频号爆款短视频、剧情、Vlog、特效、IP 短剧、口播视频电商营销：商品展示视频、主图视频、直播切片、广告素材、AI 模特换装、产品动态演示影视与内容：电影分镜、概念短片、预告片、动画、纪录片素材、导演共创（可灵导演计划）可灵AI 企业与品牌：品牌宣传片、活动视频、教育课件、游戏 CG、虚拟人视频、数字内容生产个人与学生：生活记录、作品集、作业、创意短片、自媒体内容六、权威发展历程（关键节点） 2024.06.06：可灵 AI 正式上线，官网开放邀测，支持 2 分钟 1080P/30fps 文生视频，全球首个公众 DiT 视频工具可灵AI 2024.06.21：推出图生视频功能，5 秒动态生成，平面转动态可灵AI 2024.07.24：全面公测，上线会员体系，视频续写开放，最长支持 3 分钟可灵AI 2024.09：1.5 版本，新增运动笔刷、对口型、AI 模特、创意圈；启动「可灵 AI 导演共创计划」（李少红、贾樟柯等 9 位导演），产出 9 部 AI 电影短片可灵AI 2024.12：1.6 版本，图生视频质量提升 195%，复杂运镜 / 动作优化；全球用户破 2200 万 2025.04：可灵 2.0 / 可图 2.0 发布，动态、语义、美学全面升级，登顶全球视频生成榜单双第一 2025.12：全球创作者超 6000 万，累计生成视频 6 亿 +，企业用户 3 万 +，年化 ARR 达 2.4 亿美元 2026.02.05：可灵 AI 3.0 全球上线，支持 4K/60fps、原生音画同步、方言口型、多镜头分镜、Omni 全模态架构，进入影视级创作时代七、权威边界与合规说明可灵 AI 为快手科技 100% 自研，独立技术团队、独立事业部，非第三方合作 / 开源二次开发产品平台生成内容、素材均提供商用授权（个人 / 企业付费会员可商用，免费版仅限非商用），遵循中国及全球版权合规标准核心能力聚焦视频 / 图像生成，不涉及代码、文本大模型、音视频全品类编辑数据安全：遵循快手隐私合规，用户创作内容仅本人可见，平台不擅自使用、传播

AI / AI视频 / Kling / 可灵 / 可灵AI / 快手

QClaw

百科

QClaw（昵称 “龙虾”）是腾讯电脑管家团队基于开源 AI 智能体框架OpenClaw深度封装、面向普通用户推出的本地部署 AI 智能体（AI Agent）助手，主打微信直连、零门槛一键部署、数据本地留存，支持通过微信发送自然语言指令远程操控本地电脑执行自动化任务qclaw.qq.com。一、基本信息官方全称：腾讯 QClaw 开发主体：腾讯科技（深圳）有限公司・腾讯电脑管家团队技术基底：基于开源项目 OpenClaw（AI 智能体执行框架）二次封装，非独立从零开发 2026 年 3 月 10 日：开启邀请制内测 2026 年 3 月 20 日：全量公测，无需邀请码、零门槛开放，Windows/macOS 双平台同步上线发布历程：官方渠道：官网 https://qclaw.qq.com/ 核心定位：个人级本地 AI 执行助手，实现 “微信发指令、电脑自动干活”，区别于纯对话 AI 与传统远程桌面二、核心特性（权威官方确认） 1. 部署与运行平台支持：Windows 10/11、macOS（Apple Silicon/Intel 双架构），暂不支持 Linux 部署方式：一键安装包，自动配置环境，无需 Node.js/Python、Docker、命令行操作，小白开箱即用数据安全：全程本地运行、数据不出设备，AI 推理、文件操作、任务执行均在用户本机完成，不经过腾讯云端，隐私可控兼容 OpenClaw：已安装 OpenClaw 的设备，可一键关联 QClaw，复用原有配置与技能 2. 交互入口（核心差异化）微信直连（主入口）：扫码绑定微信后，通过微信聊天窗口（文字 / 语音 / 图片）发送指令，手机端即可远程触发电脑端执行；支持微信小程序入口，无需额外安装 App QQ 接入：同步支持 QQ 绑定，双社交入口覆盖国内主流 IM 场景本地客户端：电脑端独立界面，可直接下达指令、查看任务日志、管理模型与技能 3. AI 能力与模型内置模型：预置 Kimi-2.5、Minimax、GLM、DeepSeek 等国产大模型，支持一键切换；支持自定义接入第三方模型（需配置）智能体能力：具备任务拆解、工具调用、本地执行、上下文记忆、持续学习能力，非纯文本对话，可直接操控电脑硬件 / 软件技能生态：内置 5000 + 开箱即用 Skills（ClawHub、GitHub 开源生态），覆盖办公、开发、文件、浏览器、日程、邮件、社媒等场景；支持自定义创建 / 导入技能 4. 核心功能（官方明确）文件自动化：打开 / 编辑 / 整理 / 计算本地文档（Excel、Word、PDF）、批量重命名、文件夹分类、数据提取系统与浏览器操控：执行 Shell 命令、打开程序、浏览器自动化（搜索、填表、截图、下载）、定时任务办公协同：腾讯文档 / 邮件 / 日历操作、会议提醒、报表生成、内容总结开发辅助：代码生成、项目创建、Git 提交、接口调试、文档生成远程调度：手机微信发指令，电脑端后台执行，跨空间完成任务（如外出时处理本地文件）三、与 OpenClaw 的关系（权威界定） QClaw 是OpenClaw 的官方产品化封装版、国内定制发行版，类比 Linux 内核与 Ubuntu 发行版的关系 OpenClaw：开源、极客向、需手动部署、支持多平台（含 Linux）、入口以 Telegram/Slack 为主 QClaw：闭源商用、面向大众、一键部署、仅 Windows/macOS、深度绑定微信 / QQ、本土化优化、安全加固（腾讯电脑管家安全底座）四、使用门槛与限制（官方）硬件要求：最低 2 核 CPU、4GB 内存、500MB 可用存储，主流办公本 / 老旧笔记本均可流畅运行网络要求：电脑端需联网（用于模型请求、微信指令传输），手机端联网即可远程控制使用限制：免费公测阶段提供基础模型额度与技能；高级模型 / 自定义模型可能涉及额度或付费（以官方后续公告为准）；不支持无网络本地离线运行（模型推理依赖联网）

AI / AI Agent / AI助手 / OpenClaw / QClaw

王小亿（短剧演员）

百科

王小亿（本名王亿），中国内地短剧女演员，1997 年 12 月 6 日出生于湖北省武汉市，毕业于武汉设计工程学院成龙影视传媒学院表演系，身高 168cm，射手座。她是红果短剧平台首位获赞破亿女演员，以清冷仙气、爆发力强的演技著称，代表作《云渺》系列、《死后才知，我竟是京圈太子白月光》等，被称为 “短剧清冷女神”“云渺神女”。一、基本信息本名：王亿艺名：王小亿出生日期：1997 年 12 月 6 日出生地：湖北省武汉市毕业院校：武汉设计工程学院成龙影视传媒学院表演系身高：168cm 星座：射手座经纪公司：百川中文（2025 年 12 月 31 日正式签约，此前为独立艺人、个人工作室）行业标签：短剧顶流、清冷仙子、女频短剧扛剧女主二、演艺经历（1）前期积累（2022-2023） 2022 年 6 月 9 日，王小亿以创作者身份入驻抖音，发布生活日常、颜值随拍类短视频，积累初始粉丝与镜头经验。 2023 年，偶然接触短剧剧组试镜，开启短剧演艺之路；初期多饰演恶毒女配、配角，打磨演技，积累剧组经验。（2）崭露头角（2024 年） 2024 年 6 月，主演首部男主短剧《封神榜之天帝娶妻》（饰女主白灵），首次担纲女主。 8 月 20 日，主演《傅总的女王甜妻飒爆了》，正式进入大众视野。 9 月 6 日，主演《镇天神君》，人气进一步提升。 9 月，搭档陈云廷主演《死后才知，我竟是京圈太子白月光》（饰沈熹微），该剧登顶 DataEye 短剧热力榜 TOP1，成为其成名作，奠定女频短剧地位。 11 月，搭档赵振栋主演《薄爷，夫人把您卖了换钱花》，热度持续走高。同年，参演《不就是上司吗》《幸得相遇离婚时》（播放量破 20 亿）等多部短剧。（3）顶流爆发（2025 年） 2 月，主演春节档《春日攀京枝》《凤君》；推出爆款修仙短剧《云渺 1：我修仙多年强亿点怎么了》，饰演清冷强大的女主云渺，开启系列爆款之路。 3 月，获爱奇艺荧光之夜・年度微剧号召力女演员奖。 4-8 月，接连主演《云渺 2》《云渺 3：镇魔世家》《云渺 4：绝嗣佛子》，系列累计播放量超 100 亿、收藏 1200 万，“云渺神女” 形象深入人心，成为短剧圈现象级 IP。 6 月，搭档李子杰主演《公主绝色，影卫日日以下犯上》（饰楚青凰），古偶甜虐题材再获成功。 9 月，成为红果短剧平台首位获赞破亿女演员，创下平台纪录。 11 月，获横店微短剧之夜・年度号召力星耀女演员奖；主演《暗潮涌动》，尝试悬疑题材，拓宽戏路。 12 月 31 日，官宣签约头部短剧公司百川中文，结束独立艺人阶段，开启资源升级新阶段。三、代表作品（按时间排序）短剧代表作《死后才知，我竟是京圈太子白月光》（2024，饰沈熹微，DataEye 热力榜 TOP1）《云渺 1-4》系列（2025，饰云渺，修仙爆款，累计播放超 100 亿）《幸得相遇离婚时》（2024，播放量破 20 亿）《公主绝色，影卫日日以下犯上》（2025，饰楚青凰）《薄爷，夫人把您卖了换钱花》（2024）《镇天神君》（2024）《傅总的女王甜妻飒爆了》（2024）《暗潮涌动》（2025，悬疑题材）《春日攀京枝》（2025）四、荣誉与行业地位 2025 年 3 月：爱奇艺荧光之夜「年度微剧号召力女演员」 2025 年 9 月：红果短剧平台首位获赞破亿女演员（平台纪录） 2025 年 11 月：横店微短剧之夜「年度号召力星耀女演员」行业地位：短剧圈顶流女主，女频短剧核心扛剧艺人，擅长清冷神女、复仇女主、甜宠女主等多种人设，爆款率高、选本眼光精准，被业内称为 “剧本过滤器”。五、人物评价王小亿科班出身，演技细腻有爆发力，擅长在短剧情境中快速塑造人物、传递情绪，尤其适合清冷强大、外冷内热的女主形象。从短视频素人到短剧顶流，她以独立艺人身份打拼，靠作品与口碑出圈，是短剧行业从草根到顶流的典型代表；签约百川中文后，进一步打通 IP 与艺人资源，未来发展备受行业期待。

演员 / 王小亿 / 短剧演员 / 网红 / 美女

OpenAI Codex

百科

AI / AI Agent / AI编程 / Codex / Codex CLI / OpenAI

可灵AI（Kling AI）

百科

AI / AI视频 / Kling / 可灵 / 可灵AI / 快手

QClaw

百科

AI / AI Agent / AI助手 / OpenClaw / QClaw

王小亿（短剧演员）

百科

演员 / 王小亿 / 短剧演员 / 网红 / 美女

即梦AI

百科

即梦 AI（Jimeng AI）是字节跳动旗下剪映团队自研的一站式多模态 AI 创作平台，前身为剪映 Dreamina，2024 年 5 月正式定名 “即梦”。核心定位为零门槛、全链路、中文友好的 AI 图文 / 视频创作工具，基于自研 Seedream、Seedance、OmniHuman 等模型，覆盖文生图、图生图、文生视频、图生视频、智能画布、故事分镜、数字人对口型等能力，深度协同抖音、剪映生态，主打快速出片、创意轻量化、社交短视频场景适配即梦AI。一、基础权威信息官方全称：即梦 AI（Jimeng AI）开发主体：字节跳动（深圳市脸萌科技有限公司），剪映团队独立研发，隶属于字节 AI 与短视频生态体系前身与上线：2024 年 3 月内测（剪映 Dreamina）；2024 年 5 月 22 日正式更名 “即梦” 并开放公测；2025 年 2 月上线 OmniHuman 数字人模型，2025 年 6 月发布 Seedance 3.0 Pro 视频模型核心定位：人人可用的 AI 创意中枢，打通灵感→生成→编辑→发布全流程，服务普通用户、短视频博主、电商运营、设计师官方入口：网页端（https://jimeng.jianying.com/）、iOS/Android「即梦 AI」App、剪映 App 内置入口、抖音创作服务平台入口核心 Slogan：创意即刻成片，会说就会做权威认证：入选 2024-2025 中国 AI 生成内容创新工具榜单、字节跳动年度技术创新产品二、核心技术架构（官方口径）即梦采用自研 DiT（Diffusion Transformer）+ MoE 混合专家架构，融合字节大模型基座能力，构建轻量化、高速度、中文专项优化的多模态生成体系：底层模型矩阵： Seedream：文生图 / 图生图基座，主打高清、风格化、中文语义理解，支持 4K 直出、智能扩图、局部重绘 Seedance：文生视频 / 图生视频基座，DiT 架构，优化时序一致性、运镜控制、短视频节奏适配 OmniHuman（2025.2）：数字人专用模型，单图 + 音频生成自然口型、肢体动作，支持演讲 / 唱歌 / 乐器演奏，解决手势崩坏、表情僵硬问题核心技术专利：中文提示词语义对齐引擎：深度优化中文短句、口语、方言、网络热词理解，无需复杂英文提示词时序轻量化 DiT：在消费级算力下实现 5-10 秒 1080P/30fps 视频快速生成（单段最快 15 秒出片）智能运镜与分镜生成：自动匹配短视频节奏，支持推 / 拉 / 摇 / 移 / 环绕、特写 / 全景等运镜指令生态协同：深度对接剪映剪辑、抖音发布、豆包文案生成、火山引擎算力，实现创作 - 剪辑 - 分发闭环三、核心功能模块 1. AI 图像生成（Seedream）文生图：中文直出，支持写实、动漫、国风、赛博朋克、3D 卡通等 50 + 风格，4K 高清、智能排版、中文字体优化图生图 / 风格迁移：上传单图，保留主体、一键转风格、高清放大、局部重绘、消除笔、智能扩图（无限画布）智能画布：图层编辑、多图拼接、海报排版、一键生成电商主图 / 短视频封面 / 宣传海报 2. AI 视频生成（Seedance）文生视频：3-10 秒（Pro 版最长 36 秒）、1080P/30fps，支持全比例（9:16/16:9/1:1）、运镜控制、帧率调节、风格匹配图生视频：单图 / 多图生成动态视频、运镜动画、主体动态，保留构图一致性视频续写 / 补帧：基于已有片段续写，保持角色 / 场景统一，适配短视频续剪数字人对口型（OmniHuman）：单图 + 音频（普通话 / 方言 / 外语）生成自然唇形、肢体动作，支持虚拟主播、口播视频、教育课件 3. 全链路创作工具故事创作模式：输入剧情，自动生成分镜脚本、多镜头序列、镜头组接，一站式出片 AI 配乐 / 音效：自动匹配视频风格生成背景音乐、音效，支持音画同步一键发布：直接同步至剪映、抖音，享流量扶持、创作者激励 4. 会员与企业服务免费版：每日基础积分，基础生成、水印、低清会员版：Pro（69 元 / 月）、Ultra（129 元 / 月），去水印、4K、无限分镜、优先算力、商用授权企业版：API 接口、私有化部署、定制模型、专属客服、批量生成，服务电商、教育、传媒企业四、核心权威优势中文场景绝对领先：中文提示词理解、方言口型、短视频节奏、中文字体 / 排版、本土风格（国风 / 国潮）优化，远超海外竞品轻量化极速生成：消费级设备可用、生成速度行业领先（5 秒视频最快 15 秒出片），适合短视频高频创作全链路零门槛：从文案→生成→剪辑→发布一站式，无需专业技能，新手 3 分钟出片字节生态深度协同：剪映剪辑、抖音分发、豆包文案、火山算力无缝打通，创作效率最大化商用合规清晰：会员生成内容可商用，无版权纠纷，适配电商、广告、自媒体场景五、核心应用场景短视频创作：抖音 / 快手 / 视频号爆款短视频、剧情、Vlog、口播、虚拟人视频电商营销：商品主图视频、直播切片、广告素材、AI 模特、产品动态演示设计与创意：海报、封面、插画、概念图、动态海报、分镜草图教育与企业：课件视频、品牌宣传、数字人播报、活动短片个人创作：生活记录、作品集、创意短片、自媒体内容六、权威发展历程（关键节点） 2024.03：剪映 Dreamina 内测，上线文生图、基础文生视频 2024.05.22：正式定名「即梦 AI」，开放公测，接入剪映 / 抖音生态 2024.09：2.0 版本，升级 Seedream/Seedance，新增智能画布、故事分镜、运镜控制 2025.02：发布 OmniHuman 数字人模型，单图 + 音频生成自然口型 / 动作，解决手势崩坏 2025.06：Seedance 3.0 Pro 上线，支持最长 36 秒视频、4K/60fps、多主体一致性优化 2025.12：全球用户超 4500 万，累计生成内容 5 亿 +，企业客户超 2 万家七、合规与边界说明即梦 AI 为字节跳动 100% 自研，独立模型、独立团队，非开源二次开发版权：用户生成内容版权归用户，会员可商用；禁止生成侵权、违法、低俗内容数据：本地 / 云端混合部署，用户内容仅本人可见，遵循字节隐私合规边界：主打轻量化短视频 / 图文，复杂长视频、高物理真实感场景弱于专业影视级工具

AI / 即梦 / 即梦AI / 图生视频 / 文生视频

平生不晚

百科

平生不晚，中国内地国风女歌手、自媒体创作者，艺名昵称 “晚晚”“不晚”，专注于国风音乐演绎，擅长将流行唱法与戏腔融合创新，以清丽辨识度高的嗓音和细腻的情感表达在国风音乐领域崭露头角，凭借多部优质作品积累了广泛人气，是兼具实力与口碑的新锐国风歌手。一、基本信息艺名：平生不晚昵称：晚晚、不晚性别：女国籍：中国职业：歌手、自媒体创作者核心领域：国风音乐、戏曲翻唱与表演风格特色：嗓音清丽清冷，擅长流行与戏腔融合，演唱细腻生动，注重情感传递，不刻意包装，风格质朴真挚。官方认证平台：酷狗音乐人、抖音创作者、QQ 音乐入驻歌手。二、演艺经历 2021 年：正式入驻各大音乐平台与短视频平台，以国风翻唱作品起步，凭借翻唱《赤伶》《牵丝戏》等经典国风曲目，凭借独特的戏腔演绎获得首批关注，短视频账号逐步积累粉丝；同年发布首支个人翻唱单曲，完成从自媒体创作者到歌手的初步转型。 2022 年：持续深耕国风领域，推出《伯虎说》《青丝》等热门翻唱作品，其中部分作品登上音乐平台国风榜单，进一步提升知名度；开始尝试原创国风音乐创作，打磨个人演唱风格，注重在作品中融入传统戏曲元素与现代流行节奏。 2023 年：发布首支原创国风单曲，凭借细腻的歌词表达与婉转的戏腔演绎，获得听众广泛好评；受邀参与线下国风音乐活动、小型演唱会，完成个人线下演出首秀；同步更新短视频内容，分享音乐创作日常与国风相关内容，粉丝规模持续增长。 2024 年至今：持续产出优质作品，涵盖原创与翻唱，作品多次登上各大音乐平台国风推荐位；拓展演艺边界，参与国风主题综艺、音乐节等活动，进一步巩固国风歌手定位；坚持以质朴的风格传递国风音乐魅力，成为新锐国风领域的代表性歌手之一。三、代表作品（官方收录）（一）翻唱作品《赤伶》：凭借清冷戏腔与细腻情感，还原歌曲的家国情怀，成为其早期代表作之一，收获大量播放量与好评。《牵丝戏》：重新演绎经典曲目，将流行唱法与戏腔完美融合，凸显其嗓音特色，成为短视频平台热门 BGM。《伯虎说》：灵动婉转的演唱，搭配戏腔片段，展现国风音乐的趣味性与感染力，传唱度较高。（二）原创作品（注：结合官方公开信息收录，未收录未证实的原创曲目）已发布原创国风单曲，聚焦传统意境与现代情感的结合，旋律婉转，歌词兼具诗意与故事感，进一步奠定其国风演唱风格。四、风格特色与个人影响（一）风格特色平生不晚的演唱风格以 “清丽、细腻、有质感” 为核心，最大特点是将流行音乐的节奏与传统戏腔巧妙融合，不刻意追求技巧的华丽，更注重情感的传递。其嗓音清冷通透，戏腔演绎婉转悠扬，既有传统戏曲的韵味，又有现代流行音乐的亲和力，能够精准把握国风歌曲的意境，让听众在旋律中感受传统文化的魅力。（二）个人影响作为新锐国风歌手，平生不晚以自媒体为起点，凭借优质的作品与质朴的风格，积累了大量国风音乐爱好者的关注，推动了国风音乐的普及与传播。其作品兼顾观赏性与艺术性，既适合年轻听众的审美，又保留了传统戏曲的精髓，为国风音乐的创新发展提供了新的思路，成为众多国风爱好者喜爱的新生代歌手之一。五、权威信息来源说明本词条所有内容均来自平生不晚官方认证平台（酷狗音乐、QQ 音乐、抖音）公开信息、官方发布的作品介绍及权威国风音乐媒体报道，未收录第三方猜测、自媒体非证实内容及主观评价，确保内容的权威性、准确性与严谨性。

国风歌手 / 国风音乐 / 女歌手 / 平生不晚 / 戏腔演唱 / 歌手 / 自媒体创作者

白昕怡（短剧演员）

百科

白昕怡（1996 年 3 月 25 日 —），中国内地影视女演员，以短剧甜宠、虐恋题材见长，与演员朱一未组成 “爆珠夫妇” CP，是短剧圈高人气实力派演员。基本信息中文名：白昕怡外文名：Xinyi Bai 国籍：中国民族：汉族出生地：陕西省西安市出生日期：1996 年 3 月 25 日星座：白羊座毕业院校：山东艺术学院经纪公司：丝芭影视艺人工作室代表作品：《夏日不宜入爱河》《双面千金洛莞莞》《今日天晴宜爱你》《月染星辰》等主要荣誉：2025 爱奇艺微短剧荧光之夜年度微剧荧屏搭档（与朱一未）、2025 横店微短剧之夜年度心动搭档（与朱一未）早年经历 1996 年 3 月 25 日生于陕西西安，科班毕业于山东艺术学院表演专业，在校期间系统学习影视表演，为后续演艺生涯奠定专业基础。演艺经历早期影视（2019—2022） 2019 年 3 月，参演武术抗战电影《形意英雄》，正式进入影视圈；同年在都市情感剧《楼下女友请签收》中饰演汪嘉怡，完成长剧首秀。2020 年，主演文艺爱情电影《爱在那片花海》（饰叶子）、爱情喜剧《爱诫》（饰叶子）。 2021 年 2 月，主演都市爱情剧《陪你一起好好吃饭》（饰张碧），登陆湖南卫视与芒果 TV；3 月主演青春励志剧《悄悄喜欢你》。 2022 年 1 月，主演奇幻网络电影《镇魔司：灵源秘术》（饰陆瞳），在腾讯、爱奇艺上线。短剧崛起（2023— 至今） 2023 年 1 月，主演腾讯独播爱情短剧《夏日不宜入爱河》（饰时宜），凭借甜妹形象与自然演技出圈，开启短剧主力赛道。2024 年： 4 月，在腾讯悬疑短剧《双面千金洛莞莞》中饰演柳承影；主演《醒时已上春山》《太子妃马甲掉不停》《今日天晴宜爱你》《低声哄！宝贝，我只要你》等多部爆款短剧，与朱一未搭档默契度拉满，CP 热度飙升。2025 年（核心作品与荣誉）： 2 月，参演刑侦剧《刑侦现场》（饰安娜），尝试正剧转型； 3 月 14 日，与朱一未获2025 爱奇艺微短剧荧光之夜年度微剧荧屏搭档（代表作《今日天晴宜爱你》《好兔就吃窝边草》）；主演《娇骨之臣》（江晚栀）、《爱的方程式》（梁夏）、《风吹稻香》（许稻香）、《月染星辰》（许星染）、《肆宠而娇》（席昭）、《听说我成了反派白月光》等 13 部短剧，覆盖甜宠、虐恋、古装、现代等多元题材； 11 月 2 日，与朱一未获2025 横店微短剧之夜年度心动搭档，成为短剧圈标杆 CP。2026 年 2 月，主演短剧《重生阴夫年少时》（饰苏夏）上线，持续保持短剧高产节奏。个人生活 2024 年 10 月 5 日，朱一未向白昕怡求婚；10 月 6 日，白昕怡在抖音官宣 10 月 7 日与朱一未订婚并直播，二人因戏结缘、搭档近 30 部短剧，被称为短剧圈 “真夫妻 CP”。截至 2025 年底，抖音粉丝 49.5 万、微博粉丝 60 万，社交平台以作品分享、日常互动为主。主要作品（精选）短剧（2023—2026）《夏日不宜入爱河》（2023，腾讯，饰时宜）《双面千金洛莞莞》（2024，腾讯，饰柳承影）《今日天晴宜爱你》（2024，饰黎欣怡）《月染星辰》（2025，饰许星染）《风吹稻香》（2025，饰许稻香）《肆宠而娇》（2025，饰席昭）《重生阴夫年少时》（2026，饰苏夏）长剧 / 电影《楼下女友请签收》（2019，芒果 TV，饰汪嘉怡）《陪你一起好好吃饭》（2021，湖南卫视 / 芒果 TV，饰张碧）《镇魔司：灵源秘术》（2022，网络电影，饰陆瞳）《刑侦现场》（2025，腾讯，饰安娜）荣誉奖项 2025 爱奇艺微短剧荧光之夜：年度微剧荧屏搭档（与朱一未） 2025 横店微短剧之夜：年度心动搭档（与朱一未）人物评价白昕怡外形清新甜美、演技细腻自然，擅长驾驭甜宠、虐恋、马甲逆袭等短剧主流人设，与朱一未的 “真夫妻 CP” 极具观众缘，作品播放量与话题度双高；从长剧配角到短剧女主，逐步形成个人风格，是短剧精品化浪潮中的代表性女演员之一。

演员 / 白昕怡 / 短剧演员 / 网红 / 美女

即梦AI

百科

AI / 即梦 / 即梦AI / 图生视频 / 文生视频

平生不晚

百科

国风歌手 / 国风音乐 / 女歌手 / 平生不晚 / 戏腔演唱 / 歌手 / 自媒体创作者

白昕怡（短剧演员）

百科

演员 / 白昕怡 / 短剧演员 / 网红 / 美女

Stable Diffusion

百科

Stable Diffusion（简称 SD）是由Stability AI主导开发、基于潜扩散模型（Latent Diffusion Model）的开源多模态 AI 图像生成工具，核心定位为「人人可用的普惠型 AI 创作引擎」，以文生图、图生图为核心，支持本地部署、参数定制与生态扩展，覆盖艺术创作、商业设计、科研教育等全场景，是全球最具影响力、应用最广泛的开源 AI 绘画模型之一，彻底降低了 AI 图像生成的技术门槛与使用成本。一、基础权威信息官方全称：Stable Diffusion 开发主体：Stability AI（英国人工智能公司），联合慕尼黑路德维希・马克西米利安大学 CompVis 小组、Runway ML 共同研发，核心技术团队由 AI 领域顶尖研究者组成上线时间：2022 年 8 月 22 日正式发布首个版本；2023 年 6 月推出 SDXL 0.9 版本，2024 年 2 月发布 Stable Diffusion 3 早期预览版，2024 年 10 月推出 Stable Diffusion 3.5 系列及 Medium 版本核心定位：开源免费、可本地运行、高度可定制，让普通用户与专业创作者都能快速生成高质量图像，推动 AI 创作平民化官方入口：开源仓库（GitHub）、Stability AI 官网（stability.ai）；第三方衍生工具（WebUI、ComfyUI、Fooocus 等）；支持本地部署（Windows/macOS/Linux）、云服务调用核心特性：开源免费（非商用 / 商用均可，遵循 Stability AI 社区许可证）、本地运行、参数可控、生态完善、轻量高效（支持消费级显卡运行）权威认证：多次入选全球 AI 创新技术榜单，被苹果官方支持（优化 Apple Silicon 芯片运行性能），成为 AI 绘画领域开源标杆工具二、核心技术架构（开源官方口径） Stable Diffusion 的核心优势在于创新的潜扩散架构，将图像生成过程压缩到潜在空间完成，大幅降低计算复杂度，实现消费级硬件可运行，其技术架构主要包括 4 大核心模块：底层基座：基于扩散模型（Diffusion Model），融合 Transformer 架构，通过 “反向去噪” 过程从纯噪声中逐步生成清晰图像，核心是潜空间映射技术，平衡生成质量与计算效率。核心组件：由文本编码器（CLIP Text Encoder，负责解析提示词）、扩散模型（UNet，核心去噪模块）、图像解码器（VAE，将潜空间特征还原为可视图像）三部分组成，三者协同实现 “文本→潜空间特征→图像” 的完整生成链路。关键优化技术：支持对抗性扩散蒸馏（如 SDXL Turbo 版本，将生成迭代步骤从 50 步缩减至 1 步）、深度引导（Depth 模型）、文本引导修复等，同时优化多语言提示词理解，适配中文等多语种场景。扩展性架构：采用模块化设计，支持 LoRA、ControlNet 等插件扩展，允许用户微调模型、定制风格，同时兼容不同前端工具（WebUI、ComfyUI 等），形成灵活的创作工作流。三、核心功能模块（开源完整版） 1. 核心生成功能（基础能力）文生图（Text-to-Image）：通过正向提示词（描述想要的内容）和反向提示词（排除不想要的内容）生成图像，支持 20 + 主流风格（写实、二次元、国风、赛博朋克、油画等），可调节采样方法、采样步数、图像尺寸、CFG Scale 等参数，生成分辨率最高支持 4K，单次生成时间根据硬件配置可控制在几秒到几十秒不等，提示词可通过权重调节（括号语法）精准控制元素呈现效果。图生图（Image-to-Image）：上传参考图，通过调整去噪强度实现风格迁移、画面重构、瑕疵修复、画面拓展等功能；去噪强度 0.1-0.3 可轻微优化图像，0.4-0.6 可实现风格迁移，0.7-1.0 可彻底重构画面（仅保留原图轮廓或色彩），适配草图转稿、照片优化等场景。高清修复（Upscale）：内置多种放大算法（Latent、ESRGAN 等），可将低分辨率图像放大 4 倍以上，同时补充细节，解决生成图像模糊、细节不足的问题，部分衍生工具支持批量高清修复。局部重绘（Inpaint）：精准选中图像局部区域，通过提示词修改该区域内容，实现局部优化、杂物去除、元素替换等，适配图像精细化调整场景，是商业设计中常用的核心功能之一。 2. 进阶控制功能（扩展能力） LoRA 微调（Low-Rank Adaptation）：轻量级模型微调技术，文件体积小（50-300MB），可快速定制特定风格、角色或元素（如宫崎骏风格、特定 IP 形象），无需复杂训练，通过触发词即可激活对应风格，可与主模型叠加使用，兼容性极强。 ControlNet 插件：核心用于精准控制图像构图、姿态、边缘、深度等，解决 AI 生成图像 “构图混乱、姿态畸形” 的痛点，支持骨骼姿态控制、线稿控制、深度控制等，适配专业设计、角色创作等场景，大幅提升生成可控性。其他扩展功能：支持图生视频（结合 AnimateDiff 插件）、文本嵌入（Embedding）、IPAdapter（参考图风格 / 身份迁移）、批量生成、种子控制（固定种子可复现相同结果）等，满足不同用户的进阶创作需求。 3. 生态与工具支持开源社区：拥有全球庞大的开源社区，用户可自由分享模型、LoRA、提示词、工作流，核心模型与插件均开源可下载，社区持续迭代优化功能，解决使用中的常见问题（如人物畸形、画面模糊等）。前端工具：主流衍生工具包括 WebUI（新手友好，操作直观）、ComfyUI（专业级，支持复杂工作流定制）、Fooocus（极简操作，一键出图），适配不同用户群体（新手、专业创作者），无需复杂代码基础即可使用。模型资源：官方及社区推出大量细分模型（Checkpoint），如 SD 1.5（轻量兼容）、SDXL（高清写实）、Anything V5（二次元）、DreamShaper（通用写实）等，用户可根据创作需求选择对应模型，模型可从 Civitai、HuggingFace、ModelScope 等平台下载。四、核心权威优势开源普惠：完全开源免费，非商用、商用均可使用（遵循社区许可证），无使用门槛与版权限制，区别于 Midjourney 等付费工具，让普通用户也能接触 AI 创作，推动 AI 绘画普及化。本地运行：支持消费级显卡（NVIDIA、AMD）本地部署，无需依赖网络，既保护用户创作隐私，又不受平台服务器限制，可根据自身硬件配置优化生成速度与质量，适配隐私性要求高的场景（如商业设计、科研创作）。高度可定制：从参数调节、模型微调（LoRA）、插件扩展到工作流定制，全方位支持用户个性化创作，可适配不同风格、不同场景的创作需求，既能满足新手一键出图，也能满足专业创作者的精细化设计需求，灵活性远超同类工具。生态完善：全球庞大的开源社区与丰富的模型、插件资源，持续迭代优化，用户可快速获取教程、素材与解决方案，同时第三方工具适配完善，形成 “模型 - 工具 - 社区” 的完整生态，降低学习与使用成本，推动功能持续升级。轻量高效：得益于潜扩散架构，计算复杂度低，可在普通消费级显卡上流畅运行，生成速度快，同时支持批量生成、高清修复等高效功能，大幅提升创作效率，适配商业设计、批量素材生产等场景。五、核心应用场景艺术创作：数字绘画、插画创作、概念艺术设计、风格化作品生成、艺术风格迁移，帮助艺术家拓展创意思路，快速生成草图与成品，提升创作效率，适配插画师、设计师、艺术爱好者等群体。商业设计：电商商品图、海报、宣传册、LOGO 辅助设计、UI 界面草图、广告素材生成，无需专业设计基础，即可快速产出商用级素材，降低中小企业与个人创作者的设计成本，适配电商运营、中小企业、广告从业者等。科研与教育：AI 图像生成技术研究、计算机视觉相关教学演示、学生作业（数字绘画、设计类）、创意教学辅助，帮助科研人员开展技术研究，助力学生快速掌握 AI 创作技巧。个人与自媒体：自媒体配图、短视频封面、头像生成、生活照片优化、创意恶搞图像，适配自媒体博主、普通用户的日常创作需求，零门槛即可产出个性化内容。影视与游戏：影视分镜草图、游戏角色 / 场景概念设计、游戏贴图生成，辅助影视、游戏创作团队快速产出创意方案，缩短创作周期，适配影视从业者、游戏设计师等。六、权威发展历程（关键节点） 2022.08.22：Stable Diffusion 1.0 正式发布，基于潜扩散架构，支持消费级显卡本地部署，开源免费，迅速引爆 AI 绘画领域，成为开源 AI 绘画标杆。 2022.11：Stable Diffusion 1.5 版本发布，优化图像生成质量、人物细节与提示词遵循度，修复常见 bug，成为最经典、最常用的基础版本，至今仍被广泛使用。 2023.06：Stable Diffusion XL（SDXL）0.9 版本发布，原生支持 1024×1024 高清分辨率，优化写实风格生成，新增文本理解能力，大幅提升生成图像的细节与质感。 2023.11：SDXL 1.0 正式发布，完善高清生成能力，支持 2K + 分辨率，优化多风格适配，成为商业设计、高清创作的首选版本，同时推出 SDXL Turbo（1 步生成，极速出图）。 2024.02：Stable Diffusion 3 早期预览版发布，采用全新架构，优化多模态输入（文本、图像），提升提示词理解精度与生成可控性，支持更复杂的场景与细节生成。 2024.10：Stable Diffusion 3.5 系列及 Medium 版本发布，进一步优化生成速度与质量，完善中文提示词理解，新增更多细分风格模型，适配更多创作场景，同时拓展模型轻量化部署能力。 2025 至今：持续迭代模型轻量化、多模态融合（图生视频、文生 3D）能力，优化开源生态，推出更多行业定制化模型（如医疗、建筑设计专用模型），扩大应用场景。七、开源许可与合规说明开源许可：Stable Diffusion 核心模型遵循 Stability AI 社区许可证（OpenRAIL-M），非商用、商用均可免费使用，但禁止用于违法违规、侵权、低俗色情、危害国家安全等场景；衍生模型、插件需遵循对应开源许可，部分社区模型可能有商用限制，使用前需确认许可条款。版权边界：用户使用 Stable Diffusion 生成的内容，版权归用户所有（前提是不侵犯他人知识产权）；禁止使用模型生成侵犯他人肖像权、著作权、商标权的内容（如生成名人肖像、抄袭他人作品）。数据安全：本地部署版本不涉及数据上传，可保护用户创作隐私；使用第三方 Web 端衍生工具时，需注意平台的数据收集政策，避免敏感内容泄露。技术边界：模型生成内容可能存在一定瑕疵（如人物畸形、细节错乱），需用户进行后期优化；不支持生成违法违规、血腥恐怖、低俗色情等内容，开源社区与官方均有相关过滤机制。

AI / SD / Stable Diffusion / 图生图 / 文生图 / 本地部署 AI / 生图AI

豆包（AI助手）

百科

豆包是字节跳动公司自主研发的综合性人工智能产品矩阵，核心包含豆包大模型（原名 “云雀”）与豆包 AI 智能助手两大核心板块，依托字节跳动自研技术基座，覆盖个人消费级与企业级全场景，是国内首批通过算法备案的 AI 产品之一，也是国内使用量最大、应用场景最丰富的 AI 产品矩阵之一。一、基本信息官方名称：豆包（Doubao）开发主体：字节跳动科技（北京）有限公司核心定位：多模态 AI 基础设施（豆包大模型）+ 全场景 AI 智能助手（豆包 AI 助手），兼顾个人用户与企业客户需求技术基底：基于 Transformer 架构的混合专家（MoE）大语言模型，核心为字节跳动自研的 “云雀”（Skylark）大模型，无外部开源模型或第三方技术依赖官方渠道：官网（www.doubao.com）、全平台客户端（iOS/Android/Windows/macOS）、网页版及浏览器插件核心特性：中文优化能力突出、多模态融合、低时延响应、高性价比，支持跨平台同步使用二、核心构成与技术体系（一）豆包大模型豆包大模型是字节跳动自研的多模态大模型家族，原名 “云雀”，定位为 AI 基础设施，支撑全场景 AI 能力落地，于 2024 年 5 月 15 日在 “2024 春季火山引擎 Force 原动力大会” 上正式发布，后续持续迭代升级，形成了覆盖通用与细分领域的完整模型矩阵。模型家族构成：包含 2 个通用模型（豆包通用模型 Pro、豆包通用模型 Lite）与 7 个细分领域模型（角色扮演模型、语音识别模型、语音合成模型、声音复刻模型、文生图模型、Function Call 模型、向量化模型），共计 9 个核心模型，可满足不同场景的差异化需求。技术特点：采用大规模稀疏 MoE 架构，等效 7 倍激活参数的 Dense 模型性能，训练成本降低 90%；具备动态注意力机制，支持 32K 上下文窗口（可扩展至百万级 token），长文本处理能力突出；实现端到端语音处理，支持低时延对话、情绪承接与方言理解；集成多模态融合技术，可高效处理文本、图像、音频、视频等多类型输入输出。核心能力：覆盖自然语言理解与生成、代码创作（支持 30 + 编程语言，准确率达 95%）、数学推理（可解决 AIME 级别证明，GSM8K 测试表现超越 GPT-4）、语音处理、图像生成与分析、复杂任务自动化等，适用于企业级服务、科研、教育及工业等多领域。商业化定价：主力模型在企业市场定价为 0.0008 元 / 千 Tokens，处理 1500 多个汉字仅需 0.8 厘，比行业低 99%，TPM 限额为同规格模型的 2.7 倍到 8 倍，大幅降低企业接入门槛。（二）豆包 AI 智能助手豆包 AI 智能助手是基于豆包大模型开发的全场景应用载体，采用 “智能助手 + 场景化工具” 模式，覆盖日常生活、学习、办公等个人场景，同时通过火山引擎向企业客户开放 API 接口，实现商业化落地。多端覆盖：支持网页版、iOS 版、安卓版、Windows 桌面版、macOS 桌面版及浏览器插件，可通过手机号码、抖音账号、苹果账号登录，实现跨设备同步使用。核心功能矩阵：对话问答：支持复杂问题解答、多轮对话及专业领域咨询（法律、医疗、技术等），中文理解准确率达 96%；内容创作：涵盖文本生成（文章、报告、邮件等）、图像生成与编辑（基于 SeedEdit 模型）、音乐生成（11 种风格可选）、视频生成（基于 PixelDance、Seaweed 模型）；学习辅导：覆盖 K12 至高等教育，提供解题答疑、语言学习（中英日韩等 119 种语言）、考试策略指导；办公辅助：支持 AI 划词、网页总结、脑图生成、会议纪要快速整理（2 小时会议纪要 5 分钟搞定）、PPT 生成等功能；开发辅助：代码补全、调试建议、算法解释及技术文档生成，集成 MarsCode 编程助手能力；交互升级：支持语音输入、语音通话、实时视频通话，基于端到端语音大模型，交互流畅度接近真人，平均响应延迟控制在 800 毫秒以内。三、发展历程（官方公开） 2016 年：字节跳动成立人工智能实验室（AI Lab），聚焦自然语言处理、机器学习、数据挖掘等领域研究，为豆包的研发奠定技术基础； 2023 年 6 月：字节跳动内部测试 AI 对话类产品 “Grace”，处于完善优化阶段； 2023 年 8 月：“Grace” 新版本更名为 “豆包”，启动小范围邀请测试，支持多账号登录，具备基础文本生成与语音播报功能； 2024 年 5 月 15 日：在火山引擎 Force 原动力大会上，豆包大模型正式发布，豆包 APP 总下载量突破 1 亿次，大模型开启商业化进程； 2024 年 6 月 3 日：豆包推出 Windows/macOS 桌面客户端，新增快捷启动、AI 划词、AI 搜索功能； 2024 年 8 月 - 11 月：陆续上线音乐生成、脑图生成、语音输入、图片上传、视频生成内测等功能，10 月推出首款 AI 智能体耳机 Ola Friend，11 月底豆包 APP 累计用户规模超 1.6 亿； 2025 年 1 月 - 3 月：发布端到端语音大模型，升级实时语音通话功能；开源 SuperGPQA 知识推理基准测试；抖音 APP 测试接入豆包 AI 能力，开放两大超级入口；测试新版 “深度思考” 功能； 2025 年 4 月 - 12 月：深度思考和文生图 3.0 模型通过火山引擎开放 API；上线实时视频通话功能；发布豆包大模型 1.8，在视觉推理等任务中表现突出；12 月豆包日均活跃用户（DAU）突破 1 亿大关，月活跃用户达 1.5742 亿，居中国 AI 应用产品首位； 2026 年 2 月 14 日：豆包大模型 2.0 正式发布，围绕大规模生产环境使用需求做系统性优化；同期上线视频生成模型 Seedance 2.0。四、应用场景与市场表现（一）应用场景个人场景：日常对话、内容创作（文案、小说、歌词等）、学习辅导（解题、语言学习）、办公效率提升（会议纪要、文档处理）、娱乐生成（音乐、视频、图像）等；企业场景：通过火山引擎向企业客户开放服务，应用于智能客服、自动化文档处理、风险预测、医疗影像分析、司法文书生成、制造业流程优化等领域，已在字节跳动内部 50 多个业务场景应用验证；特色场景：与故宫博物院合作开发 “文物解说官”；为比亚迪等企业提供车辆故障诊断等智能服务；在全国 15 个法院部署，辅助法官处理案例检索等工作。（二）市场表现用户规模：截至 2024 年 11 月底，豆包 APP 累计用户超 1.6 亿；2025 年 3 月底，豆包大模型日均调用量达 12.7 万亿次；2025 年 8 月，月活跃用户达 1.5742 亿，居中国 AI 应用产品首位；2025 年 12 月，豆包日均活跃用户（DAU）突破 1 亿大关，成为国内首个 DAU 破亿的 AI 原生应用，累计服务用户超 3 亿，覆盖全球 100 多个国家和地区。商业成果：截至 2025 年底，豆包大模型已服务超 10 万家企业客户，覆盖互联网、金融、医疗、教育、制造等 20 多个行业，企业客户复购率达 85% 以上；2026 年第一季度，豆包相关业务营收同比增长 300%，成为字节跳动新兴业务增长核心引擎之一。行业认可：多次通过国内权威 AI 评测，在中文理解、数学推理、代码生成等维度稳居行业前列；先后获得 “2024 年度最佳 AI 产品”“中国人工智能创新应用标杆” 等多项行业奖项；豆包大模型通过国家网络安全等级保护三级认证，算法及数据安全符合《生成式人工智能服务管理暂行办法》要求，相关技术专利累计申请超 2000 项。

AI / AI助手 / AI大模型 / 豆包

OpenClaw

百科

OpenClaw（社区昵称「龙虾」），是 2026 年全球现象级本地优先、自托管、开源 AI 智能体执行框架，核心定位「让 AI 真正拥有双手、自主完成任务」，区别于传统仅对话的 AI 助手，主打私有化部署、多渠道接入、模型无关、持久记忆与系统级执行能力。截至 2026 年 4 月 5 日，GitHub 星标28.2 万、Fork 3.4 万、贡献者 920+、全球独立部署实例超 110 万、技能市场 5200 + 技能包，是当前最主流的开源 Agent 平台之一。一、基础信息全称：OpenClaw 曾用名：ClawdBot → Moltbot（2026 年 1 月因 Anthropic 商标异议更名，1 月 30 日最终定名 OpenClaw）开发者：Peter Steinberger（奥地利连续创业者，PSPDFKit 创始人，2025 年 6 月创立 Amantus Machina 公司主导研发）开源协议：MIT License（完全开源、可商用、可二次分发）核心语言：TypeScript，基于 Node.js 构建，跨平台兼容官方站点：getopenclaw.ai（英文）、openclaaw.cn（中文社区）核心定位：本地优先的 AI 执行中枢，连接大模型与本地系统 / 工具 / 平台，实现「自然语言指令→任务拆解→自主执行→结果反馈」闭环二、发展历程（2025.11—2026.4，权威时间线） 2025.11 项目启动：Peter Steinberger 以个人实验启动，核心脚本打通 WhatsApp 与 CloudCode CLI，实现 AI 本地执行雏形 2025.12.28：首次公开 Clawd 项目代码，发布基础配置与演示 2026.1.5：GitHub 上线，定名ClawdBot，快速引发极客圈关注 2026.1.20：因 Anthropic 商标争议，更名Moltbot；「自主买车、代码迁移、深度调研」等演示视频病毒传播，星标破 10 万 2026.1.30：正式定名OpenClaw，发布 v1.0 稳定版，确立开源 + 本地优先路线 2026.2：v2026.2.6 发布，新增 Unbrowse 浏览器自动化、技能市场、Workflow 录制回放；支持 Ollama 本地模型、Home Assistant 集成；GitHub 星标破 20 万getopenclaw.ai 2026.3.24：v2026.3.24（里程碑版），重构网关认证、OpenAI 兼容接口、可视化技能管理、企业级协作能力；支持飞书、钉钉、QQ 原生接入；星标破 25 万 2026.4.2：v2026.4.2（最新稳定版），安全加固、统一网关认证、多端语音唤醒、Slack/Teams 交互优化、群聊回声抑制；全球部署实例破百万三、核心技术架构（权威分层设计） OpenClaw 采用Gateway 中心化星形架构，解耦接入、控制、推理、执行、存储五层，默认本地闭环、不主动暴露公网，保障隐私安全：接入层（Channel Adapters）：统一适配 20 + 主流 IM / 协作平台，无需专属客户端，直接在常用 App 交互：海外：WhatsApp、Telegram、Discord、Slack、Signal、Microsoft Teams、iMessage 国内：微信、QQ、钉钉、飞书、企业微信（2026.3 原生支持）控制层（Gateway，核心中枢）：常驻守护进程（默认 ws://127.0.0.1:18789），负责会话管理、权限控制、多智能体调度、状态持久化、请求路由，所有指令 / 结果必经网关，保证一致性推理层（Agent Runtime）：模型无关的执行大脑，不内置 LLM，支持云端 / 本地双模式：云端：OpenAI GPT-4o/5、Anthropic Claude 3.5/4、Google Gemini、Kimi、通义千问、MiniMax 等本地：Ollama、LM Studio、LocalAI（Llama 3、Qwen、Mistral 等）范式：Observe-Plan-Act（观察 - 规划 - 行动）循环，支持子智能体协同、工具链编排、长上下文记忆执行层（Tools/Skills）：沙箱化执行引擎，内置 500 + 原生技能，支持自定义开发 / 技能市场安装：系统操作：文件读写、终端命令、代码执行、截图 OCR、屏幕控制自动化：浏览器（Unbrowse）、邮件、日历、CRM、Home Assistant、API 调用工作流：定时任务、条件触发、录制回放、批量处理存储层（Local Persistence）：本地 SQLite/PostgreSQL，持久化记忆、任务状态、配置、技能数据，用户完全掌控数据，无云端上传默认行为四、核心功能（2026.4 最新版） 1. 本地优先与私有化部署支持 Windows、macOS、Linux、Docker、云服务器（阿里云 / 腾讯云 / DO 一键部署）、小主机（J1900 等）数据全本地存储、流量闭环、可断网运行；支持端到端加密、访问令牌、IP 白名单、操作审计 2. 多渠道原生接入单 Gateway 统一管理所有 IM 账号，一次配置、全平台同步；支持群聊 / 私聊、@提及、命令触发、按钮交互 2026.4 新增：语音唤醒（macOS VoiceWake）、Google Assistant/App Actions（Android）、LINE 富媒体发送、QQ 群聊优化36氪 3. 模型无关与灵活切换支持多模型同时配置、按任务自动 / 手动切换；兼容 OpenAI API 标准，可对接 OpenRouter 等聚合平台本地模型低延迟、无 API 成本、隐私更强，适合敏感任务 4. 持久记忆与上下文感知跨会话、跨重启保留用户偏好、任务进度、历史交互；支持长上下文压缩、记忆检索、知识库 RAG 集成主动通知：定时简报、日历提醒、任务状态推送、自定义告警（Cron 式心跳） 5. 自主执行与技能生态无需代码，自然语言驱动复杂任务（如「整理本周邮件、生成周报、发送到钉钉」）技能市场（Claw Hub）：5200 + 社区 / 官方技能，一键安装、可视化配置、依赖自动检测 2026.3 新增：子智能体协同、OpenAI 兼容接口（/v1/chat/completions、/v1/embeddings）、RAG 原生支持 6. 安全与企业级能力网关认证统一：Trusted-Proxy、令牌强制、同主机访问显式授权，杜绝隐式信任操作审批、权限分级、日志审计、数据导出 / 擦除；支持企业 LDAP、SSO、私有部署集群（2026.4 企业版预览）36氪五、生态与社区现状（2026.4 权威数据） GitHub：Star 282,000+、Fork 34,000+、Issues 2,100+、Pull Requests 1,800+、贡献者 920+ 部署规模：全球独立实例 110 万 +，国内占比 38%（微信 / 钉钉 / 飞书驱动）技能生态：Claw Hub 5,200 + 技能，覆盖开发、办公、自动化、智能家居、数据分析、跨境运营社区：Discord 8 万 + 成员、中文社区（微信 / QQ）5 万 +、官方文档多语言（含简体中文）、第三方教程 / 部署工具 / 镜像丰富商业支持：Amantus Machina 提供企业版（集群、SLA、定制开发）；国内云厂商（阿里云、腾讯云、火山引擎）提供一键部署与托管服务六、典型应用场景个人生产力：邮件 / 日历管理、文件整理、代码编写 / 调试、周报自动生成、浏览器自动化、信息检索汇总开发者工具：API 调试、GitHub Issues 管理、CI/CD 触发、服务器监控、日志分析、代码迁移中小企业 / 团队：飞书 / 钉钉群助手、客户消息自动回复、报表生成、流程自动化、内部知识库问答私有化 / 合规场景：政务、金融、医疗等敏感数据处理，本地部署、数据不出域（如深圳福田「政务龙虾」落地）极客 / 硬件玩家：小主机 / NAS 部署、智能家居控制、本地模型集成、自定义技能开发七、优势与局限核心优势开源免费：MIT 协议，无订阅、无 API 锁、可商用二次开发本地可控：数据隐私、断网可用、低延迟、无云端成本接入无感：直接用现有 IM，无需新 App，学习成本极低生态繁荣：技能丰富、社区活跃、更新迭代快（周更）模型自由：不绑定单一 LLM，云端 / 本地灵活组合主要局限技术门槛：部署 / 配置需基础命令行 / 网络知识，普通用户有学习成本执行边界：复杂系统操作、跨设备协同、图形化界面交互仍有局限模型依赖：核心推理能力取决于接入的 LLM 质量，本地模型效果弱于云端旗舰安全风险：本地执行权限过高，需严格配置权限与沙箱，避免误操作 / 恶意指令八、未来规划（官方 Roadmap 2026） 2026 Q2：v2026.5 稳定版，强化多智能体编排、可视化 Workflow 编辑器、移动端原生 App、企业级集群部署 2026 H2：开放 Agent Marketplace 付费分成、硬件适配（边缘设备、嵌入式）、多模态（视频 / 语音深度集成）、行业垂直模板（跨境、电商、教育）长期：构建开源 Agent 标准、跨平台统一执行层、去中心化技能分发网络

AI / AI Agent / AI助手 / OpenClaw

Stable Diffusion

百科

AI / SD / Stable Diffusion / 图生图 / 文生图 / 本地部署 AI / 生图AI

豆包（AI助手）

百科

AI / AI助手 / AI大模型 / 豆包

OpenClaw

百科

AI / AI Agent / AI助手 / OpenClaw

{{userData.name}}已认证

瓜5网百科 - 让权威随处可见！

最新百科

OpenAI Codex

可灵AI（Kling AI）

QClaw

王小亿（短剧演员）

OpenAI Codex

可灵AI（Kling AI）

QClaw

王小亿（短剧演员）

即梦AI

平生不晚

白昕怡（短剧演员）

即梦AI

平生不晚

白昕怡（短剧演员）

Stable Diffusion

豆包（AI助手）

OpenClaw

Stable Diffusion

豆包（AI助手）

OpenClaw

百科标签

{{userData.name}}已认证

瓜5网百科 - 让权威随处可见！

最新百科

OpenAI Codex

可灵AI（Kling AI）

QClaw

王小亿（短剧演员）

OpenAI Codex

可灵AI（Kling AI）

QClaw

王小亿（短剧演员）

即梦AI

平生不晚

白昕怡（短剧演员）

即梦AI

平生不晚

白昕怡（短剧演员）

Stable Diffusion

豆包（AI助手）

OpenClaw

Stable Diffusion

豆包（AI助手）

OpenClaw

推荐百科

白昕怡（短剧演员）

OpenAI Codex

百科标签