瓜5网百科 - 让权威随处可见!

瓜5网百科是瓜5网内置的百科功能,和瓜5网的内容生态深度融合,让大家在逛瓜5网的时候就能够随时看到权威的内容。

发布百科

最新百科

OpenAI Codex

OpenAI Codex

百科
Codex 是由 OpenAI 研发的系列 AI 辅助软件开发工具及智能体系统,核心聚焦软件工程领域,依托 OpenAI 迭代优化的大语言模型,为开发者提供全流程编码辅助服务,产品形态覆盖云端服务、本地客户端、IDE 插件等多场景,核心价值在于降低编码门槛、提升开发效率,替代开发者完成重复性、机械性编码任务,同时辅助处理复杂软件工程相关工作。 发展历程 2021 年 8 月,OpenAI 正式发布 Codex,该版本以 GPT-3 为基础模型进行专项优化,定位为代码自动补全工具,可无缝集成于 Visual Studio Code、Neovim 等主流 IDE,同时成为 GitHub Copilot 的核心驱动技术。其训练数据源自 5400 万个 GitHub 仓库中的 159GB Python 代码,具备将自然语言指令转化为多编程语言代码的核心能力,标志着 AI 辅助编码进入规模化应用阶段。 2025 年 4 月 16 日,OpenAI 在 GitHub 上以 Apache 2.0 许可证开源 Codex CLI,这是一款可本地运行的 AI 智能体工具,同时配套推出仅通过 API 提供的 Codex-mini-latest 模型 —— 该模型基于 o4-mini 优化,专门适配 Codex CLI 的本地运行场景,大幅降低了普通开发者的使用门槛,让本地场景的 AI 编码辅助成为可能。 2025 年 5 月 16 日,OpenAI 推出 Codex 研究预览版,这是一款基于云端的专业化软件工程智能体,由 OpenAI o3 版本 Codex-1 模型提供技术支持(该模型针对软件工程场景进行专项优化)。初期仅面向 ChatGPT Pro、Enterprise 及 Team 版用户开放,后续逐步拓展至 Plus 版和 Edu 版用户,此次升级标志着 Codex 从单纯的代码补全工具,正式升级为可自主处理复杂软件工程任务的智能体系统,实现了功能的跨越式提升。 2026 年 2 月,Codex 迎来密集升级:2 月 2 日推出 macOS 桌面应用,主要用于管理多个编码智能体及处理长期编码任务,进一步完善本地应用生态;2 月 5 日发布 GPT-5.3-Codex 模型,整合前沿编程性能与推理能力,运行速度较上一版本提升 25%;2 月 12 日推出 GPT-5.3-Codex-Spark,这是一款基于 Cerebras 芯片的低延迟版本,运行速度较早期版本提升 15 倍,也是 OpenAI 首个未使用 NVIDIA 芯片的生产级模型,初期作为研究预览版面向 ChatGPT Pro 用户开放。 2026 年 3 月,OpenAI 发布 GPT-5.4-Codex 模型,同时推出 Codex Security 专项功能,这是一款专注于识别并修复软件漏洞的应用安全智能体,填补了 Codex 在代码安全领域的空白。据 OpenAI 官方披露,截至 2026 年 3 月,Codex 每周活跃用户已超过 200 万,且计划将其与 ChatGPT、浏览器整合为单一桌面 “超级应用”,进一步拓展其应用边界,不再局限于软件开发领域。 核心技术与工作机制 技术核心 Codex 的核心技术依托 OpenAI 迭代升级的大语言模型,不同发展阶段采用不同基础模型:早期版本以 GPT-3 为基础,2025 年推出的云端智能体采用 o3 版本 Codex-1 模型,2026 年逐步迭代至 GPT-5.3 及 GPT-5.4 系列 Codex 专属模型。所有模型均针对软件工程场景进行专项训练,具备强大的代码理解、生成与优化能力,训练过程采用强化学习方法,在真实世界的各类编码环境中持续训练,确保生成的代码符合人类编码风格与项目规范,能够精准遵从用户指令,并通过反复运行测试直至获得符合要求的结果。 工作机制 Codex 的核心运作框架为 “智能体循环(agent loop)”,核心作用是协调用户、模型与工具之间的交互,实现 “用户需求→模型推理→工具调用→结果验证” 的闭环运作。具体流程为:用户输入自然语言指令后,Codex 会自动构建结构化提示词,包含模型行为边界、沙箱权限、工作目录、项目文档等关键信息,随后调用对应模型进行推理;模型根据指令判断是否需要调用终端命令、测试工具等,执行相关操作后将结果反馈至上下文,反复迭代直至完成任务并向用户输出最终结果。 所有 Codex 任务均在独立的云沙箱环境中运行,预装用户的代码仓库,支持读取、编辑文件,运行测试框架、代码检查工具及类型校验器等,任务完成时间根据复杂程度介于 1 至 30 分钟之间,用户可实时监控任务进度。任务完成后,Codex 会提交相关更改,并提供终端日志、测试输出等可验证证据,方便用户追踪每一步操作,所有更改需经用户手动审核后,方可进行集成与执行。此外,用户可通过在代码仓库中放置 AGENTS.md 文件,指导 Codex 浏览代码库、执行测试命令及遵循项目标准,进一步提升其任务执行的准确性。 值得注意的是,为实现请求无状态与零数据保留(Zero Data Retention),Codex 未使用 Responses API 的优化接口,而是通过 prompt 缓存、上下文压缩等技术,缓解请求大小随对话轮次增长的问题,优先保障用户隐私与数据安全。 核心功能与应用场景 核心功能 Codex 的功能围绕软件工程全流程展开,核心涵盖七大板块:一是代码生成,可根据自然语言指令生成完整功能代码、补全重复代码,适配多种编程语言;二是代码修复,精准识别代码中的漏洞、语法错误及优化空间,并提出可直接应用的修复方案;三是代码库咨询,实时解答关于代码库结构、功能实现、代码逻辑等相关问题;四是拉取请求建议,结合项目规范,提出合理的代码更改建议,供开发团队审核参考;五是多任务并行处理,可同时处理多个编码任务,且任务间相互隔离,避免干扰;六是终端操作,支持调用 shell 命令、读写文件、运行测试等,实现编码相关任务的自动化执行;七是安全防护,通过 Codex Security 专项功能,识别并修复软件漏洞,保障代码安全。 应用场景 Codex 的应用场景覆盖软件开发全流程及多行业场景,核心可分为三大类:一是个人开发者日常编码辅助,帮助个人开发者提升编码效率,减少重复劳动,快速解决编码过程中的各类问题,降低编码难度;二是企业级软件工程管理,辅助开发团队处理复杂代码、优化开发流程、开展代码安全检测,提升团队协作效率,降低研发成本;三是教育场景,为编程学习者提供实时编码指导,帮助学习者快速理解代码逻辑、掌握编程技巧,助力编程知识的高效传递。
AI / AI Agent / AI编程 / Codex / Codex CLI / OpenAI
可灵AI(Kling AI)

可灵AI(Kling AI)

百科
可灵 AI(Kling AI)是快手科技(Kuaishou Technology) 自研、面向全球创作者的多模态视频生成大模型与创作平台,核心定位为「人人可用的 AI 视频创作引擎」,以文生视频、图生视频、视频续写、高清长时生成、影视级运镜为核心壁垒,覆盖短视频、广告、影视、电商、内容创作全场景,是全球首个面向公众开放的 DiT 架构真实影像级视频生成工具。 一、基础权威信息 官方全称:可灵 AI(Kling AI) 开发主体:快手科技 AI 大模型团队(快手社区科学线),独立事业部,直接向快手 CEO 程一笑汇报 上线时间:2024 年 6 月 6 日 官网(kelingcn.com)正式发布、开放邀测;2024 年 7 月 24 日全面公测可灵AI 核心定位:降低视频创作门槛,提供零门槛、高画质、长时长、可商用的 AI 视频生成能力,打通从创意到成片的全链路 官方入口:网页端 https://kelingcn.com/;iOS/Android「可灵 AI」App;快影 App 内置入口;企业 API 服务 核心 Slogan:让每个人都能用 AI 讲出好故事 权威认证:Artificial Analysis 全球视频生成榜单文生 / 图生视频双赛道榜首(2025)、两次入选中国互联网创新十大案例(2024-2025) 二、核心技术架构(官方技术口径) 可灵 AI 采用类 Sora 的 DiT(Diffusion Transformer)架构,以 Transformer 替代传统卷积网络,基于 Flow 扩散基座 + 自研优化,构建中文场景领先的视频生成技术体系: 底层基座:自研 DiT 视频大模型,融合 Flow 扩散模型,优化中文提示词理解、长时序一致性、物理运动合理性 3D 时空联合注意力机制(核心专利):精准建模视频时空维度,模拟重力、光影、流体、碰撞等真实物理规律,解决 AI 视频常见的「扭曲、穿模、动作混乱」问题,支持复杂运镜与长镜头可灵AI 高分辨率长时生成引擎:原生支持1080P/30fps,3.0 版本升级至4K/60fps;单次最长生成 3 分钟,支持多段续写叠加至完整成片 多模态输入输出:文生视频、图生视频、视频续写、首尾帧控制、运动笔刷、主体参考、音画同步(含方言口型)、分镜序列生成 中文场景专项优化:针对中文语义、短视频节奏、国风 / 写实 / 影视风格、电商商品展示做专项微调,指令遵循度、画面贴合度优于国际竞品 算力与效率:依托快手分布式训练集群、算子优化,生成速度、成功率、稳定性处于行业第一梯队 三、核心功能模块(官方完整版) 1. AI 视频生成(核心引擎) 文生视频:中文自然语言直出,支持 16:9/9:16/1:1 等全比例;内置电影、写实、国风、二次元、3D、电商等 30 + 风格;支持运镜指令(推 / 拉 / 摇 / 移 / 环绕、特写 / 全景)、帧率 / 分辨率调节;单次最长 3 分钟、30fps、1080P(3.0 支持 4K/60fps)可灵AI 图生视频:上传单图 / 多图,保留主体构图,一键生成动态视频、运镜动画、角色动作;支持主体一致性锁定、风格迁移、局部动态控制;解决单图转视频的「画面割裂、主体变形」问题可灵AI 视频续写:上传已有视频片段,AI 基于前序内容、文本指令续写,单次续写 4.5 秒,可无限叠加至完整成片;保持角色、场景、光影一致性,适配剧情、Vlog、广告续剪可灵AI 高级控制工具:首尾帧控制(精准定义起止画面,实现一镜到底)、运动笔刷(局部指定动态区域)、主体参考(多镜头保持 IP / 人物一致)、智能分镜(多镜头序列生成)、方言级对口型、音画同步生成 2. 可图 AI(图像生成模块) 文生图、图生图、高清放大、局部重绘、风格迁移;支持 2K/4K 超高清,覆盖海报、封面、IP、电商商品图、概念设计;与视频生成模型同源,风格统一、无缝衔接 3. 创作生态与协作 创意圈:百万级用户作品库,一键复用提示词、参数、风格、模板 会员体系:免费版(每日基础灵感值)、黄金会员(66 元 / 月,660 灵感值、高清去水印、优先生成)、黑金会员(3.0 专属,4K/60fps、全功能、API 权限)可灵AI 企业服务:私有化部署、API 接口、定制模型、商用授权、专属技术支持;服务超 3 万家企业,覆盖广告、影视、电商、游戏、教育等行业 快手生态联动:一键发布至快手主站、快影,享流量扶持、创作者激励、共创计划 四、核心权威优势 全球首个公众可用 DiT 真实影像模型:区别于实验室 Demo,可灵是首个面向 C 端 / 小 B 开放、可落地的 DiT 视频生成工具,生成质量、稳定性、可用性领先行业 中文场景绝对领先:中文提示词理解、短视频适配、国风 / 本土风格、电商 / 广告模板、方言口型等本土化能力,国际竞品无法替代 长时高清 + 物理真实:3 分钟 / 1080P/30fps(3.0 达 4K/60fps)+3D 时空注意力,解决行业「短时长、低清、动作混乱」痛点,接近影视级标准可灵AI 全链路创作闭环:从文本 / 图片→视频生成→剪辑 / 配音→发布 / 商用,一站式完成,无需跨平台 商用合规保障:个人 / 企业商用授权清晰,生成内容无版权纠纷,支持广告、影视、电商等商业场景 五、核心应用场景 短视频创作:快手 / 抖音 / 视频号爆款短视频、剧情、Vlog、特效、IP 短剧、口播视频 电商营销:商品展示视频、主图视频、直播切片、广告素材、AI 模特换装、产品动态演示 影视与内容:电影分镜、概念短片、预告片、动画、纪录片素材、导演共创(可灵导演计划)可灵AI 企业与品牌:品牌宣传片、活动视频、教育课件、游戏 CG、虚拟人视频、数字内容生产 个人与学生:生活记录、作品集、作业、创意短片、自媒体内容 六、权威发展历程(关键节点) 2024.06.06:可灵 AI 正式上线,官网开放邀测,支持 2 分钟 1080P/30fps 文生视频,全球首个公众 DiT 视频工具可灵AI 2024.06.21:推出图生视频功能,5 秒动态生成,平面转动态可灵AI 2024.07.24:全面公测,上线会员体系,视频续写开放,最长支持 3 分钟可灵AI 2024.09:1.5 版本,新增运动笔刷、对口型、AI 模特、创意圈;启动「可灵 AI 导演共创计划」(李少红、贾樟柯等 9 位导演),产出 9 部 AI 电影短片可灵AI 2024.12:1.6 版本,图生视频质量提升 195%,复杂运镜 / 动作优化;全球用户破 2200 万 2025.04:可灵 2.0 / 可图 2.0 发布,动态、语义、美学全面升级,登顶全球视频生成榜单双第一 2025.12:全球创作者超 6000 万,累计生成视频 6 亿 +,企业用户 3 万 +,年化 ARR 达 2.4 亿美元 2026.02.05:可灵 AI 3.0 全球上线,支持 4K/60fps、原生音画同步、方言口型、多镜头分镜、Omni 全模态架构,进入影视级创作时代 七、权威边界与合规说明 可灵 AI 为快手科技 100% 自研,独立技术团队、独立事业部,非第三方合作 / 开源二次开发产品 平台生成内容、素材均提供商用授权(个人 / 企业付费会员可商用,免费版仅限非商用),遵循中国及全球版权合规标准 核心能力聚焦视频 / 图像生成,不涉及代码、文本大模型、音视频全品类编辑 数据安全:遵循快手隐私合规,用户创作内容仅本人可见,平台不擅自使用、传播
AI / AI视频 / Kling / 可灵 / 可灵AI / 快手
QClaw

QClaw

百科
      QClaw(昵称 “龙虾”)是腾讯电脑管家团队基于开源 AI 智能体框架OpenClaw深度封装、面向普通用户推出的本地部署 AI 智能体(AI Agent)助手,主打微信直连、零门槛一键部署、数据本地留存,支持通过微信发送自然语言指令远程操控本地电脑执行自动化任务qclaw.qq.com。 一、基本信息 官方全称:腾讯 QClaw 开发主体:腾讯科技(深圳)有限公司・腾讯电脑管家团队 技术基底:基于开源项目 OpenClaw(AI 智能体执行框架)二次封装,非独立从零开发 2026 年 3 月 10 日:开启邀请制内测 2026 年 3 月 20 日:全量公测,无需邀请码、零门槛开放,Windows/macOS 双平台同步上线发布历程: 官方渠道:官网 https://qclaw.qq.com/ 核心定位:个人级本地 AI 执行助手,实现 “微信发指令、电脑自动干活”,区别于纯对话 AI 与传统远程桌面 二、核心特性(权威官方确认) 1. 部署与运行 平台支持:Windows 10/11、macOS(Apple Silicon/Intel 双架构),暂不支持 Linux 部署方式:一键安装包,自动配置环境,无需 Node.js/Python、Docker、命令行操作,小白开箱即用 数据安全:全程本地运行、数据不出设备,AI 推理、文件操作、任务执行均在用户本机完成,不经过腾讯云端,隐私可控 兼容 OpenClaw:已安装 OpenClaw 的设备,可一键关联 QClaw,复用原有配置与技能 2. 交互入口(核心差异化) 微信直连(主入口):扫码绑定微信后,通过微信聊天窗口(文字 / 语音 / 图片)发送指令,手机端即可远程触发电脑端执行;支持微信小程序入口,无需额外安装 App QQ 接入:同步支持 QQ 绑定,双社交入口覆盖国内主流 IM 场景 本地客户端:电脑端独立界面,可直接下达指令、查看任务日志、管理模型与技能 3. AI 能力与模型 内置模型:预置 Kimi-2.5、Minimax、GLM、DeepSeek 等国产大模型,支持一键切换;支持自定义接入第三方模型(需配置) 智能体能力:具备任务拆解、工具调用、本地执行、上下文记忆、持续学习能力,非纯文本对话,可直接操控电脑硬件 / 软件 技能生态:内置 5000 + 开箱即用 Skills(ClawHub、GitHub 开源生态),覆盖办公、开发、文件、浏览器、日程、邮件、社媒等场景;支持自定义创建 / 导入技能 4. 核心功能(官方明确) 文件自动化:打开 / 编辑 / 整理 / 计算本地文档(Excel、Word、PDF)、批量重命名、文件夹分类、数据提取 系统与浏览器操控:执行 Shell 命令、打开程序、浏览器自动化(搜索、填表、截图、下载)、定时任务 办公协同:腾讯文档 / 邮件 / 日历操作、会议提醒、报表生成、内容总结 开发辅助:代码生成、项目创建、Git 提交、接口调试、文档生成 远程调度:手机微信发指令,电脑端后台执行,跨空间完成任务(如外出时处理本地文件) 三、与 OpenClaw 的关系(权威界定) QClaw 是OpenClaw 的官方产品化封装版、国内定制发行版,类比 Linux 内核与 Ubuntu 发行版的关系 OpenClaw:开源、极客向、需手动部署、支持多平台(含 Linux)、入口以 Telegram/Slack 为主 QClaw:闭源商用、面向大众、一键部署、仅 Windows/macOS、深度绑定微信 / QQ、本土化优化、安全加固(腾讯电脑管家安全底座) 四、使用门槛与限制(官方) 硬件要求:最低 2 核 CPU、4GB 内存、500MB 可用存储,主流办公本 / 老旧笔记本均可流畅运行 网络要求:电脑端需联网(用于模型请求、微信指令传输),手机端联网即可远程控制 使用限制:免费公测阶段提供基础模型额度与技能;高级模型 / 自定义模型可能涉及额度或付费(以官方后续公告为准);不支持无网络本地离线运行(模型推理依赖联网)
AI / AI Agent / AI助手 / OpenClaw / QClaw
王小亿(短剧演员)

王小亿(短剧演员)

百科
        王小亿(本名王亿),中国内地短剧女演员,1997 年 12 月 6 日出生于湖北省武汉市,毕业于武汉设计工程学院成龙影视传媒学院表演系,身高 168cm,射手座。她是红果短剧平台首位获赞破亿女演员,以清冷仙气、爆发力强的演技著称,代表作《云渺》系列、《死后才知,我竟是京圈太子白月光》等,被称为 “短剧清冷女神”“云渺神女”。 一、基本信息 本名:王亿 艺名:王小亿 出生日期:1997 年 12 月 6 日 出生地:湖北省武汉市 毕业院校:武汉设计工程学院成龙影视传媒学院 表演系 身高:168cm 星座:射手座 经纪公司:百川中文(2025 年 12 月 31 日正式签约,此前为独立艺人、个人工作室) 行业标签:短剧顶流、清冷仙子、女频短剧扛剧女主 二、演艺经历 (1)前期积累(2022-2023) 2022 年 6 月 9 日,王小亿以创作者身份入驻抖音,发布生活日常、颜值随拍类短视频,积累初始粉丝与镜头经验。   2023 年,偶然接触短剧剧组试镜,开启短剧演艺之路;初期多饰演恶毒女配、配角,打磨演技,积累剧组经验。 (2)崭露头角(2024 年) 2024 年 6 月,主演首部男主短剧《封神榜之天帝娶妻》(饰女主白灵),首次担纲女主。 8 月 20 日,主演《傅总的女王甜妻飒爆了》,正式进入大众视野。 9 月 6 日,主演《镇天神君》,人气进一步提升。 9 月,搭档陈云廷主演《死后才知,我竟是京圈太子白月光》(饰沈熹微),该剧登顶 DataEye 短剧热力榜 TOP1,成为其成名作,奠定女频短剧地位。 11 月,搭档赵振栋主演《薄爷,夫人把您卖了换钱花》,热度持续走高。 同年,参演《不就是上司吗》《幸得相遇离婚时》(播放量破 20 亿)等多部短剧。 (3)顶流爆发(2025 年) 2 月,主演春节档《春日攀京枝》《凤君》;推出爆款修仙短剧《云渺 1:我修仙多年强亿点怎么了》,饰演清冷强大的女主云渺,开启系列爆款之路。 3 月,获爱奇艺荧光之夜・年度微剧号召力女演员奖。 4-8 月,接连主演《云渺 2》《云渺 3:镇魔世家》《云渺 4:绝嗣佛子》,系列累计播放量超 100 亿、收藏 1200 万,“云渺神女” 形象深入人心,成为短剧圈现象级 IP。 6 月,搭档李子杰主演《公主绝色,影卫日日以下犯上》(饰楚青凰),古偶甜虐题材再获成功。 9 月,成为红果短剧平台首位获赞破亿女演员,创下平台纪录。 11 月,获横店微短剧之夜・年度号召力星耀女演员奖;主演《暗潮涌动》,尝试悬疑题材,拓宽戏路。 12 月 31 日,官宣签约头部短剧公司百川中文,结束独立艺人阶段,开启资源升级新阶段。 三、代表作品(按时间排序) 短剧代表作 《死后才知,我竟是京圈太子白月光》(2024,饰沈熹微,DataEye 热力榜 TOP1) 《云渺 1-4》系列(2025,饰云渺,修仙爆款,累计播放超 100 亿) 《幸得相遇离婚时》(2024,播放量破 20 亿) 《公主绝色,影卫日日以下犯上》(2025,饰楚青凰) 《薄爷,夫人把您卖了换钱花》(2024) 《镇天神君》(2024) 《傅总的女王甜妻飒爆了》(2024) 《暗潮涌动》(2025,悬疑题材) 《春日攀京枝》(2025) 四、荣誉与行业地位 2025 年 3 月:爱奇艺荧光之夜「年度微剧号召力女演员」 2025 年 9 月:红果短剧平台首位获赞破亿女演员(平台纪录) 2025 年 11 月:横店微短剧之夜「年度号召力星耀女演员」 行业地位:短剧圈顶流女主,女频短剧核心扛剧艺人,擅长清冷神女、复仇女主、甜宠女主等多种人设,爆款率高、选本眼光精准,被业内称为 “剧本过滤器”。 五、人物评价         王小亿科班出身,演技细腻有爆发力,擅长在短剧情境中快速塑造人物、传递情绪,尤其适合清冷强大、外冷内热的女主形象。从短视频素人到短剧顶流,她以独立艺人身份打拼,靠作品与口碑出圈,是短剧行业从草根到顶流的典型代表;签约百川中文后,进一步打通 IP 与艺人资源,未来发展备受行业期待。
演员 / 王小亿 / 短剧演员 / 网红 / 美女
OpenAI Codex

OpenAI Codex

百科
Codex 是由 OpenAI 研发的系列 AI 辅助软件开发工具及智能体系统,核心聚焦软件工程领域,依托 OpenAI 迭代优化的大语言模型,为开发者提供全流程编码辅助服务,产品形态覆盖云端服务、本地客户端、IDE 插件等多场景,核心价值在于降低编码门槛、提升开发效率,替代开发者完成重复性、机械性编码任务,同时辅助处理复杂软件工程相关工作。 发展历程 2021 年 8 月,OpenAI 正式发布 Codex,该版本以 GPT-3 为基础模型进行专项优化,定位为代码自动补全工具,可无缝集成于 Visual Studio Code、Neovim 等主流 IDE,同时成为 GitHub Copilot 的核心驱动技术。其训练数据源自 5400 万个 GitHub 仓库中的 159GB Python 代码,具备将自然语言指令转化为多编程语言代码的核心能力,标志着 AI 辅助编码进入规模化应用阶段。 2025 年 4 月 16 日,OpenAI 在 GitHub 上以 Apache 2.0 许可证开源 Codex CLI,这是一款可本地运行的 AI 智能体工具,同时配套推出仅通过 API 提供的 Codex-mini-latest 模型 —— 该模型基于 o4-mini 优化,专门适配 Codex CLI 的本地运行场景,大幅降低了普通开发者的使用门槛,让本地场景的 AI 编码辅助成为可能。 2025 年 5 月 16 日,OpenAI 推出 Codex 研究预览版,这是一款基于云端的专业化软件工程智能体,由 OpenAI o3 版本 Codex-1 模型提供技术支持(该模型针对软件工程场景进行专项优化)。初期仅面向 ChatGPT Pro、Enterprise 及 Team 版用户开放,后续逐步拓展至 Plus 版和 Edu 版用户,此次升级标志着 Codex 从单纯的代码补全工具,正式升级为可自主处理复杂软件工程任务的智能体系统,实现了功能的跨越式提升。 2026 年 2 月,Codex 迎来密集升级:2 月 2 日推出 macOS 桌面应用,主要用于管理多个编码智能体及处理长期编码任务,进一步完善本地应用生态;2 月 5 日发布 GPT-5.3-Codex 模型,整合前沿编程性能与推理能力,运行速度较上一版本提升 25%;2 月 12 日推出 GPT-5.3-Codex-Spark,这是一款基于 Cerebras 芯片的低延迟版本,运行速度较早期版本提升 15 倍,也是 OpenAI 首个未使用 NVIDIA 芯片的生产级模型,初期作为研究预览版面向 ChatGPT Pro 用户开放。 2026 年 3 月,OpenAI 发布 GPT-5.4-Codex 模型,同时推出 Codex Security 专项功能,这是一款专注于识别并修复软件漏洞的应用安全智能体,填补了 Codex 在代码安全领域的空白。据 OpenAI 官方披露,截至 2026 年 3 月,Codex 每周活跃用户已超过 200 万,且计划将其与 ChatGPT、浏览器整合为单一桌面 “超级应用”,进一步拓展其应用边界,不再局限于软件开发领域。 核心技术与工作机制 技术核心 Codex 的核心技术依托 OpenAI 迭代升级的大语言模型,不同发展阶段采用不同基础模型:早期版本以 GPT-3 为基础,2025 年推出的云端智能体采用 o3 版本 Codex-1 模型,2026 年逐步迭代至 GPT-5.3 及 GPT-5.4 系列 Codex 专属模型。所有模型均针对软件工程场景进行专项训练,具备强大的代码理解、生成与优化能力,训练过程采用强化学习方法,在真实世界的各类编码环境中持续训练,确保生成的代码符合人类编码风格与项目规范,能够精准遵从用户指令,并通过反复运行测试直至获得符合要求的结果。 工作机制 Codex 的核心运作框架为 “智能体循环(agent loop)”,核心作用是协调用户、模型与工具之间的交互,实现 “用户需求→模型推理→工具调用→结果验证” 的闭环运作。具体流程为:用户输入自然语言指令后,Codex 会自动构建结构化提示词,包含模型行为边界、沙箱权限、工作目录、项目文档等关键信息,随后调用对应模型进行推理;模型根据指令判断是否需要调用终端命令、测试工具等,执行相关操作后将结果反馈至上下文,反复迭代直至完成任务并向用户输出最终结果。 所有 Codex 任务均在独立的云沙箱环境中运行,预装用户的代码仓库,支持读取、编辑文件,运行测试框架、代码检查工具及类型校验器等,任务完成时间根据复杂程度介于 1 至 30 分钟之间,用户可实时监控任务进度。任务完成后,Codex 会提交相关更改,并提供终端日志、测试输出等可验证证据,方便用户追踪每一步操作,所有更改需经用户手动审核后,方可进行集成与执行。此外,用户可通过在代码仓库中放置 AGENTS.md 文件,指导 Codex 浏览代码库、执行测试命令及遵循项目标准,进一步提升其任务执行的准确性。 值得注意的是,为实现请求无状态与零数据保留(Zero Data Retention),Codex 未使用 Responses API 的优化接口,而是通过 prompt 缓存、上下文压缩等技术,缓解请求大小随对话轮次增长的问题,优先保障用户隐私与数据安全。 核心功能与应用场景 核心功能 Codex 的功能围绕软件工程全流程展开,核心涵盖七大板块:一是代码生成,可根据自然语言指令生成完整功能代码、补全重复代码,适配多种编程语言;二是代码修复,精准识别代码中的漏洞、语法错误及优化空间,并提出可直接应用的修复方案;三是代码库咨询,实时解答关于代码库结构、功能实现、代码逻辑等相关问题;四是拉取请求建议,结合项目规范,提出合理的代码更改建议,供开发团队审核参考;五是多任务并行处理,可同时处理多个编码任务,且任务间相互隔离,避免干扰;六是终端操作,支持调用 shell 命令、读写文件、运行测试等,实现编码相关任务的自动化执行;七是安全防护,通过 Codex Security 专项功能,识别并修复软件漏洞,保障代码安全。 应用场景 Codex 的应用场景覆盖软件开发全流程及多行业场景,核心可分为三大类:一是个人开发者日常编码辅助,帮助个人开发者提升编码效率,减少重复劳动,快速解决编码过程中的各类问题,降低编码难度;二是企业级软件工程管理,辅助开发团队处理复杂代码、优化开发流程、开展代码安全检测,提升团队协作效率,降低研发成本;三是教育场景,为编程学习者提供实时编码指导,帮助学习者快速理解代码逻辑、掌握编程技巧,助力编程知识的高效传递。
AI / AI Agent / AI编程 / Codex / Codex CLI / OpenAI
可灵AI(Kling AI)

可灵AI(Kling AI)

百科
可灵 AI(Kling AI)是快手科技(Kuaishou Technology) 自研、面向全球创作者的多模态视频生成大模型与创作平台,核心定位为「人人可用的 AI 视频创作引擎」,以文生视频、图生视频、视频续写、高清长时生成、影视级运镜为核心壁垒,覆盖短视频、广告、影视、电商、内容创作全场景,是全球首个面向公众开放的 DiT 架构真实影像级视频生成工具。 一、基础权威信息 官方全称:可灵 AI(Kling AI) 开发主体:快手科技 AI 大模型团队(快手社区科学线),独立事业部,直接向快手 CEO 程一笑汇报 上线时间:2024 年 6 月 6 日 官网(kelingcn.com)正式发布、开放邀测;2024 年 7 月 24 日全面公测可灵AI 核心定位:降低视频创作门槛,提供零门槛、高画质、长时长、可商用的 AI 视频生成能力,打通从创意到成片的全链路 官方入口:网页端 https://kelingcn.com/;iOS/Android「可灵 AI」App;快影 App 内置入口;企业 API 服务 核心 Slogan:让每个人都能用 AI 讲出好故事 权威认证:Artificial Analysis 全球视频生成榜单文生 / 图生视频双赛道榜首(2025)、两次入选中国互联网创新十大案例(2024-2025) 二、核心技术架构(官方技术口径) 可灵 AI 采用类 Sora 的 DiT(Diffusion Transformer)架构,以 Transformer 替代传统卷积网络,基于 Flow 扩散基座 + 自研优化,构建中文场景领先的视频生成技术体系: 底层基座:自研 DiT 视频大模型,融合 Flow 扩散模型,优化中文提示词理解、长时序一致性、物理运动合理性 3D 时空联合注意力机制(核心专利):精准建模视频时空维度,模拟重力、光影、流体、碰撞等真实物理规律,解决 AI 视频常见的「扭曲、穿模、动作混乱」问题,支持复杂运镜与长镜头可灵AI 高分辨率长时生成引擎:原生支持1080P/30fps,3.0 版本升级至4K/60fps;单次最长生成 3 分钟,支持多段续写叠加至完整成片 多模态输入输出:文生视频、图生视频、视频续写、首尾帧控制、运动笔刷、主体参考、音画同步(含方言口型)、分镜序列生成 中文场景专项优化:针对中文语义、短视频节奏、国风 / 写实 / 影视风格、电商商品展示做专项微调,指令遵循度、画面贴合度优于国际竞品 算力与效率:依托快手分布式训练集群、算子优化,生成速度、成功率、稳定性处于行业第一梯队 三、核心功能模块(官方完整版) 1. AI 视频生成(核心引擎) 文生视频:中文自然语言直出,支持 16:9/9:16/1:1 等全比例;内置电影、写实、国风、二次元、3D、电商等 30 + 风格;支持运镜指令(推 / 拉 / 摇 / 移 / 环绕、特写 / 全景)、帧率 / 分辨率调节;单次最长 3 分钟、30fps、1080P(3.0 支持 4K/60fps)可灵AI 图生视频:上传单图 / 多图,保留主体构图,一键生成动态视频、运镜动画、角色动作;支持主体一致性锁定、风格迁移、局部动态控制;解决单图转视频的「画面割裂、主体变形」问题可灵AI 视频续写:上传已有视频片段,AI 基于前序内容、文本指令续写,单次续写 4.5 秒,可无限叠加至完整成片;保持角色、场景、光影一致性,适配剧情、Vlog、广告续剪可灵AI 高级控制工具:首尾帧控制(精准定义起止画面,实现一镜到底)、运动笔刷(局部指定动态区域)、主体参考(多镜头保持 IP / 人物一致)、智能分镜(多镜头序列生成)、方言级对口型、音画同步生成 2. 可图 AI(图像生成模块) 文生图、图生图、高清放大、局部重绘、风格迁移;支持 2K/4K 超高清,覆盖海报、封面、IP、电商商品图、概念设计;与视频生成模型同源,风格统一、无缝衔接 3. 创作生态与协作 创意圈:百万级用户作品库,一键复用提示词、参数、风格、模板 会员体系:免费版(每日基础灵感值)、黄金会员(66 元 / 月,660 灵感值、高清去水印、优先生成)、黑金会员(3.0 专属,4K/60fps、全功能、API 权限)可灵AI 企业服务:私有化部署、API 接口、定制模型、商用授权、专属技术支持;服务超 3 万家企业,覆盖广告、影视、电商、游戏、教育等行业 快手生态联动:一键发布至快手主站、快影,享流量扶持、创作者激励、共创计划 四、核心权威优势 全球首个公众可用 DiT 真实影像模型:区别于实验室 Demo,可灵是首个面向 C 端 / 小 B 开放、可落地的 DiT 视频生成工具,生成质量、稳定性、可用性领先行业 中文场景绝对领先:中文提示词理解、短视频适配、国风 / 本土风格、电商 / 广告模板、方言口型等本土化能力,国际竞品无法替代 长时高清 + 物理真实:3 分钟 / 1080P/30fps(3.0 达 4K/60fps)+3D 时空注意力,解决行业「短时长、低清、动作混乱」痛点,接近影视级标准可灵AI 全链路创作闭环:从文本 / 图片→视频生成→剪辑 / 配音→发布 / 商用,一站式完成,无需跨平台 商用合规保障:个人 / 企业商用授权清晰,生成内容无版权纠纷,支持广告、影视、电商等商业场景 五、核心应用场景 短视频创作:快手 / 抖音 / 视频号爆款短视频、剧情、Vlog、特效、IP 短剧、口播视频 电商营销:商品展示视频、主图视频、直播切片、广告素材、AI 模特换装、产品动态演示 影视与内容:电影分镜、概念短片、预告片、动画、纪录片素材、导演共创(可灵导演计划)可灵AI 企业与品牌:品牌宣传片、活动视频、教育课件、游戏 CG、虚拟人视频、数字内容生产 个人与学生:生活记录、作品集、作业、创意短片、自媒体内容 六、权威发展历程(关键节点) 2024.06.06:可灵 AI 正式上线,官网开放邀测,支持 2 分钟 1080P/30fps 文生视频,全球首个公众 DiT 视频工具可灵AI 2024.06.21:推出图生视频功能,5 秒动态生成,平面转动态可灵AI 2024.07.24:全面公测,上线会员体系,视频续写开放,最长支持 3 分钟可灵AI 2024.09:1.5 版本,新增运动笔刷、对口型、AI 模特、创意圈;启动「可灵 AI 导演共创计划」(李少红、贾樟柯等 9 位导演),产出 9 部 AI 电影短片可灵AI 2024.12:1.6 版本,图生视频质量提升 195%,复杂运镜 / 动作优化;全球用户破 2200 万 2025.04:可灵 2.0 / 可图 2.0 发布,动态、语义、美学全面升级,登顶全球视频生成榜单双第一 2025.12:全球创作者超 6000 万,累计生成视频 6 亿 +,企业用户 3 万 +,年化 ARR 达 2.4 亿美元 2026.02.05:可灵 AI 3.0 全球上线,支持 4K/60fps、原生音画同步、方言口型、多镜头分镜、Omni 全模态架构,进入影视级创作时代 七、权威边界与合规说明 可灵 AI 为快手科技 100% 自研,独立技术团队、独立事业部,非第三方合作 / 开源二次开发产品 平台生成内容、素材均提供商用授权(个人 / 企业付费会员可商用,免费版仅限非商用),遵循中国及全球版权合规标准 核心能力聚焦视频 / 图像生成,不涉及代码、文本大模型、音视频全品类编辑 数据安全:遵循快手隐私合规,用户创作内容仅本人可见,平台不擅自使用、传播
AI / AI视频 / Kling / 可灵 / 可灵AI / 快手
QClaw

QClaw

百科
      QClaw(昵称 “龙虾”)是腾讯电脑管家团队基于开源 AI 智能体框架OpenClaw深度封装、面向普通用户推出的本地部署 AI 智能体(AI Agent)助手,主打微信直连、零门槛一键部署、数据本地留存,支持通过微信发送自然语言指令远程操控本地电脑执行自动化任务qclaw.qq.com。 一、基本信息 官方全称:腾讯 QClaw 开发主体:腾讯科技(深圳)有限公司・腾讯电脑管家团队 技术基底:基于开源项目 OpenClaw(AI 智能体执行框架)二次封装,非独立从零开发 2026 年 3 月 10 日:开启邀请制内测 2026 年 3 月 20 日:全量公测,无需邀请码、零门槛开放,Windows/macOS 双平台同步上线发布历程: 官方渠道:官网 https://qclaw.qq.com/ 核心定位:个人级本地 AI 执行助手,实现 “微信发指令、电脑自动干活”,区别于纯对话 AI 与传统远程桌面 二、核心特性(权威官方确认) 1. 部署与运行 平台支持:Windows 10/11、macOS(Apple Silicon/Intel 双架构),暂不支持 Linux 部署方式:一键安装包,自动配置环境,无需 Node.js/Python、Docker、命令行操作,小白开箱即用 数据安全:全程本地运行、数据不出设备,AI 推理、文件操作、任务执行均在用户本机完成,不经过腾讯云端,隐私可控 兼容 OpenClaw:已安装 OpenClaw 的设备,可一键关联 QClaw,复用原有配置与技能 2. 交互入口(核心差异化) 微信直连(主入口):扫码绑定微信后,通过微信聊天窗口(文字 / 语音 / 图片)发送指令,手机端即可远程触发电脑端执行;支持微信小程序入口,无需额外安装 App QQ 接入:同步支持 QQ 绑定,双社交入口覆盖国内主流 IM 场景 本地客户端:电脑端独立界面,可直接下达指令、查看任务日志、管理模型与技能 3. AI 能力与模型 内置模型:预置 Kimi-2.5、Minimax、GLM、DeepSeek 等国产大模型,支持一键切换;支持自定义接入第三方模型(需配置) 智能体能力:具备任务拆解、工具调用、本地执行、上下文记忆、持续学习能力,非纯文本对话,可直接操控电脑硬件 / 软件 技能生态:内置 5000 + 开箱即用 Skills(ClawHub、GitHub 开源生态),覆盖办公、开发、文件、浏览器、日程、邮件、社媒等场景;支持自定义创建 / 导入技能 4. 核心功能(官方明确) 文件自动化:打开 / 编辑 / 整理 / 计算本地文档(Excel、Word、PDF)、批量重命名、文件夹分类、数据提取 系统与浏览器操控:执行 Shell 命令、打开程序、浏览器自动化(搜索、填表、截图、下载)、定时任务 办公协同:腾讯文档 / 邮件 / 日历操作、会议提醒、报表生成、内容总结 开发辅助:代码生成、项目创建、Git 提交、接口调试、文档生成 远程调度:手机微信发指令,电脑端后台执行,跨空间完成任务(如外出时处理本地文件) 三、与 OpenClaw 的关系(权威界定) QClaw 是OpenClaw 的官方产品化封装版、国内定制发行版,类比 Linux 内核与 Ubuntu 发行版的关系 OpenClaw:开源、极客向、需手动部署、支持多平台(含 Linux)、入口以 Telegram/Slack 为主 QClaw:闭源商用、面向大众、一键部署、仅 Windows/macOS、深度绑定微信 / QQ、本土化优化、安全加固(腾讯电脑管家安全底座) 四、使用门槛与限制(官方) 硬件要求:最低 2 核 CPU、4GB 内存、500MB 可用存储,主流办公本 / 老旧笔记本均可流畅运行 网络要求:电脑端需联网(用于模型请求、微信指令传输),手机端联网即可远程控制 使用限制:免费公测阶段提供基础模型额度与技能;高级模型 / 自定义模型可能涉及额度或付费(以官方后续公告为准);不支持无网络本地离线运行(模型推理依赖联网)
AI / AI Agent / AI助手 / OpenClaw / QClaw
王小亿(短剧演员)

王小亿(短剧演员)

百科
        王小亿(本名王亿),中国内地短剧女演员,1997 年 12 月 6 日出生于湖北省武汉市,毕业于武汉设计工程学院成龙影视传媒学院表演系,身高 168cm,射手座。她是红果短剧平台首位获赞破亿女演员,以清冷仙气、爆发力强的演技著称,代表作《云渺》系列、《死后才知,我竟是京圈太子白月光》等,被称为 “短剧清冷女神”“云渺神女”。 一、基本信息 本名:王亿 艺名:王小亿 出生日期:1997 年 12 月 6 日 出生地:湖北省武汉市 毕业院校:武汉设计工程学院成龙影视传媒学院 表演系 身高:168cm 星座:射手座 经纪公司:百川中文(2025 年 12 月 31 日正式签约,此前为独立艺人、个人工作室) 行业标签:短剧顶流、清冷仙子、女频短剧扛剧女主 二、演艺经历 (1)前期积累(2022-2023) 2022 年 6 月 9 日,王小亿以创作者身份入驻抖音,发布生活日常、颜值随拍类短视频,积累初始粉丝与镜头经验。   2023 年,偶然接触短剧剧组试镜,开启短剧演艺之路;初期多饰演恶毒女配、配角,打磨演技,积累剧组经验。 (2)崭露头角(2024 年) 2024 年 6 月,主演首部男主短剧《封神榜之天帝娶妻》(饰女主白灵),首次担纲女主。 8 月 20 日,主演《傅总的女王甜妻飒爆了》,正式进入大众视野。 9 月 6 日,主演《镇天神君》,人气进一步提升。 9 月,搭档陈云廷主演《死后才知,我竟是京圈太子白月光》(饰沈熹微),该剧登顶 DataEye 短剧热力榜 TOP1,成为其成名作,奠定女频短剧地位。 11 月,搭档赵振栋主演《薄爷,夫人把您卖了换钱花》,热度持续走高。 同年,参演《不就是上司吗》《幸得相遇离婚时》(播放量破 20 亿)等多部短剧。 (3)顶流爆发(2025 年) 2 月,主演春节档《春日攀京枝》《凤君》;推出爆款修仙短剧《云渺 1:我修仙多年强亿点怎么了》,饰演清冷强大的女主云渺,开启系列爆款之路。 3 月,获爱奇艺荧光之夜・年度微剧号召力女演员奖。 4-8 月,接连主演《云渺 2》《云渺 3:镇魔世家》《云渺 4:绝嗣佛子》,系列累计播放量超 100 亿、收藏 1200 万,“云渺神女” 形象深入人心,成为短剧圈现象级 IP。 6 月,搭档李子杰主演《公主绝色,影卫日日以下犯上》(饰楚青凰),古偶甜虐题材再获成功。 9 月,成为红果短剧平台首位获赞破亿女演员,创下平台纪录。 11 月,获横店微短剧之夜・年度号召力星耀女演员奖;主演《暗潮涌动》,尝试悬疑题材,拓宽戏路。 12 月 31 日,官宣签约头部短剧公司百川中文,结束独立艺人阶段,开启资源升级新阶段。 三、代表作品(按时间排序) 短剧代表作 《死后才知,我竟是京圈太子白月光》(2024,饰沈熹微,DataEye 热力榜 TOP1) 《云渺 1-4》系列(2025,饰云渺,修仙爆款,累计播放超 100 亿) 《幸得相遇离婚时》(2024,播放量破 20 亿) 《公主绝色,影卫日日以下犯上》(2025,饰楚青凰) 《薄爷,夫人把您卖了换钱花》(2024) 《镇天神君》(2024) 《傅总的女王甜妻飒爆了》(2024) 《暗潮涌动》(2025,悬疑题材) 《春日攀京枝》(2025) 四、荣誉与行业地位 2025 年 3 月:爱奇艺荧光之夜「年度微剧号召力女演员」 2025 年 9 月:红果短剧平台首位获赞破亿女演员(平台纪录) 2025 年 11 月:横店微短剧之夜「年度号召力星耀女演员」 行业地位:短剧圈顶流女主,女频短剧核心扛剧艺人,擅长清冷神女、复仇女主、甜宠女主等多种人设,爆款率高、选本眼光精准,被业内称为 “剧本过滤器”。 五、人物评价         王小亿科班出身,演技细腻有爆发力,擅长在短剧情境中快速塑造人物、传递情绪,尤其适合清冷强大、外冷内热的女主形象。从短视频素人到短剧顶流,她以独立艺人身份打拼,靠作品与口碑出圈,是短剧行业从草根到顶流的典型代表;签约百川中文后,进一步打通 IP 与艺人资源,未来发展备受行业期待。
演员 / 王小亿 / 短剧演员 / 网红 / 美女
即梦AI

即梦AI

百科
      即梦 AI(Jimeng AI)是字节跳动旗下剪映团队自研的一站式多模态 AI 创作平台,前身为剪映 Dreamina,2024 年 5 月正式定名 “即梦”。核心定位为零门槛、全链路、中文友好的 AI 图文 / 视频创作工具,基于自研 Seedream、Seedance、OmniHuman 等模型,覆盖文生图、图生图、文生视频、图生视频、智能画布、故事分镜、数字人对口型等能力,深度协同抖音、剪映生态,主打快速出片、创意轻量化、社交短视频场景适配即梦AI。 一、基础权威信息 官方全称:即梦 AI(Jimeng AI) 开发主体:字节跳动(深圳市脸萌科技有限公司),剪映团队独立研发,隶属于字节 AI 与短视频生态体系 前身与上线:2024 年 3 月内测(剪映 Dreamina);2024 年 5 月 22 日正式更名 “即梦” 并开放公测;2025 年 2 月上线 OmniHuman 数字人模型,2025 年 6 月发布 Seedance 3.0 Pro 视频模型 核心定位:人人可用的 AI 创意中枢,打通灵感→生成→编辑→发布全流程,服务普通用户、短视频博主、电商运营、设计师 官方入口:网页端(https://jimeng.jianying.com/)、iOS/Android「即梦 AI」App、剪映 App 内置入口、抖音创作服务平台入口 核心 Slogan:创意即刻成片,会说就会做 权威认证:入选 2024-2025 中国 AI 生成内容创新工具榜单、字节跳动年度技术创新产品 二、核心技术架构(官方口径)       即梦采用自研 DiT(Diffusion Transformer)+ MoE 混合专家架构,融合字节大模型基座能力,构建轻量化、高速度、中文专项优化的多模态生成体系: 底层模型矩阵: Seedream:文生图 / 图生图基座,主打高清、风格化、中文语义理解,支持 4K 直出、智能扩图、局部重绘 Seedance:文生视频 / 图生视频基座,DiT 架构,优化时序一致性、运镜控制、短视频节奏适配 OmniHuman(2025.2):数字人专用模型,单图 + 音频生成自然口型、肢体动作,支持演讲 / 唱歌 / 乐器演奏,解决手势崩坏、表情僵硬问题   核心技术专利: 中文提示词语义对齐引擎:深度优化中文短句、口语、方言、网络热词理解,无需复杂英文提示词 时序轻量化 DiT:在消费级算力下实现 5-10 秒 1080P/30fps 视频快速生成(单段最快 15 秒出片) 智能运镜与分镜生成:自动匹配短视频节奏,支持推 / 拉 / 摇 / 移 / 环绕、特写 / 全景等运镜指令   生态协同:深度对接剪映剪辑、抖音发布、豆包文案生成、火山引擎算力,实现创作 - 剪辑 - 分发闭环 三、核心功能模块 1. AI 图像生成(Seedream) 文生图:中文直出,支持写实、动漫、国风、赛博朋克、3D 卡通等 50 + 风格,4K 高清、智能排版、中文字体优化 图生图 / 风格迁移:上传单图,保留主体、一键转风格、高清放大、局部重绘、消除笔、智能扩图(无限画布) 智能画布:图层编辑、多图拼接、海报排版、一键生成电商主图 / 短视频封面 / 宣传海报 2. AI 视频生成(Seedance) 文生视频:3-10 秒(Pro 版最长 36 秒)、1080P/30fps,支持全比例(9:16/16:9/1:1)、运镜控制、帧率调节、风格匹配 图生视频:单图 / 多图生成动态视频、运镜动画、主体动态,保留构图一致性 视频续写 / 补帧:基于已有片段续写,保持角色 / 场景统一,适配短视频续剪 数字人对口型(OmniHuman):单图 + 音频(普通话 / 方言 / 外语)生成自然唇形、肢体动作,支持虚拟主播、口播视频、教育课件 3. 全链路创作工具 故事创作模式:输入剧情,自动生成分镜脚本、多镜头序列、镜头组接,一站式出片 AI 配乐 / 音效:自动匹配视频风格生成背景音乐、音效,支持音画同步 一键发布:直接同步至剪映、抖音,享流量扶持、创作者激励 4. 会员与企业服务 免费版:每日基础积分,基础生成、水印、低清 会员版:Pro(69 元 / 月)、Ultra(129 元 / 月),去水印、4K、无限分镜、优先算力、商用授权 企业版:API 接口、私有化部署、定制模型、专属客服、批量生成,服务电商、教育、传媒企业 四、核心权威优势 中文场景绝对领先:中文提示词理解、方言口型、短视频节奏、中文字体 / 排版、本土风格(国风 / 国潮)优化,远超海外竞品 轻量化极速生成:消费级设备可用、生成速度行业领先(5 秒视频最快 15 秒出片),适合短视频高频创作 全链路零门槛:从文案→生成→剪辑→发布一站式,无需专业技能,新手 3 分钟出片 字节生态深度协同:剪映剪辑、抖音分发、豆包文案、火山算力无缝打通,创作效率最大化 商用合规清晰:会员生成内容可商用,无版权纠纷,适配电商、广告、自媒体场景 五、核心应用场景 短视频创作:抖音 / 快手 / 视频号爆款短视频、剧情、Vlog、口播、虚拟人视频 电商营销:商品主图视频、直播切片、广告素材、AI 模特、产品动态演示 设计与创意:海报、封面、插画、概念图、动态海报、分镜草图 教育与企业:课件视频、品牌宣传、数字人播报、活动短片 个人创作:生活记录、作品集、创意短片、自媒体内容 六、权威发展历程(关键节点) 2024.03:剪映 Dreamina 内测,上线文生图、基础文生视频 2024.05.22:正式定名「即梦 AI」,开放公测,接入剪映 / 抖音生态 2024.09:2.0 版本,升级 Seedream/Seedance,新增智能画布、故事分镜、运镜控制 2025.02:发布 OmniHuman 数字人模型,单图 + 音频生成自然口型 / 动作,解决手势崩坏 2025.06:Seedance 3.0 Pro 上线,支持最长 36 秒视频、4K/60fps、多主体一致性优化 2025.12:全球用户超 4500 万,累计生成内容 5 亿 +,企业客户超 2 万家 七、合规与边界说明 即梦 AI 为字节跳动 100% 自研,独立模型、独立团队,非开源二次开发 版权:用户生成内容版权归用户,会员可商用;禁止生成侵权、违法、低俗内容 数据:本地 / 云端混合部署,用户内容仅本人可见,遵循字节隐私合规 边界:主打轻量化短视频 / 图文,复杂长视频、高物理真实感场景弱于专业影视级工具
AI / 即梦 / 即梦AI / 图生视频 / 文生视频
平生不晚

平生不晚

百科
     平生不晚,中国内地国风女歌手、自媒体创作者,艺名昵称 “晚晚”“不晚”,专注于国风音乐演绎,擅长将流行唱法与戏腔融合创新,以清丽辨识度高的嗓音和细腻的情感表达在国风音乐领域崭露头角,凭借多部优质作品积累了广泛人气,是兼具实力与口碑的新锐国风歌手。 一、基本信息 艺名:平生不晚 昵称:晚晚、不晚 性别:女 国籍:中国 职业:歌手、自媒体创作者 核心领域:国风音乐、戏曲翻唱与表演 风格特色:嗓音清丽清冷,擅长流行与戏腔融合,演唱细腻生动,注重情感传递,不刻意包装,风格质朴真挚。 官方认证平台:酷狗音乐人、抖音创作者、QQ 音乐入驻歌手。 二、演艺经历 2021 年:正式入驻各大音乐平台与短视频平台,以国风翻唱作品起步,凭借翻唱《赤伶》《牵丝戏》等经典国风曲目,凭借独特的戏腔演绎获得首批关注,短视频账号逐步积累粉丝;同年发布首支个人翻唱单曲,完成从自媒体创作者到歌手的初步转型。 2022 年:持续深耕国风领域,推出《伯虎说》《青丝》等热门翻唱作品,其中部分作品登上音乐平台国风榜单,进一步提升知名度;开始尝试原创国风音乐创作,打磨个人演唱风格,注重在作品中融入传统戏曲元素与现代流行节奏。 2023 年:发布首支原创国风单曲,凭借细腻的歌词表达与婉转的戏腔演绎,获得听众广泛好评;受邀参与线下国风音乐活动、小型演唱会,完成个人线下演出首秀;同步更新短视频内容,分享音乐创作日常与国风相关内容,粉丝规模持续增长。 2024 年至今:持续产出优质作品,涵盖原创与翻唱,作品多次登上各大音乐平台国风推荐位;拓展演艺边界,参与国风主题综艺、音乐节等活动,进一步巩固国风歌手定位;坚持以质朴的风格传递国风音乐魅力,成为新锐国风领域的代表性歌手之一。 三、代表作品(官方收录) (一)翻唱作品 《赤伶》:凭借清冷戏腔与细腻情感,还原歌曲的家国情怀,成为其早期代表作之一,收获大量播放量与好评。 《牵丝戏》:重新演绎经典曲目,将流行唱法与戏腔完美融合,凸显其嗓音特色,成为短视频平台热门 BGM。 《伯虎说》:灵动婉转的演唱,搭配戏腔片段,展现国风音乐的趣味性与感染力,传唱度较高。 (二)原创作品 (注:结合官方公开信息收录,未收录未证实的原创曲目)已发布原创国风单曲,聚焦传统意境与现代情感的结合,旋律婉转,歌词兼具诗意与故事感,进一步奠定其国风演唱风格。 四、风格特色与个人影响 (一)风格特色 平生不晚的演唱风格以 “清丽、细腻、有质感” 为核心,最大特点是将流行音乐的节奏与传统戏腔巧妙融合,不刻意追求技巧的华丽,更注重情感的传递。其嗓音清冷通透,戏腔演绎婉转悠扬,既有传统戏曲的韵味,又有现代流行音乐的亲和力,能够精准把握国风歌曲的意境,让听众在旋律中感受传统文化的魅力。 (二)个人影响 作为新锐国风歌手,平生不晚以自媒体为起点,凭借优质的作品与质朴的风格,积累了大量国风音乐爱好者的关注,推动了国风音乐的普及与传播。其作品兼顾观赏性与艺术性,既适合年轻听众的审美,又保留了传统戏曲的精髓,为国风音乐的创新发展提供了新的思路,成为众多国风爱好者喜爱的新生代歌手之一。 五、权威信息来源说明 本词条所有内容均来自平生不晚官方认证平台(酷狗音乐、QQ 音乐、抖音)公开信息、官方发布的作品介绍及权威国风音乐媒体报道,未收录第三方猜测、自媒体非证实内容及主观评价,确保内容的权威性、准确性与严谨性。
国风歌手 / 国风音乐 / 女歌手 / 平生不晚 / 戏腔演唱 / 歌手 / 自媒体创作者
白昕怡(短剧演员)

白昕怡(短剧演员)

百科
白昕怡(1996 年 3 月 25 日 —),中国内地影视女演员,以短剧甜宠、虐恋题材见长,与演员朱一未组成 “爆珠夫妇” CP,是短剧圈高人气实力派演员。 基本信息 中文名:白昕怡 外文名:Xinyi Bai 国籍:中国 民族:汉族 出生地:陕西省西安市 出生日期:1996 年 3 月 25 日 星座:白羊座 毕业院校:山东艺术学院 经纪公司:丝芭影视艺人工作室 代表作品:《夏日不宜入爱河》《双面千金洛莞莞》《今日天晴宜爱你》《月染星辰》等 主要荣誉:2025 爱奇艺微短剧荧光之夜年度微剧荧屏搭档(与朱一未)、2025 横店微短剧之夜年度心动搭档(与朱一未) 早年经历 1996 年 3 月 25 日生于陕西西安,科班毕业于山东艺术学院表演专业,在校期间系统学习影视表演,为后续演艺生涯奠定专业基础。 演艺经历 早期影视(2019—2022) 2019 年 3 月,参演武术抗战电影《形意英雄》,正式进入影视圈;同年在都市情感剧《楼下女友请签收》中饰演汪嘉怡,完成长剧首秀。2020 年,主演文艺爱情电影《爱在那片花海》(饰叶子)、爱情喜剧《爱诫》(饰叶子)。 2021 年 2 月,主演都市爱情剧《陪你一起好好吃饭》(饰张碧),登陆湖南卫视与芒果 TV;3 月主演青春励志剧《悄悄喜欢你》。 2022 年 1 月,主演奇幻网络电影《镇魔司:灵源秘术》(饰陆瞳),在腾讯、爱奇艺上线。 短剧崛起(2023— 至今) 2023 年 1 月,主演腾讯独播爱情短剧《夏日不宜入爱河》(饰时宜),凭借甜妹形象与自然演技出圈,开启短剧主力赛道。2024 年: 4 月,在腾讯悬疑短剧《双面千金洛莞莞》中饰演柳承影; 主演《醒时已上春山》《太子妃马甲掉不停》《今日天晴宜爱你》《低声哄!宝贝,我只要你》等多部爆款短剧,与朱一未搭档默契度拉满,CP 热度飙升。2025 年(核心作品与荣誉): 2 月,参演刑侦剧《刑侦现场》(饰安娜),尝试正剧转型; 3 月 14 日,与朱一未获2025 爱奇艺微短剧荧光之夜年度微剧荧屏搭档(代表作《今日天晴宜爱你》《好兔就吃窝边草》); 主演《娇骨之臣》(江晚栀)、《爱的方程式》(梁夏)、《风吹稻香》(许稻香)、《月染星辰》(许星染)、《肆宠而娇》(席昭)、《听说我成了反派白月光》等 13 部短剧,覆盖甜宠、虐恋、古装、现代等多元题材; 11 月 2 日,与朱一未获2025 横店微短剧之夜年度心动搭档,成为短剧圈标杆 CP。2026 年 2 月,主演短剧《重生阴夫年少时》(饰苏夏)上线,持续保持短剧高产节奏。 个人生活 2024 年 10 月 5 日,朱一未向白昕怡求婚;10 月 6 日,白昕怡在抖音官宣 10 月 7 日与朱一未订婚并直播,二人因戏结缘、搭档近 30 部短剧,被称为短剧圈 “真夫妻 CP”。 截至 2025 年底,抖音粉丝 49.5 万、微博粉丝 60 万,社交平台以作品分享、日常互动为主。 主要作品(精选) 短剧(2023—2026) 《夏日不宜入爱河》(2023,腾讯,饰时宜) 《双面千金洛莞莞》(2024,腾讯,饰柳承影) 《今日天晴宜爱你》(2024,饰黎欣怡) 《月染星辰》(2025,饰许星染) 《风吹稻香》(2025,饰许稻香) 《肆宠而娇》(2025,饰席昭) 《重生阴夫年少时》(2026,饰苏夏) 长剧 / 电影 《楼下女友请签收》(2019,芒果 TV,饰汪嘉怡) 《陪你一起好好吃饭》(2021,湖南卫视 / 芒果 TV,饰张碧) 《镇魔司:灵源秘术》(2022,网络电影,饰陆瞳) 《刑侦现场》(2025,腾讯,饰安娜) 荣誉奖项 2025 爱奇艺微短剧荧光之夜:年度微剧荧屏搭档(与朱一未) 2025 横店微短剧之夜:年度心动搭档(与朱一未) 人物评价 白昕怡外形清新甜美、演技细腻自然,擅长驾驭甜宠、虐恋、马甲逆袭等短剧主流人设,与朱一未的 “真夫妻 CP” 极具观众缘,作品播放量与话题度双高;从长剧配角到短剧女主,逐步形成个人风格,是短剧精品化浪潮中的代表性女演员之一。
演员 / 白昕怡 / 短剧演员 / 网红 / 美女
即梦AI

即梦AI

百科
      即梦 AI(Jimeng AI)是字节跳动旗下剪映团队自研的一站式多模态 AI 创作平台,前身为剪映 Dreamina,2024 年 5 月正式定名 “即梦”。核心定位为零门槛、全链路、中文友好的 AI 图文 / 视频创作工具,基于自研 Seedream、Seedance、OmniHuman 等模型,覆盖文生图、图生图、文生视频、图生视频、智能画布、故事分镜、数字人对口型等能力,深度协同抖音、剪映生态,主打快速出片、创意轻量化、社交短视频场景适配即梦AI。 一、基础权威信息 官方全称:即梦 AI(Jimeng AI) 开发主体:字节跳动(深圳市脸萌科技有限公司),剪映团队独立研发,隶属于字节 AI 与短视频生态体系 前身与上线:2024 年 3 月内测(剪映 Dreamina);2024 年 5 月 22 日正式更名 “即梦” 并开放公测;2025 年 2 月上线 OmniHuman 数字人模型,2025 年 6 月发布 Seedance 3.0 Pro 视频模型 核心定位:人人可用的 AI 创意中枢,打通灵感→生成→编辑→发布全流程,服务普通用户、短视频博主、电商运营、设计师 官方入口:网页端(https://jimeng.jianying.com/)、iOS/Android「即梦 AI」App、剪映 App 内置入口、抖音创作服务平台入口 核心 Slogan:创意即刻成片,会说就会做 权威认证:入选 2024-2025 中国 AI 生成内容创新工具榜单、字节跳动年度技术创新产品 二、核心技术架构(官方口径)       即梦采用自研 DiT(Diffusion Transformer)+ MoE 混合专家架构,融合字节大模型基座能力,构建轻量化、高速度、中文专项优化的多模态生成体系: 底层模型矩阵: Seedream:文生图 / 图生图基座,主打高清、风格化、中文语义理解,支持 4K 直出、智能扩图、局部重绘 Seedance:文生视频 / 图生视频基座,DiT 架构,优化时序一致性、运镜控制、短视频节奏适配 OmniHuman(2025.2):数字人专用模型,单图 + 音频生成自然口型、肢体动作,支持演讲 / 唱歌 / 乐器演奏,解决手势崩坏、表情僵硬问题   核心技术专利: 中文提示词语义对齐引擎:深度优化中文短句、口语、方言、网络热词理解,无需复杂英文提示词 时序轻量化 DiT:在消费级算力下实现 5-10 秒 1080P/30fps 视频快速生成(单段最快 15 秒出片) 智能运镜与分镜生成:自动匹配短视频节奏,支持推 / 拉 / 摇 / 移 / 环绕、特写 / 全景等运镜指令   生态协同:深度对接剪映剪辑、抖音发布、豆包文案生成、火山引擎算力,实现创作 - 剪辑 - 分发闭环 三、核心功能模块 1. AI 图像生成(Seedream) 文生图:中文直出,支持写实、动漫、国风、赛博朋克、3D 卡通等 50 + 风格,4K 高清、智能排版、中文字体优化 图生图 / 风格迁移:上传单图,保留主体、一键转风格、高清放大、局部重绘、消除笔、智能扩图(无限画布) 智能画布:图层编辑、多图拼接、海报排版、一键生成电商主图 / 短视频封面 / 宣传海报 2. AI 视频生成(Seedance) 文生视频:3-10 秒(Pro 版最长 36 秒)、1080P/30fps,支持全比例(9:16/16:9/1:1)、运镜控制、帧率调节、风格匹配 图生视频:单图 / 多图生成动态视频、运镜动画、主体动态,保留构图一致性 视频续写 / 补帧:基于已有片段续写,保持角色 / 场景统一,适配短视频续剪 数字人对口型(OmniHuman):单图 + 音频(普通话 / 方言 / 外语)生成自然唇形、肢体动作,支持虚拟主播、口播视频、教育课件 3. 全链路创作工具 故事创作模式:输入剧情,自动生成分镜脚本、多镜头序列、镜头组接,一站式出片 AI 配乐 / 音效:自动匹配视频风格生成背景音乐、音效,支持音画同步 一键发布:直接同步至剪映、抖音,享流量扶持、创作者激励 4. 会员与企业服务 免费版:每日基础积分,基础生成、水印、低清 会员版:Pro(69 元 / 月)、Ultra(129 元 / 月),去水印、4K、无限分镜、优先算力、商用授权 企业版:API 接口、私有化部署、定制模型、专属客服、批量生成,服务电商、教育、传媒企业 四、核心权威优势 中文场景绝对领先:中文提示词理解、方言口型、短视频节奏、中文字体 / 排版、本土风格(国风 / 国潮)优化,远超海外竞品 轻量化极速生成:消费级设备可用、生成速度行业领先(5 秒视频最快 15 秒出片),适合短视频高频创作 全链路零门槛:从文案→生成→剪辑→发布一站式,无需专业技能,新手 3 分钟出片 字节生态深度协同:剪映剪辑、抖音分发、豆包文案、火山算力无缝打通,创作效率最大化 商用合规清晰:会员生成内容可商用,无版权纠纷,适配电商、广告、自媒体场景 五、核心应用场景 短视频创作:抖音 / 快手 / 视频号爆款短视频、剧情、Vlog、口播、虚拟人视频 电商营销:商品主图视频、直播切片、广告素材、AI 模特、产品动态演示 设计与创意:海报、封面、插画、概念图、动态海报、分镜草图 教育与企业:课件视频、品牌宣传、数字人播报、活动短片 个人创作:生活记录、作品集、创意短片、自媒体内容 六、权威发展历程(关键节点) 2024.03:剪映 Dreamina 内测,上线文生图、基础文生视频 2024.05.22:正式定名「即梦 AI」,开放公测,接入剪映 / 抖音生态 2024.09:2.0 版本,升级 Seedream/Seedance,新增智能画布、故事分镜、运镜控制 2025.02:发布 OmniHuman 数字人模型,单图 + 音频生成自然口型 / 动作,解决手势崩坏 2025.06:Seedance 3.0 Pro 上线,支持最长 36 秒视频、4K/60fps、多主体一致性优化 2025.12:全球用户超 4500 万,累计生成内容 5 亿 +,企业客户超 2 万家 七、合规与边界说明 即梦 AI 为字节跳动 100% 自研,独立模型、独立团队,非开源二次开发 版权:用户生成内容版权归用户,会员可商用;禁止生成侵权、违法、低俗内容 数据:本地 / 云端混合部署,用户内容仅本人可见,遵循字节隐私合规 边界:主打轻量化短视频 / 图文,复杂长视频、高物理真实感场景弱于专业影视级工具
AI / 即梦 / 即梦AI / 图生视频 / 文生视频
平生不晚

平生不晚

百科
     平生不晚,中国内地国风女歌手、自媒体创作者,艺名昵称 “晚晚”“不晚”,专注于国风音乐演绎,擅长将流行唱法与戏腔融合创新,以清丽辨识度高的嗓音和细腻的情感表达在国风音乐领域崭露头角,凭借多部优质作品积累了广泛人气,是兼具实力与口碑的新锐国风歌手。 一、基本信息 艺名:平生不晚 昵称:晚晚、不晚 性别:女 国籍:中国 职业:歌手、自媒体创作者 核心领域:国风音乐、戏曲翻唱与表演 风格特色:嗓音清丽清冷,擅长流行与戏腔融合,演唱细腻生动,注重情感传递,不刻意包装,风格质朴真挚。 官方认证平台:酷狗音乐人、抖音创作者、QQ 音乐入驻歌手。 二、演艺经历 2021 年:正式入驻各大音乐平台与短视频平台,以国风翻唱作品起步,凭借翻唱《赤伶》《牵丝戏》等经典国风曲目,凭借独特的戏腔演绎获得首批关注,短视频账号逐步积累粉丝;同年发布首支个人翻唱单曲,完成从自媒体创作者到歌手的初步转型。 2022 年:持续深耕国风领域,推出《伯虎说》《青丝》等热门翻唱作品,其中部分作品登上音乐平台国风榜单,进一步提升知名度;开始尝试原创国风音乐创作,打磨个人演唱风格,注重在作品中融入传统戏曲元素与现代流行节奏。 2023 年:发布首支原创国风单曲,凭借细腻的歌词表达与婉转的戏腔演绎,获得听众广泛好评;受邀参与线下国风音乐活动、小型演唱会,完成个人线下演出首秀;同步更新短视频内容,分享音乐创作日常与国风相关内容,粉丝规模持续增长。 2024 年至今:持续产出优质作品,涵盖原创与翻唱,作品多次登上各大音乐平台国风推荐位;拓展演艺边界,参与国风主题综艺、音乐节等活动,进一步巩固国风歌手定位;坚持以质朴的风格传递国风音乐魅力,成为新锐国风领域的代表性歌手之一。 三、代表作品(官方收录) (一)翻唱作品 《赤伶》:凭借清冷戏腔与细腻情感,还原歌曲的家国情怀,成为其早期代表作之一,收获大量播放量与好评。 《牵丝戏》:重新演绎经典曲目,将流行唱法与戏腔完美融合,凸显其嗓音特色,成为短视频平台热门 BGM。 《伯虎说》:灵动婉转的演唱,搭配戏腔片段,展现国风音乐的趣味性与感染力,传唱度较高。 (二)原创作品 (注:结合官方公开信息收录,未收录未证实的原创曲目)已发布原创国风单曲,聚焦传统意境与现代情感的结合,旋律婉转,歌词兼具诗意与故事感,进一步奠定其国风演唱风格。 四、风格特色与个人影响 (一)风格特色 平生不晚的演唱风格以 “清丽、细腻、有质感” 为核心,最大特点是将流行音乐的节奏与传统戏腔巧妙融合,不刻意追求技巧的华丽,更注重情感的传递。其嗓音清冷通透,戏腔演绎婉转悠扬,既有传统戏曲的韵味,又有现代流行音乐的亲和力,能够精准把握国风歌曲的意境,让听众在旋律中感受传统文化的魅力。 (二)个人影响 作为新锐国风歌手,平生不晚以自媒体为起点,凭借优质的作品与质朴的风格,积累了大量国风音乐爱好者的关注,推动了国风音乐的普及与传播。其作品兼顾观赏性与艺术性,既适合年轻听众的审美,又保留了传统戏曲的精髓,为国风音乐的创新发展提供了新的思路,成为众多国风爱好者喜爱的新生代歌手之一。 五、权威信息来源说明 本词条所有内容均来自平生不晚官方认证平台(酷狗音乐、QQ 音乐、抖音)公开信息、官方发布的作品介绍及权威国风音乐媒体报道,未收录第三方猜测、自媒体非证实内容及主观评价,确保内容的权威性、准确性与严谨性。
国风歌手 / 国风音乐 / 女歌手 / 平生不晚 / 戏腔演唱 / 歌手 / 自媒体创作者
白昕怡(短剧演员)

白昕怡(短剧演员)

百科
白昕怡(1996 年 3 月 25 日 —),中国内地影视女演员,以短剧甜宠、虐恋题材见长,与演员朱一未组成 “爆珠夫妇” CP,是短剧圈高人气实力派演员。 基本信息 中文名:白昕怡 外文名:Xinyi Bai 国籍:中国 民族:汉族 出生地:陕西省西安市 出生日期:1996 年 3 月 25 日 星座:白羊座 毕业院校:山东艺术学院 经纪公司:丝芭影视艺人工作室 代表作品:《夏日不宜入爱河》《双面千金洛莞莞》《今日天晴宜爱你》《月染星辰》等 主要荣誉:2025 爱奇艺微短剧荧光之夜年度微剧荧屏搭档(与朱一未)、2025 横店微短剧之夜年度心动搭档(与朱一未) 早年经历 1996 年 3 月 25 日生于陕西西安,科班毕业于山东艺术学院表演专业,在校期间系统学习影视表演,为后续演艺生涯奠定专业基础。 演艺经历 早期影视(2019—2022) 2019 年 3 月,参演武术抗战电影《形意英雄》,正式进入影视圈;同年在都市情感剧《楼下女友请签收》中饰演汪嘉怡,完成长剧首秀。2020 年,主演文艺爱情电影《爱在那片花海》(饰叶子)、爱情喜剧《爱诫》(饰叶子)。 2021 年 2 月,主演都市爱情剧《陪你一起好好吃饭》(饰张碧),登陆湖南卫视与芒果 TV;3 月主演青春励志剧《悄悄喜欢你》。 2022 年 1 月,主演奇幻网络电影《镇魔司:灵源秘术》(饰陆瞳),在腾讯、爱奇艺上线。 短剧崛起(2023— 至今) 2023 年 1 月,主演腾讯独播爱情短剧《夏日不宜入爱河》(饰时宜),凭借甜妹形象与自然演技出圈,开启短剧主力赛道。2024 年: 4 月,在腾讯悬疑短剧《双面千金洛莞莞》中饰演柳承影; 主演《醒时已上春山》《太子妃马甲掉不停》《今日天晴宜爱你》《低声哄!宝贝,我只要你》等多部爆款短剧,与朱一未搭档默契度拉满,CP 热度飙升。2025 年(核心作品与荣誉): 2 月,参演刑侦剧《刑侦现场》(饰安娜),尝试正剧转型; 3 月 14 日,与朱一未获2025 爱奇艺微短剧荧光之夜年度微剧荧屏搭档(代表作《今日天晴宜爱你》《好兔就吃窝边草》); 主演《娇骨之臣》(江晚栀)、《爱的方程式》(梁夏)、《风吹稻香》(许稻香)、《月染星辰》(许星染)、《肆宠而娇》(席昭)、《听说我成了反派白月光》等 13 部短剧,覆盖甜宠、虐恋、古装、现代等多元题材; 11 月 2 日,与朱一未获2025 横店微短剧之夜年度心动搭档,成为短剧圈标杆 CP。2026 年 2 月,主演短剧《重生阴夫年少时》(饰苏夏)上线,持续保持短剧高产节奏。 个人生活 2024 年 10 月 5 日,朱一未向白昕怡求婚;10 月 6 日,白昕怡在抖音官宣 10 月 7 日与朱一未订婚并直播,二人因戏结缘、搭档近 30 部短剧,被称为短剧圈 “真夫妻 CP”。 截至 2025 年底,抖音粉丝 49.5 万、微博粉丝 60 万,社交平台以作品分享、日常互动为主。 主要作品(精选) 短剧(2023—2026) 《夏日不宜入爱河》(2023,腾讯,饰时宜) 《双面千金洛莞莞》(2024,腾讯,饰柳承影) 《今日天晴宜爱你》(2024,饰黎欣怡) 《月染星辰》(2025,饰许星染) 《风吹稻香》(2025,饰许稻香) 《肆宠而娇》(2025,饰席昭) 《重生阴夫年少时》(2026,饰苏夏) 长剧 / 电影 《楼下女友请签收》(2019,芒果 TV,饰汪嘉怡) 《陪你一起好好吃饭》(2021,湖南卫视 / 芒果 TV,饰张碧) 《镇魔司:灵源秘术》(2022,网络电影,饰陆瞳) 《刑侦现场》(2025,腾讯,饰安娜) 荣誉奖项 2025 爱奇艺微短剧荧光之夜:年度微剧荧屏搭档(与朱一未) 2025 横店微短剧之夜:年度心动搭档(与朱一未) 人物评价 白昕怡外形清新甜美、演技细腻自然,擅长驾驭甜宠、虐恋、马甲逆袭等短剧主流人设,与朱一未的 “真夫妻 CP” 极具观众缘,作品播放量与话题度双高;从长剧配角到短剧女主,逐步形成个人风格,是短剧精品化浪潮中的代表性女演员之一。
演员 / 白昕怡 / 短剧演员 / 网红 / 美女
Stable Diffusion

Stable Diffusion

百科
      Stable Diffusion(简称 SD)是由Stability AI主导开发、基于潜扩散模型(Latent Diffusion Model)的开源多模态 AI 图像生成工具,核心定位为「人人可用的普惠型 AI 创作引擎」,以文生图、图生图为核心,支持本地部署、参数定制与生态扩展,覆盖艺术创作、商业设计、科研教育等全场景,是全球最具影响力、应用最广泛的开源 AI 绘画模型之一,彻底降低了 AI 图像生成的技术门槛与使用成本。 一、基础权威信息 官方全称:Stable Diffusion 开发主体:Stability AI(英国人工智能公司),联合慕尼黑路德维希・马克西米利安大学 CompVis 小组、Runway ML 共同研发,核心技术团队由 AI 领域顶尖研究者组成 上线时间:2022 年 8 月 22 日正式发布首个版本;2023 年 6 月推出 SDXL 0.9 版本,2024 年 2 月发布 Stable Diffusion 3 早期预览版,2024 年 10 月推出 Stable Diffusion 3.5 系列及 Medium 版本 核心定位:开源免费、可本地运行、高度可定制,让普通用户与专业创作者都能快速生成高质量图像,推动 AI 创作平民化 官方入口:开源仓库(GitHub)、Stability AI 官网(stability.ai);第三方衍生工具(WebUI、ComfyUI、Fooocus 等);支持本地部署(Windows/macOS/Linux)、云服务调用 核心特性:开源免费(非商用 / 商用均可,遵循 Stability AI 社区许可证)、本地运行、参数可控、生态完善、轻量高效(支持消费级显卡运行) 权威认证:多次入选全球 AI 创新技术榜单,被苹果官方支持(优化 Apple Silicon 芯片运行性能),成为 AI 绘画领域开源标杆工具 二、核心技术架构(开源官方口径)       Stable Diffusion 的核心优势在于创新的潜扩散架构,将图像生成过程压缩到潜在空间完成,大幅降低计算复杂度,实现消费级硬件可运行,其技术架构主要包括 4 大核心模块: 底层基座:基于扩散模型(Diffusion Model),融合 Transformer 架构,通过 “反向去噪” 过程从纯噪声中逐步生成清晰图像,核心是潜空间映射技术,平衡生成质量与计算效率。 核心组件:由文本编码器(CLIP Text Encoder,负责解析提示词)、扩散模型(UNet,核心去噪模块)、图像解码器(VAE,将潜空间特征还原为可视图像)三部分组成,三者协同实现 “文本→潜空间特征→图像” 的完整生成链路。 关键优化技术:支持对抗性扩散蒸馏(如 SDXL Turbo 版本,将生成迭代步骤从 50 步缩减至 1 步)、深度引导(Depth 模型)、文本引导修复等,同时优化多语言提示词理解,适配中文等多语种场景。 扩展性架构:采用模块化设计,支持 LoRA、ControlNet 等插件扩展,允许用户微调模型、定制风格,同时兼容不同前端工具(WebUI、ComfyUI 等),形成灵活的创作工作流。 三、核心功能模块(开源完整版) 1. 核心生成功能(基础能力) 文生图(Text-to-Image):通过正向提示词(描述想要的内容)和反向提示词(排除不想要的内容)生成图像,支持 20 + 主流风格(写实、二次元、国风、赛博朋克、油画等),可调节采样方法、采样步数、图像尺寸、CFG Scale 等参数,生成分辨率最高支持 4K,单次生成时间根据硬件配置可控制在几秒到几十秒不等,提示词可通过权重调节(括号语法)精准控制元素呈现效果。 图生图(Image-to-Image):上传参考图,通过调整去噪强度实现风格迁移、画面重构、瑕疵修复、画面拓展等功能;去噪强度 0.1-0.3 可轻微优化图像,0.4-0.6 可实现风格迁移,0.7-1.0 可彻底重构画面(仅保留原图轮廓或色彩),适配草图转稿、照片优化等场景。 高清修复(Upscale):内置多种放大算法(Latent、ESRGAN 等),可将低分辨率图像放大 4 倍以上,同时补充细节,解决生成图像模糊、细节不足的问题,部分衍生工具支持批量高清修复。 局部重绘(Inpaint):精准选中图像局部区域,通过提示词修改该区域内容,实现局部优化、杂物去除、元素替换等,适配图像精细化调整场景,是商业设计中常用的核心功能之一。 2. 进阶控制功能(扩展能力) LoRA 微调(Low-Rank Adaptation):轻量级模型微调技术,文件体积小(50-300MB),可快速定制特定风格、角色或元素(如宫崎骏风格、特定 IP 形象),无需复杂训练,通过触发词即可激活对应风格,可与主模型叠加使用,兼容性极强。 ControlNet 插件:核心用于精准控制图像构图、姿态、边缘、深度等,解决 AI 生成图像 “构图混乱、姿态畸形” 的痛点,支持骨骼姿态控制、线稿控制、深度控制等,适配专业设计、角色创作等场景,大幅提升生成可控性。 其他扩展功能:支持图生视频(结合 AnimateDiff 插件)、文本嵌入(Embedding)、IPAdapter(参考图风格 / 身份迁移)、批量生成、种子控制(固定种子可复现相同结果)等,满足不同用户的进阶创作需求。 3. 生态与工具支持 开源社区:拥有全球庞大的开源社区,用户可自由分享模型、LoRA、提示词、工作流,核心模型与插件均开源可下载,社区持续迭代优化功能,解决使用中的常见问题(如人物畸形、画面模糊等)。 前端工具:主流衍生工具包括 WebUI(新手友好,操作直观)、ComfyUI(专业级,支持复杂工作流定制)、Fooocus(极简操作,一键出图),适配不同用户群体(新手、专业创作者),无需复杂代码基础即可使用。 模型资源:官方及社区推出大量细分模型(Checkpoint),如 SD 1.5(轻量兼容)、SDXL(高清写实)、Anything V5(二次元)、DreamShaper(通用写实)等,用户可根据创作需求选择对应模型,模型可从 Civitai、HuggingFace、ModelScope 等平台下载。 四、核心权威优势 开源普惠:完全开源免费,非商用、商用均可使用(遵循社区许可证),无使用门槛与版权限制,区别于 Midjourney 等付费工具,让普通用户也能接触 AI 创作,推动 AI 绘画普及化。 本地运行:支持消费级显卡(NVIDIA、AMD)本地部署,无需依赖网络,既保护用户创作隐私,又不受平台服务器限制,可根据自身硬件配置优化生成速度与质量,适配隐私性要求高的场景(如商业设计、科研创作)。 高度可定制:从参数调节、模型微调(LoRA)、插件扩展到工作流定制,全方位支持用户个性化创作,可适配不同风格、不同场景的创作需求,既能满足新手一键出图,也能满足专业创作者的精细化设计需求,灵活性远超同类工具。 生态完善:全球庞大的开源社区与丰富的模型、插件资源,持续迭代优化,用户可快速获取教程、素材与解决方案,同时第三方工具适配完善,形成 “模型 - 工具 - 社区” 的完整生态,降低学习与使用成本,推动功能持续升级。 轻量高效:得益于潜扩散架构,计算复杂度低,可在普通消费级显卡上流畅运行,生成速度快,同时支持批量生成、高清修复等高效功能,大幅提升创作效率,适配商业设计、批量素材生产等场景。 五、核心应用场景 艺术创作:数字绘画、插画创作、概念艺术设计、风格化作品生成、艺术风格迁移,帮助艺术家拓展创意思路,快速生成草图与成品,提升创作效率,适配插画师、设计师、艺术爱好者等群体。 商业设计:电商商品图、海报、宣传册、LOGO 辅助设计、UI 界面草图、广告素材生成,无需专业设计基础,即可快速产出商用级素材,降低中小企业与个人创作者的设计成本,适配电商运营、中小企业、广告从业者等。 科研与教育:AI 图像生成技术研究、计算机视觉相关教学演示、学生作业(数字绘画、设计类)、创意教学辅助,帮助科研人员开展技术研究,助力学生快速掌握 AI 创作技巧。 个人与自媒体:自媒体配图、短视频封面、头像生成、生活照片优化、创意恶搞图像,适配自媒体博主、普通用户的日常创作需求,零门槛即可产出个性化内容。 影视与游戏:影视分镜草图、游戏角色 / 场景概念设计、游戏贴图生成,辅助影视、游戏创作团队快速产出创意方案,缩短创作周期,适配影视从业者、游戏设计师等。 六、权威发展历程(关键节点) 2022.08.22:Stable Diffusion 1.0 正式发布,基于潜扩散架构,支持消费级显卡本地部署,开源免费,迅速引爆 AI 绘画领域,成为开源 AI 绘画标杆。 2022.11:Stable Diffusion 1.5 版本发布,优化图像生成质量、人物细节与提示词遵循度,修复常见 bug,成为最经典、最常用的基础版本,至今仍被广泛使用。 2023.06:Stable Diffusion XL(SDXL)0.9 版本发布,原生支持 1024×1024 高清分辨率,优化写实风格生成,新增文本理解能力,大幅提升生成图像的细节与质感。 2023.11:SDXL 1.0 正式发布,完善高清生成能力,支持 2K + 分辨率,优化多风格适配,成为商业设计、高清创作的首选版本,同时推出 SDXL Turbo(1 步生成,极速出图)。 2024.02:Stable Diffusion 3 早期预览版发布,采用全新架构,优化多模态输入(文本、图像),提升提示词理解精度与生成可控性,支持更复杂的场景与细节生成。 2024.10:Stable Diffusion 3.5 系列及 Medium 版本发布,进一步优化生成速度与质量,完善中文提示词理解,新增更多细分风格模型,适配更多创作场景,同时拓展模型轻量化部署能力。 2025 至今:持续迭代模型轻量化、多模态融合(图生视频、文生 3D)能力,优化开源生态,推出更多行业定制化模型(如医疗、建筑设计专用模型),扩大应用场景。 七、开源许可与合规说明 开源许可:Stable Diffusion 核心模型遵循 Stability AI 社区许可证(OpenRAIL-M),非商用、商用均可免费使用,但禁止用于违法违规、侵权、低俗色情、危害国家安全等场景;衍生模型、插件需遵循对应开源许可,部分社区模型可能有商用限制,使用前需确认许可条款。 版权边界:用户使用 Stable Diffusion 生成的内容,版权归用户所有(前提是不侵犯他人知识产权);禁止使用模型生成侵犯他人肖像权、著作权、商标权的内容(如生成名人肖像、抄袭他人作品)。 数据安全:本地部署版本不涉及数据上传,可保护用户创作隐私;使用第三方 Web 端衍生工具时,需注意平台的数据收集政策,避免敏感内容泄露。 技术边界:模型生成内容可能存在一定瑕疵(如人物畸形、细节错乱),需用户进行后期优化;不支持生成违法违规、血腥恐怖、低俗色情等内容,开源社区与官方均有相关过滤机制。
AI / SD / Stable Diffusion / 图生图 / 文生图 / 本地部署 AI / 生图AI
豆包(AI助手)

豆包(AI助手)

百科
      豆包是字节跳动公司自主研发的综合性人工智能产品矩阵,核心包含豆包大模型(原名 “云雀”)与豆包 AI 智能助手两大核心板块,依托字节跳动自研技术基座,覆盖个人消费级与企业级全场景,是国内首批通过算法备案的 AI 产品之一,也是国内使用量最大、应用场景最丰富的 AI 产品矩阵之一。 一、基本信息 官方名称:豆包(Doubao) 开发主体:字节跳动科技(北京)有限公司 核心定位:多模态 AI 基础设施(豆包大模型)+ 全场景 AI 智能助手(豆包 AI 助手),兼顾个人用户与企业客户需求 技术基底:基于 Transformer 架构的混合专家(MoE)大语言模型,核心为字节跳动自研的 “云雀”(Skylark)大模型,无外部开源模型或第三方技术依赖 官方渠道:官网(www.doubao.com)、全平台客户端(iOS/Android/Windows/macOS)、网页版及浏览器插件 核心特性:中文优化能力突出、多模态融合、低时延响应、高性价比,支持跨平台同步使用 二、核心构成与技术体系 (一)豆包大模型       豆包大模型是字节跳动自研的多模态大模型家族,原名 “云雀”,定位为 AI 基础设施,支撑全场景 AI 能力落地,于 2024 年 5 月 15 日在 “2024 春季火山引擎 Force 原动力大会” 上正式发布,后续持续迭代升级,形成了覆盖通用与细分领域的完整模型矩阵。 模型家族构成:包含 2 个通用模型(豆包通用模型 Pro、豆包通用模型 Lite)与 7 个细分领域模型(角色扮演模型、语音识别模型、语音合成模型、声音复刻模型、文生图模型、Function Call 模型、向量化模型),共计 9 个核心模型,可满足不同场景的差异化需求。 技术特点:采用大规模稀疏 MoE 架构,等效 7 倍激活参数的 Dense 模型性能,训练成本降低 90%;具备动态注意力机制,支持 32K 上下文窗口(可扩展至百万级 token),长文本处理能力突出;实现端到端语音处理,支持低时延对话、情绪承接与方言理解;集成多模态融合技术,可高效处理文本、图像、音频、视频等多类型输入输出。 核心能力:覆盖自然语言理解与生成、代码创作(支持 30 + 编程语言,准确率达 95%)、数学推理(可解决 AIME 级别证明,GSM8K 测试表现超越 GPT-4)、语音处理、图像生成与分析、复杂任务自动化等,适用于企业级服务、科研、教育及工业等多领域。 商业化定价:主力模型在企业市场定价为 0.0008 元 / 千 Tokens,处理 1500 多个汉字仅需 0.8 厘,比行业低 99%,TPM 限额为同规格模型的 2.7 倍到 8 倍,大幅降低企业接入门槛。 (二)豆包 AI 智能助手       豆包 AI 智能助手是基于豆包大模型开发的全场景应用载体,采用 “智能助手 + 场景化工具” 模式,覆盖日常生活、学习、办公等个人场景,同时通过火山引擎向企业客户开放 API 接口,实现商业化落地。 多端覆盖:支持网页版、iOS 版、安卓版、Windows 桌面版、macOS 桌面版及浏览器插件,可通过手机号码、抖音账号、苹果账号登录,实现跨设备同步使用。 核心功能矩阵: 对话问答:支持复杂问题解答、多轮对话及专业领域咨询(法律、医疗、技术等),中文理解准确率达 96%; 内容创作:涵盖文本生成(文章、报告、邮件等)、图像生成与编辑(基于 SeedEdit 模型)、音乐生成(11 种风格可选)、视频生成(基于 PixelDance、Seaweed 模型); 学习辅导:覆盖 K12 至高等教育,提供解题答疑、语言学习(中英日韩等 119 种语言)、考试策略指导; 办公辅助:支持 AI 划词、网页总结、脑图生成、会议纪要快速整理(2 小时会议纪要 5 分钟搞定)、PPT 生成等功能; 开发辅助:代码补全、调试建议、算法解释及技术文档生成,集成 MarsCode 编程助手能力; 交互升级:支持语音输入、语音通话、实时视频通话,基于端到端语音大模型,交互流畅度接近真人,平均响应延迟控制在 800 毫秒以内。   三、发展历程(官方公开) 2016 年:字节跳动成立人工智能实验室(AI Lab),聚焦自然语言处理、机器学习、数据挖掘等领域研究,为豆包的研发奠定技术基础; 2023 年 6 月:字节跳动内部测试 AI 对话类产品 “Grace”,处于完善优化阶段; 2023 年 8 月:“Grace” 新版本更名为 “豆包”,启动小范围邀请测试,支持多账号登录,具备基础文本生成与语音播报功能; 2024 年 5 月 15 日:在火山引擎 Force 原动力大会上,豆包大模型正式发布,豆包 APP 总下载量突破 1 亿次,大模型开启商业化进程; 2024 年 6 月 3 日:豆包推出 Windows/macOS 桌面客户端,新增快捷启动、AI 划词、AI 搜索功能; 2024 年 8 月 - 11 月:陆续上线音乐生成、脑图生成、语音输入、图片上传、视频生成内测等功能,10 月推出首款 AI 智能体耳机 Ola Friend,11 月底豆包 APP 累计用户规模超 1.6 亿; 2025 年 1 月 - 3 月:发布端到端语音大模型,升级实时语音通话功能;开源 SuperGPQA 知识推理基准测试;抖音 APP 测试接入豆包 AI 能力,开放两大超级入口;测试新版 “深度思考” 功能; 2025 年 4 月 - 12 月:深度思考和文生图 3.0 模型通过火山引擎开放 API;上线实时视频通话功能;发布豆包大模型 1.8,在视觉推理等任务中表现突出;12 月豆包日均活跃用户(DAU)突破 1 亿大关,月活跃用户达 1.5742 亿,居中国 AI 应用产品首位; 2026 年 2 月 14 日:豆包大模型 2.0 正式发布,围绕大规模生产环境使用需求做系统性优化;同期上线视频生成模型 Seedance 2.0。 四、应用场景与市场表现 (一)应用场景 个人场景:日常对话、内容创作(文案、小说、歌词等)、学习辅导(解题、语言学习)、办公效率提升(会议纪要、文档处理)、娱乐生成(音乐、视频、图像)等; 企业场景:通过火山引擎向企业客户开放服务,应用于智能客服、自动化文档处理、风险预测、医疗影像分析、司法文书生成、制造业流程优化等领域,已在字节跳动内部 50 多个业务场景应用验证; 特色场景:与故宫博物院合作开发 “文物解说官”;为比亚迪等企业提供车辆故障诊断等智能服务;在全国 15 个法院部署,辅助法官处理案例检索等工作。 (二)市场表现 用户规模:截至 2024 年 11 月底,豆包 APP 累计用户超 1.6 亿;2025 年 3 月底,豆包大模型日均调用量达 12.7 万亿次;2025 年 8 月,月活跃用户达 1.5742 亿,居中国 AI 应用产品首位;2025 年 12 月,豆包日均活跃用户(DAU)突破 1 亿大关,成为国内首个 DAU 破亿的 AI 原生应用,累计服务用户超 3 亿,覆盖全球 100 多个国家和地区。 商业成果:截至 2025 年底,豆包大模型已服务超 10 万家企业客户,覆盖互联网、金融、医疗、教育、制造等 20 多个行业,企业客户复购率达 85% 以上;2026 年第一季度,豆包相关业务营收同比增长 300%,成为字节跳动新兴业务增长核心引擎之一。 行业认可:多次通过国内权威 AI 评测,在中文理解、数学推理、代码生成等维度稳居行业前列;先后获得 “2024 年度最佳 AI 产品”“中国人工智能创新应用标杆” 等多项行业奖项;豆包大模型通过国家网络安全等级保护三级认证,算法及数据安全符合《生成式人工智能服务管理暂行办法》要求,相关技术专利累计申请超 2000 项。
AI / AI助手 / AI大模型 / 豆包
OpenClaw

OpenClaw

百科
OpenClaw(社区昵称「龙虾」),是 2026 年全球现象级本地优先、自托管、开源 AI 智能体执行框架,核心定位「让 AI 真正拥有双手、自主完成任务」,区别于传统仅对话的 AI 助手,主打私有化部署、多渠道接入、模型无关、持久记忆与系统级执行能力。截至 2026 年 4 月 5 日,GitHub 星标28.2 万、Fork 3.4 万、贡献者 920+、全球独立部署实例超 110 万、技能市场 5200 + 技能包,是当前最主流的开源 Agent 平台之一。 一、基础信息 全称:OpenClaw 曾用名:ClawdBot → Moltbot(2026 年 1 月因 Anthropic 商标异议更名,1 月 30 日最终定名 OpenClaw) 开发者:Peter Steinberger(奥地利连续创业者,PSPDFKit 创始人,2025 年 6 月创立 Amantus Machina 公司主导研发) 开源协议:MIT License(完全开源、可商用、可二次分发) 核心语言:TypeScript,基于 Node.js 构建,跨平台兼容 官方站点:getopenclaw.ai(英文)、openclaaw.cn(中文社区) 核心定位:本地优先的 AI 执行中枢,连接大模型与本地系统 / 工具 / 平台,实现「自然语言指令→任务拆解→自主执行→结果反馈」闭环 二、发展历程(2025.11—2026.4,权威时间线) 2025.11 项目启动:Peter Steinberger 以个人实验启动,核心脚本打通 WhatsApp 与 CloudCode CLI,实现 AI 本地执行雏形 2025.12.28:首次公开 Clawd 项目代码,发布基础配置与演示 2026.1.5:GitHub 上线,定名ClawdBot,快速引发极客圈关注 2026.1.20:因 Anthropic 商标争议,更名Moltbot;「自主买车、代码迁移、深度调研」等演示视频病毒传播,星标破 10 万 2026.1.30:正式定名OpenClaw,发布 v1.0 稳定版,确立开源 + 本地优先路线 2026.2:v2026.2.6 发布,新增 Unbrowse 浏览器自动化、技能市场、Workflow 录制回放;支持 Ollama 本地模型、Home Assistant 集成;GitHub 星标破 20 万getopenclaw.ai 2026.3.24:v2026.3.24(里程碑版),重构网关认证、OpenAI 兼容接口、可视化技能管理、企业级协作能力;支持飞书、钉钉、QQ 原生接入;星标破 25 万 2026.4.2:v2026.4.2(最新稳定版),安全加固、统一网关认证、多端语音唤醒、Slack/Teams 交互优化、群聊回声抑制;全球部署实例破百万 三、核心技术架构(权威分层设计) OpenClaw 采用Gateway 中心化星形架构,解耦接入、控制、推理、执行、存储五层,默认本地闭环、不主动暴露公网,保障隐私安全: 接入层(Channel Adapters):统一适配 20 + 主流 IM / 协作平台,无需专属客户端,直接在常用 App 交互: 海外:WhatsApp、Telegram、Discord、Slack、Signal、Microsoft Teams、iMessage 国内:微信、QQ、钉钉、飞书、企业微信(2026.3 原生支持)   控制层(Gateway,核心中枢):常驻守护进程(默认 ws://127.0.0.1:18789),负责会话管理、权限控制、多智能体调度、状态持久化、请求路由,所有指令 / 结果必经网关,保证一致性 推理层(Agent Runtime):模型无关的执行大脑,不内置 LLM,支持云端 / 本地双模式: 云端:OpenAI GPT-4o/5、Anthropic Claude 3.5/4、Google Gemini、Kimi、通义千问、MiniMax 等 本地:Ollama、LM Studio、LocalAI(Llama 3、Qwen、Mistral 等) 范式:Observe-Plan-Act(观察 - 规划 - 行动)循环,支持子智能体协同、工具链编排、长上下文记忆   执行层(Tools/Skills):沙箱化执行引擎,内置 500 + 原生技能,支持自定义开发 / 技能市场安装: 系统操作:文件读写、终端命令、代码执行、截图 OCR、屏幕控制 自动化:浏览器(Unbrowse)、邮件、日历、CRM、Home Assistant、API 调用 工作流:定时任务、条件触发、录制回放、批量处理   存储层(Local Persistence):本地 SQLite/PostgreSQL,持久化记忆、任务状态、配置、技能数据,用户完全掌控数据,无云端上传默认行为 四、核心功能(2026.4 最新版) 1. 本地优先与私有化部署 支持 Windows、macOS、Linux、Docker、云服务器(阿里云 / 腾讯云 / DO 一键部署)、小主机(J1900 等) 数据全本地存储、流量闭环、可断网运行;支持端到端加密、访问令牌、IP 白名单、操作审计 2. 多渠道原生接入 单 Gateway 统一管理所有 IM 账号,一次配置、全平台同步;支持群聊 / 私聊、@提及、命令触发、按钮交互 2026.4 新增:语音唤醒(macOS VoiceWake)、Google Assistant/App Actions(Android)、LINE 富媒体发送、QQ 群聊优化36氪 3. 模型无关与灵活切换 支持多模型同时配置、按任务自动 / 手动切换;兼容 OpenAI API 标准,可对接 OpenRouter 等聚合平台 本地模型低延迟、无 API 成本、隐私更强,适合敏感任务 4. 持久记忆与上下文感知 跨会话、跨重启保留用户偏好、任务进度、历史交互;支持长上下文压缩、记忆检索、知识库 RAG 集成 主动通知:定时简报、日历提醒、任务状态推送、自定义告警(Cron 式心跳) 5. 自主执行与技能生态 无需代码,自然语言驱动复杂任务(如「整理本周邮件、生成周报、发送到钉钉」) 技能市场(Claw Hub):5200 + 社区 / 官方技能,一键安装、可视化配置、依赖自动检测 2026.3 新增:子智能体协同、OpenAI 兼容接口(/v1/chat/completions、/v1/embeddings)、RAG 原生支持 6. 安全与企业级能力 网关认证统一:Trusted-Proxy、令牌强制、同主机访问显式授权,杜绝隐式信任 操作审批、权限分级、日志审计、数据导出 / 擦除;支持企业 LDAP、SSO、私有部署集群(2026.4 企业版预览)36氪 五、生态与社区现状(2026.4 权威数据) GitHub:Star 282,000+、Fork 34,000+、Issues 2,100+、Pull Requests 1,800+、贡献者 920+ 部署规模:全球独立实例 110 万 +,国内占比 38%(微信 / 钉钉 / 飞书驱动) 技能生态:Claw Hub 5,200 + 技能,覆盖开发、办公、自动化、智能家居、数据分析、跨境运营 社区:Discord 8 万 + 成员、中文社区(微信 / QQ)5 万 +、官方文档多语言(含简体中文)、第三方教程 / 部署工具 / 镜像丰富 商业支持:Amantus Machina 提供企业版(集群、SLA、定制开发);国内云厂商(阿里云、腾讯云、火山引擎)提供一键部署与托管服务 六、典型应用场景 个人生产力:邮件 / 日历管理、文件整理、代码编写 / 调试、周报自动生成、浏览器自动化、信息检索汇总 开发者工具:API 调试、GitHub Issues 管理、CI/CD 触发、服务器监控、日志分析、代码迁移 中小企业 / 团队:飞书 / 钉钉群助手、客户消息自动回复、报表生成、流程自动化、内部知识库问答 私有化 / 合规场景:政务、金融、医疗等敏感数据处理,本地部署、数据不出域(如深圳福田「政务龙虾」落地) 极客 / 硬件玩家:小主机 / NAS 部署、智能家居控制、本地模型集成、自定义技能开发 七、优势与局限 核心优势 开源免费:MIT 协议,无订阅、无 API 锁、可商用二次开发 本地可控:数据隐私、断网可用、低延迟、无云端成本 接入无感:直接用现有 IM,无需新 App,学习成本极低 生态繁荣:技能丰富、社区活跃、更新迭代快(周更) 模型自由:不绑定单一 LLM,云端 / 本地灵活组合 主要局限 技术门槛:部署 / 配置需基础命令行 / 网络知识,普通用户有学习成本 执行边界:复杂系统操作、跨设备协同、图形化界面交互仍有局限 模型依赖:核心推理能力取决于接入的 LLM 质量,本地模型效果弱于云端旗舰 安全风险:本地执行权限过高,需严格配置权限与沙箱,避免误操作 / 恶意指令 八、未来规划(官方 Roadmap 2026) 2026 Q2:v2026.5 稳定版,强化多智能体编排、可视化 Workflow 编辑器、移动端原生 App、企业级集群部署 2026 H2:开放 Agent Marketplace 付费分成、硬件适配(边缘设备、嵌入式)、多模态(视频 / 语音深度集成)、行业垂直模板(跨境、电商、教育) 长期:构建开源 Agent 标准、跨平台统一执行层、去中心化技能分发网络
AI / AI Agent / AI助手 / OpenClaw
Stable Diffusion

Stable Diffusion

百科
      Stable Diffusion(简称 SD)是由Stability AI主导开发、基于潜扩散模型(Latent Diffusion Model)的开源多模态 AI 图像生成工具,核心定位为「人人可用的普惠型 AI 创作引擎」,以文生图、图生图为核心,支持本地部署、参数定制与生态扩展,覆盖艺术创作、商业设计、科研教育等全场景,是全球最具影响力、应用最广泛的开源 AI 绘画模型之一,彻底降低了 AI 图像生成的技术门槛与使用成本。 一、基础权威信息 官方全称:Stable Diffusion 开发主体:Stability AI(英国人工智能公司),联合慕尼黑路德维希・马克西米利安大学 CompVis 小组、Runway ML 共同研发,核心技术团队由 AI 领域顶尖研究者组成 上线时间:2022 年 8 月 22 日正式发布首个版本;2023 年 6 月推出 SDXL 0.9 版本,2024 年 2 月发布 Stable Diffusion 3 早期预览版,2024 年 10 月推出 Stable Diffusion 3.5 系列及 Medium 版本 核心定位:开源免费、可本地运行、高度可定制,让普通用户与专业创作者都能快速生成高质量图像,推动 AI 创作平民化 官方入口:开源仓库(GitHub)、Stability AI 官网(stability.ai);第三方衍生工具(WebUI、ComfyUI、Fooocus 等);支持本地部署(Windows/macOS/Linux)、云服务调用 核心特性:开源免费(非商用 / 商用均可,遵循 Stability AI 社区许可证)、本地运行、参数可控、生态完善、轻量高效(支持消费级显卡运行) 权威认证:多次入选全球 AI 创新技术榜单,被苹果官方支持(优化 Apple Silicon 芯片运行性能),成为 AI 绘画领域开源标杆工具 二、核心技术架构(开源官方口径)       Stable Diffusion 的核心优势在于创新的潜扩散架构,将图像生成过程压缩到潜在空间完成,大幅降低计算复杂度,实现消费级硬件可运行,其技术架构主要包括 4 大核心模块: 底层基座:基于扩散模型(Diffusion Model),融合 Transformer 架构,通过 “反向去噪” 过程从纯噪声中逐步生成清晰图像,核心是潜空间映射技术,平衡生成质量与计算效率。 核心组件:由文本编码器(CLIP Text Encoder,负责解析提示词)、扩散模型(UNet,核心去噪模块)、图像解码器(VAE,将潜空间特征还原为可视图像)三部分组成,三者协同实现 “文本→潜空间特征→图像” 的完整生成链路。 关键优化技术:支持对抗性扩散蒸馏(如 SDXL Turbo 版本,将生成迭代步骤从 50 步缩减至 1 步)、深度引导(Depth 模型)、文本引导修复等,同时优化多语言提示词理解,适配中文等多语种场景。 扩展性架构:采用模块化设计,支持 LoRA、ControlNet 等插件扩展,允许用户微调模型、定制风格,同时兼容不同前端工具(WebUI、ComfyUI 等),形成灵活的创作工作流。 三、核心功能模块(开源完整版) 1. 核心生成功能(基础能力) 文生图(Text-to-Image):通过正向提示词(描述想要的内容)和反向提示词(排除不想要的内容)生成图像,支持 20 + 主流风格(写实、二次元、国风、赛博朋克、油画等),可调节采样方法、采样步数、图像尺寸、CFG Scale 等参数,生成分辨率最高支持 4K,单次生成时间根据硬件配置可控制在几秒到几十秒不等,提示词可通过权重调节(括号语法)精准控制元素呈现效果。 图生图(Image-to-Image):上传参考图,通过调整去噪强度实现风格迁移、画面重构、瑕疵修复、画面拓展等功能;去噪强度 0.1-0.3 可轻微优化图像,0.4-0.6 可实现风格迁移,0.7-1.0 可彻底重构画面(仅保留原图轮廓或色彩),适配草图转稿、照片优化等场景。 高清修复(Upscale):内置多种放大算法(Latent、ESRGAN 等),可将低分辨率图像放大 4 倍以上,同时补充细节,解决生成图像模糊、细节不足的问题,部分衍生工具支持批量高清修复。 局部重绘(Inpaint):精准选中图像局部区域,通过提示词修改该区域内容,实现局部优化、杂物去除、元素替换等,适配图像精细化调整场景,是商业设计中常用的核心功能之一。 2. 进阶控制功能(扩展能力) LoRA 微调(Low-Rank Adaptation):轻量级模型微调技术,文件体积小(50-300MB),可快速定制特定风格、角色或元素(如宫崎骏风格、特定 IP 形象),无需复杂训练,通过触发词即可激活对应风格,可与主模型叠加使用,兼容性极强。 ControlNet 插件:核心用于精准控制图像构图、姿态、边缘、深度等,解决 AI 生成图像 “构图混乱、姿态畸形” 的痛点,支持骨骼姿态控制、线稿控制、深度控制等,适配专业设计、角色创作等场景,大幅提升生成可控性。 其他扩展功能:支持图生视频(结合 AnimateDiff 插件)、文本嵌入(Embedding)、IPAdapter(参考图风格 / 身份迁移)、批量生成、种子控制(固定种子可复现相同结果)等,满足不同用户的进阶创作需求。 3. 生态与工具支持 开源社区:拥有全球庞大的开源社区,用户可自由分享模型、LoRA、提示词、工作流,核心模型与插件均开源可下载,社区持续迭代优化功能,解决使用中的常见问题(如人物畸形、画面模糊等)。 前端工具:主流衍生工具包括 WebUI(新手友好,操作直观)、ComfyUI(专业级,支持复杂工作流定制)、Fooocus(极简操作,一键出图),适配不同用户群体(新手、专业创作者),无需复杂代码基础即可使用。 模型资源:官方及社区推出大量细分模型(Checkpoint),如 SD 1.5(轻量兼容)、SDXL(高清写实)、Anything V5(二次元)、DreamShaper(通用写实)等,用户可根据创作需求选择对应模型,模型可从 Civitai、HuggingFace、ModelScope 等平台下载。 四、核心权威优势 开源普惠:完全开源免费,非商用、商用均可使用(遵循社区许可证),无使用门槛与版权限制,区别于 Midjourney 等付费工具,让普通用户也能接触 AI 创作,推动 AI 绘画普及化。 本地运行:支持消费级显卡(NVIDIA、AMD)本地部署,无需依赖网络,既保护用户创作隐私,又不受平台服务器限制,可根据自身硬件配置优化生成速度与质量,适配隐私性要求高的场景(如商业设计、科研创作)。 高度可定制:从参数调节、模型微调(LoRA)、插件扩展到工作流定制,全方位支持用户个性化创作,可适配不同风格、不同场景的创作需求,既能满足新手一键出图,也能满足专业创作者的精细化设计需求,灵活性远超同类工具。 生态完善:全球庞大的开源社区与丰富的模型、插件资源,持续迭代优化,用户可快速获取教程、素材与解决方案,同时第三方工具适配完善,形成 “模型 - 工具 - 社区” 的完整生态,降低学习与使用成本,推动功能持续升级。 轻量高效:得益于潜扩散架构,计算复杂度低,可在普通消费级显卡上流畅运行,生成速度快,同时支持批量生成、高清修复等高效功能,大幅提升创作效率,适配商业设计、批量素材生产等场景。 五、核心应用场景 艺术创作:数字绘画、插画创作、概念艺术设计、风格化作品生成、艺术风格迁移,帮助艺术家拓展创意思路,快速生成草图与成品,提升创作效率,适配插画师、设计师、艺术爱好者等群体。 商业设计:电商商品图、海报、宣传册、LOGO 辅助设计、UI 界面草图、广告素材生成,无需专业设计基础,即可快速产出商用级素材,降低中小企业与个人创作者的设计成本,适配电商运营、中小企业、广告从业者等。 科研与教育:AI 图像生成技术研究、计算机视觉相关教学演示、学生作业(数字绘画、设计类)、创意教学辅助,帮助科研人员开展技术研究,助力学生快速掌握 AI 创作技巧。 个人与自媒体:自媒体配图、短视频封面、头像生成、生活照片优化、创意恶搞图像,适配自媒体博主、普通用户的日常创作需求,零门槛即可产出个性化内容。 影视与游戏:影视分镜草图、游戏角色 / 场景概念设计、游戏贴图生成,辅助影视、游戏创作团队快速产出创意方案,缩短创作周期,适配影视从业者、游戏设计师等。 六、权威发展历程(关键节点) 2022.08.22:Stable Diffusion 1.0 正式发布,基于潜扩散架构,支持消费级显卡本地部署,开源免费,迅速引爆 AI 绘画领域,成为开源 AI 绘画标杆。 2022.11:Stable Diffusion 1.5 版本发布,优化图像生成质量、人物细节与提示词遵循度,修复常见 bug,成为最经典、最常用的基础版本,至今仍被广泛使用。 2023.06:Stable Diffusion XL(SDXL)0.9 版本发布,原生支持 1024×1024 高清分辨率,优化写实风格生成,新增文本理解能力,大幅提升生成图像的细节与质感。 2023.11:SDXL 1.0 正式发布,完善高清生成能力,支持 2K + 分辨率,优化多风格适配,成为商业设计、高清创作的首选版本,同时推出 SDXL Turbo(1 步生成,极速出图)。 2024.02:Stable Diffusion 3 早期预览版发布,采用全新架构,优化多模态输入(文本、图像),提升提示词理解精度与生成可控性,支持更复杂的场景与细节生成。 2024.10:Stable Diffusion 3.5 系列及 Medium 版本发布,进一步优化生成速度与质量,完善中文提示词理解,新增更多细分风格模型,适配更多创作场景,同时拓展模型轻量化部署能力。 2025 至今:持续迭代模型轻量化、多模态融合(图生视频、文生 3D)能力,优化开源生态,推出更多行业定制化模型(如医疗、建筑设计专用模型),扩大应用场景。 七、开源许可与合规说明 开源许可:Stable Diffusion 核心模型遵循 Stability AI 社区许可证(OpenRAIL-M),非商用、商用均可免费使用,但禁止用于违法违规、侵权、低俗色情、危害国家安全等场景;衍生模型、插件需遵循对应开源许可,部分社区模型可能有商用限制,使用前需确认许可条款。 版权边界:用户使用 Stable Diffusion 生成的内容,版权归用户所有(前提是不侵犯他人知识产权);禁止使用模型生成侵犯他人肖像权、著作权、商标权的内容(如生成名人肖像、抄袭他人作品)。 数据安全:本地部署版本不涉及数据上传,可保护用户创作隐私;使用第三方 Web 端衍生工具时,需注意平台的数据收集政策,避免敏感内容泄露。 技术边界:模型生成内容可能存在一定瑕疵(如人物畸形、细节错乱),需用户进行后期优化;不支持生成违法违规、血腥恐怖、低俗色情等内容,开源社区与官方均有相关过滤机制。
AI / SD / Stable Diffusion / 图生图 / 文生图 / 本地部署 AI / 生图AI
豆包(AI助手)

豆包(AI助手)

百科
      豆包是字节跳动公司自主研发的综合性人工智能产品矩阵,核心包含豆包大模型(原名 “云雀”)与豆包 AI 智能助手两大核心板块,依托字节跳动自研技术基座,覆盖个人消费级与企业级全场景,是国内首批通过算法备案的 AI 产品之一,也是国内使用量最大、应用场景最丰富的 AI 产品矩阵之一。 一、基本信息 官方名称:豆包(Doubao) 开发主体:字节跳动科技(北京)有限公司 核心定位:多模态 AI 基础设施(豆包大模型)+ 全场景 AI 智能助手(豆包 AI 助手),兼顾个人用户与企业客户需求 技术基底:基于 Transformer 架构的混合专家(MoE)大语言模型,核心为字节跳动自研的 “云雀”(Skylark)大模型,无外部开源模型或第三方技术依赖 官方渠道:官网(www.doubao.com)、全平台客户端(iOS/Android/Windows/macOS)、网页版及浏览器插件 核心特性:中文优化能力突出、多模态融合、低时延响应、高性价比,支持跨平台同步使用 二、核心构成与技术体系 (一)豆包大模型       豆包大模型是字节跳动自研的多模态大模型家族,原名 “云雀”,定位为 AI 基础设施,支撑全场景 AI 能力落地,于 2024 年 5 月 15 日在 “2024 春季火山引擎 Force 原动力大会” 上正式发布,后续持续迭代升级,形成了覆盖通用与细分领域的完整模型矩阵。 模型家族构成:包含 2 个通用模型(豆包通用模型 Pro、豆包通用模型 Lite)与 7 个细分领域模型(角色扮演模型、语音识别模型、语音合成模型、声音复刻模型、文生图模型、Function Call 模型、向量化模型),共计 9 个核心模型,可满足不同场景的差异化需求。 技术特点:采用大规模稀疏 MoE 架构,等效 7 倍激活参数的 Dense 模型性能,训练成本降低 90%;具备动态注意力机制,支持 32K 上下文窗口(可扩展至百万级 token),长文本处理能力突出;实现端到端语音处理,支持低时延对话、情绪承接与方言理解;集成多模态融合技术,可高效处理文本、图像、音频、视频等多类型输入输出。 核心能力:覆盖自然语言理解与生成、代码创作(支持 30 + 编程语言,准确率达 95%)、数学推理(可解决 AIME 级别证明,GSM8K 测试表现超越 GPT-4)、语音处理、图像生成与分析、复杂任务自动化等,适用于企业级服务、科研、教育及工业等多领域。 商业化定价:主力模型在企业市场定价为 0.0008 元 / 千 Tokens,处理 1500 多个汉字仅需 0.8 厘,比行业低 99%,TPM 限额为同规格模型的 2.7 倍到 8 倍,大幅降低企业接入门槛。 (二)豆包 AI 智能助手       豆包 AI 智能助手是基于豆包大模型开发的全场景应用载体,采用 “智能助手 + 场景化工具” 模式,覆盖日常生活、学习、办公等个人场景,同时通过火山引擎向企业客户开放 API 接口,实现商业化落地。 多端覆盖:支持网页版、iOS 版、安卓版、Windows 桌面版、macOS 桌面版及浏览器插件,可通过手机号码、抖音账号、苹果账号登录,实现跨设备同步使用。 核心功能矩阵: 对话问答:支持复杂问题解答、多轮对话及专业领域咨询(法律、医疗、技术等),中文理解准确率达 96%; 内容创作:涵盖文本生成(文章、报告、邮件等)、图像生成与编辑(基于 SeedEdit 模型)、音乐生成(11 种风格可选)、视频生成(基于 PixelDance、Seaweed 模型); 学习辅导:覆盖 K12 至高等教育,提供解题答疑、语言学习(中英日韩等 119 种语言)、考试策略指导; 办公辅助:支持 AI 划词、网页总结、脑图生成、会议纪要快速整理(2 小时会议纪要 5 分钟搞定)、PPT 生成等功能; 开发辅助:代码补全、调试建议、算法解释及技术文档生成,集成 MarsCode 编程助手能力; 交互升级:支持语音输入、语音通话、实时视频通话,基于端到端语音大模型,交互流畅度接近真人,平均响应延迟控制在 800 毫秒以内。   三、发展历程(官方公开) 2016 年:字节跳动成立人工智能实验室(AI Lab),聚焦自然语言处理、机器学习、数据挖掘等领域研究,为豆包的研发奠定技术基础; 2023 年 6 月:字节跳动内部测试 AI 对话类产品 “Grace”,处于完善优化阶段; 2023 年 8 月:“Grace” 新版本更名为 “豆包”,启动小范围邀请测试,支持多账号登录,具备基础文本生成与语音播报功能; 2024 年 5 月 15 日:在火山引擎 Force 原动力大会上,豆包大模型正式发布,豆包 APP 总下载量突破 1 亿次,大模型开启商业化进程; 2024 年 6 月 3 日:豆包推出 Windows/macOS 桌面客户端,新增快捷启动、AI 划词、AI 搜索功能; 2024 年 8 月 - 11 月:陆续上线音乐生成、脑图生成、语音输入、图片上传、视频生成内测等功能,10 月推出首款 AI 智能体耳机 Ola Friend,11 月底豆包 APP 累计用户规模超 1.6 亿; 2025 年 1 月 - 3 月:发布端到端语音大模型,升级实时语音通话功能;开源 SuperGPQA 知识推理基准测试;抖音 APP 测试接入豆包 AI 能力,开放两大超级入口;测试新版 “深度思考” 功能; 2025 年 4 月 - 12 月:深度思考和文生图 3.0 模型通过火山引擎开放 API;上线实时视频通话功能;发布豆包大模型 1.8,在视觉推理等任务中表现突出;12 月豆包日均活跃用户(DAU)突破 1 亿大关,月活跃用户达 1.5742 亿,居中国 AI 应用产品首位; 2026 年 2 月 14 日:豆包大模型 2.0 正式发布,围绕大规模生产环境使用需求做系统性优化;同期上线视频生成模型 Seedance 2.0。 四、应用场景与市场表现 (一)应用场景 个人场景:日常对话、内容创作(文案、小说、歌词等)、学习辅导(解题、语言学习)、办公效率提升(会议纪要、文档处理)、娱乐生成(音乐、视频、图像)等; 企业场景:通过火山引擎向企业客户开放服务,应用于智能客服、自动化文档处理、风险预测、医疗影像分析、司法文书生成、制造业流程优化等领域,已在字节跳动内部 50 多个业务场景应用验证; 特色场景:与故宫博物院合作开发 “文物解说官”;为比亚迪等企业提供车辆故障诊断等智能服务;在全国 15 个法院部署,辅助法官处理案例检索等工作。 (二)市场表现 用户规模:截至 2024 年 11 月底,豆包 APP 累计用户超 1.6 亿;2025 年 3 月底,豆包大模型日均调用量达 12.7 万亿次;2025 年 8 月,月活跃用户达 1.5742 亿,居中国 AI 应用产品首位;2025 年 12 月,豆包日均活跃用户(DAU)突破 1 亿大关,成为国内首个 DAU 破亿的 AI 原生应用,累计服务用户超 3 亿,覆盖全球 100 多个国家和地区。 商业成果:截至 2025 年底,豆包大模型已服务超 10 万家企业客户,覆盖互联网、金融、医疗、教育、制造等 20 多个行业,企业客户复购率达 85% 以上;2026 年第一季度,豆包相关业务营收同比增长 300%,成为字节跳动新兴业务增长核心引擎之一。 行业认可:多次通过国内权威 AI 评测,在中文理解、数学推理、代码生成等维度稳居行业前列;先后获得 “2024 年度最佳 AI 产品”“中国人工智能创新应用标杆” 等多项行业奖项;豆包大模型通过国家网络安全等级保护三级认证,算法及数据安全符合《生成式人工智能服务管理暂行办法》要求,相关技术专利累计申请超 2000 项。
AI / AI助手 / AI大模型 / 豆包
OpenClaw

OpenClaw

百科
OpenClaw(社区昵称「龙虾」),是 2026 年全球现象级本地优先、自托管、开源 AI 智能体执行框架,核心定位「让 AI 真正拥有双手、自主完成任务」,区别于传统仅对话的 AI 助手,主打私有化部署、多渠道接入、模型无关、持久记忆与系统级执行能力。截至 2026 年 4 月 5 日,GitHub 星标28.2 万、Fork 3.4 万、贡献者 920+、全球独立部署实例超 110 万、技能市场 5200 + 技能包,是当前最主流的开源 Agent 平台之一。 一、基础信息 全称:OpenClaw 曾用名:ClawdBot → Moltbot(2026 年 1 月因 Anthropic 商标异议更名,1 月 30 日最终定名 OpenClaw) 开发者:Peter Steinberger(奥地利连续创业者,PSPDFKit 创始人,2025 年 6 月创立 Amantus Machina 公司主导研发) 开源协议:MIT License(完全开源、可商用、可二次分发) 核心语言:TypeScript,基于 Node.js 构建,跨平台兼容 官方站点:getopenclaw.ai(英文)、openclaaw.cn(中文社区) 核心定位:本地优先的 AI 执行中枢,连接大模型与本地系统 / 工具 / 平台,实现「自然语言指令→任务拆解→自主执行→结果反馈」闭环 二、发展历程(2025.11—2026.4,权威时间线) 2025.11 项目启动:Peter Steinberger 以个人实验启动,核心脚本打通 WhatsApp 与 CloudCode CLI,实现 AI 本地执行雏形 2025.12.28:首次公开 Clawd 项目代码,发布基础配置与演示 2026.1.5:GitHub 上线,定名ClawdBot,快速引发极客圈关注 2026.1.20:因 Anthropic 商标争议,更名Moltbot;「自主买车、代码迁移、深度调研」等演示视频病毒传播,星标破 10 万 2026.1.30:正式定名OpenClaw,发布 v1.0 稳定版,确立开源 + 本地优先路线 2026.2:v2026.2.6 发布,新增 Unbrowse 浏览器自动化、技能市场、Workflow 录制回放;支持 Ollama 本地模型、Home Assistant 集成;GitHub 星标破 20 万getopenclaw.ai 2026.3.24:v2026.3.24(里程碑版),重构网关认证、OpenAI 兼容接口、可视化技能管理、企业级协作能力;支持飞书、钉钉、QQ 原生接入;星标破 25 万 2026.4.2:v2026.4.2(最新稳定版),安全加固、统一网关认证、多端语音唤醒、Slack/Teams 交互优化、群聊回声抑制;全球部署实例破百万 三、核心技术架构(权威分层设计) OpenClaw 采用Gateway 中心化星形架构,解耦接入、控制、推理、执行、存储五层,默认本地闭环、不主动暴露公网,保障隐私安全: 接入层(Channel Adapters):统一适配 20 + 主流 IM / 协作平台,无需专属客户端,直接在常用 App 交互: 海外:WhatsApp、Telegram、Discord、Slack、Signal、Microsoft Teams、iMessage 国内:微信、QQ、钉钉、飞书、企业微信(2026.3 原生支持)   控制层(Gateway,核心中枢):常驻守护进程(默认 ws://127.0.0.1:18789),负责会话管理、权限控制、多智能体调度、状态持久化、请求路由,所有指令 / 结果必经网关,保证一致性 推理层(Agent Runtime):模型无关的执行大脑,不内置 LLM,支持云端 / 本地双模式: 云端:OpenAI GPT-4o/5、Anthropic Claude 3.5/4、Google Gemini、Kimi、通义千问、MiniMax 等 本地:Ollama、LM Studio、LocalAI(Llama 3、Qwen、Mistral 等) 范式:Observe-Plan-Act(观察 - 规划 - 行动)循环,支持子智能体协同、工具链编排、长上下文记忆   执行层(Tools/Skills):沙箱化执行引擎,内置 500 + 原生技能,支持自定义开发 / 技能市场安装: 系统操作:文件读写、终端命令、代码执行、截图 OCR、屏幕控制 自动化:浏览器(Unbrowse)、邮件、日历、CRM、Home Assistant、API 调用 工作流:定时任务、条件触发、录制回放、批量处理   存储层(Local Persistence):本地 SQLite/PostgreSQL,持久化记忆、任务状态、配置、技能数据,用户完全掌控数据,无云端上传默认行为 四、核心功能(2026.4 最新版) 1. 本地优先与私有化部署 支持 Windows、macOS、Linux、Docker、云服务器(阿里云 / 腾讯云 / DO 一键部署)、小主机(J1900 等) 数据全本地存储、流量闭环、可断网运行;支持端到端加密、访问令牌、IP 白名单、操作审计 2. 多渠道原生接入 单 Gateway 统一管理所有 IM 账号,一次配置、全平台同步;支持群聊 / 私聊、@提及、命令触发、按钮交互 2026.4 新增:语音唤醒(macOS VoiceWake)、Google Assistant/App Actions(Android)、LINE 富媒体发送、QQ 群聊优化36氪 3. 模型无关与灵活切换 支持多模型同时配置、按任务自动 / 手动切换;兼容 OpenAI API 标准,可对接 OpenRouter 等聚合平台 本地模型低延迟、无 API 成本、隐私更强,适合敏感任务 4. 持久记忆与上下文感知 跨会话、跨重启保留用户偏好、任务进度、历史交互;支持长上下文压缩、记忆检索、知识库 RAG 集成 主动通知:定时简报、日历提醒、任务状态推送、自定义告警(Cron 式心跳) 5. 自主执行与技能生态 无需代码,自然语言驱动复杂任务(如「整理本周邮件、生成周报、发送到钉钉」) 技能市场(Claw Hub):5200 + 社区 / 官方技能,一键安装、可视化配置、依赖自动检测 2026.3 新增:子智能体协同、OpenAI 兼容接口(/v1/chat/completions、/v1/embeddings)、RAG 原生支持 6. 安全与企业级能力 网关认证统一:Trusted-Proxy、令牌强制、同主机访问显式授权,杜绝隐式信任 操作审批、权限分级、日志审计、数据导出 / 擦除;支持企业 LDAP、SSO、私有部署集群(2026.4 企业版预览)36氪 五、生态与社区现状(2026.4 权威数据) GitHub:Star 282,000+、Fork 34,000+、Issues 2,100+、Pull Requests 1,800+、贡献者 920+ 部署规模:全球独立实例 110 万 +,国内占比 38%(微信 / 钉钉 / 飞书驱动) 技能生态:Claw Hub 5,200 + 技能,覆盖开发、办公、自动化、智能家居、数据分析、跨境运营 社区:Discord 8 万 + 成员、中文社区(微信 / QQ)5 万 +、官方文档多语言(含简体中文)、第三方教程 / 部署工具 / 镜像丰富 商业支持:Amantus Machina 提供企业版(集群、SLA、定制开发);国内云厂商(阿里云、腾讯云、火山引擎)提供一键部署与托管服务 六、典型应用场景 个人生产力:邮件 / 日历管理、文件整理、代码编写 / 调试、周报自动生成、浏览器自动化、信息检索汇总 开发者工具:API 调试、GitHub Issues 管理、CI/CD 触发、服务器监控、日志分析、代码迁移 中小企业 / 团队:飞书 / 钉钉群助手、客户消息自动回复、报表生成、流程自动化、内部知识库问答 私有化 / 合规场景:政务、金融、医疗等敏感数据处理,本地部署、数据不出域(如深圳福田「政务龙虾」落地) 极客 / 硬件玩家:小主机 / NAS 部署、智能家居控制、本地模型集成、自定义技能开发 七、优势与局限 核心优势 开源免费:MIT 协议,无订阅、无 API 锁、可商用二次开发 本地可控:数据隐私、断网可用、低延迟、无云端成本 接入无感:直接用现有 IM,无需新 App,学习成本极低 生态繁荣:技能丰富、社区活跃、更新迭代快(周更) 模型自由:不绑定单一 LLM,云端 / 本地灵活组合 主要局限 技术门槛:部署 / 配置需基础命令行 / 网络知识,普通用户有学习成本 执行边界:复杂系统操作、跨设备协同、图形化界面交互仍有局限 模型依赖:核心推理能力取决于接入的 LLM 质量,本地模型效果弱于云端旗舰 安全风险:本地执行权限过高,需严格配置权限与沙箱,避免误操作 / 恶意指令 八、未来规划(官方 Roadmap 2026) 2026 Q2:v2026.5 稳定版,强化多智能体编排、可视化 Workflow 编辑器、移动端原生 App、企业级集群部署 2026 H2:开放 Agent Marketplace 付费分成、硬件适配(边缘设备、嵌入式)、多模态(视频 / 语音深度集成)、行业垂直模板(跨境、电商、教育) 长期:构建开源 Agent 标准、跨平台统一执行层、去中心化技能分发网络
AI / AI Agent / AI助手 / OpenClaw

推荐百科

1 白昕怡(短剧演员)

      白昕怡(1996 年 3 月 25 日 —),中国内地影视女演员,以短剧甜宠、虐恋题材见…
三文鱼 2026年4月6日
白昕怡(短剧演员)
AI

1 OpenAI Codex

Codex 是由 OpenAI 研发的系列 AI 辅助软件开发工具及智能体系统,核心聚焦软件工程领域…
三文鱼 2026年4月7日
OpenAI Codex

百科标签

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索