欢迎您访问欢迎来到沄森网,沄森智能旗下资讯平台!今天是:2026年06月08日 星期一 农历:丙午(马)年-四月-廿三
您现在的位置是:首页 > AI

腾讯云发布音视频 AI 品牌 WAND:六大自研模型,60+ 项 AI 能力覆盖媒体生产全链路

沄森™2026-06-08
  6 月5日,在2026AI产业应用大会上,腾讯云音视频正式发布AI原生能力底座WAND。WAND从底层模型、媒体能力到接入方式全面升级,音视频的媒体AI能力将以Agent-Native模式向行业开放。  腾讯云音视频凭借超过20年的技术

  6 月5日,在2026AI产业应用大会上,腾讯云音视频正式发布AI原生能力底座WAND。WAND从底层模型、媒体能力到接入方式全面升级,音视频的媒体AI能力将以Agent-Native模式向行业开放。

  腾讯云音视频凭借超过20年的技术积累,已构建起业界最全的音视频产品矩阵,保障音视频全链路的流畅体验,为媒体内容生产实现提质增效。IDC报告显示,腾讯云音视频解决方案已连续11次保持中国及出海市场份额第一。进入Agent时代,音视频除了要“传得快、播得清”,还要承担起Agent的“眼、耳、口”,既要读懂画面与声音,也要生成可看可听的内容,帮助Agent实现更智能的视听体验。而要让Agent流畅调用这些能力,生产必须端到端自动跑通,传统割裂的工具链已难以支撑。

  面对这些改变,腾讯云音视频在编解码、传输、增强等长期积累的原子能力之上,引入六大自研媒体专用模型,并以Agent-Native方式开放,共同构成WAND的三层架构。WAND取自四个关键词:Wide(全场景覆盖)、Amplify(以AI放大创作潜能)、Neural(自研模型驱动)、Delivery(稳定、一站式交付),从生成到交付一站式完成。

  具体来看,最底层是模型引擎,由编解码、增强、擦除、生成、理解、音频六大自研媒体专用模型构成,补充生图、生视频、生音乐、生语音、生3D等主流生成式基础大模型在媒体生产流程上的应用能力。

  模型之上是面向调用的能力层。基于模型能力,WAND把60+项媒体AI能力按生成、理解、处理、编码四个环节重新组织,通过API、Agent预编排工作流(Agentic Workflow)和Skills三种Agent-Native模式开放。再往上,这些产品能力被组织为面向具体行业的端到端场景方案。

   WAND能力架构图

   WAND的媒体专用模型,更贴合业务的实际需求。六大模型基于腾讯音视频业务沉淀的垂直领域生产数据训练,针对不同行业、不同场景分别做了专项调优,因而在真实业务中能保持稳定产出、多场景适配。以AIGC内容处理为例。在AI换装、商品套图等电商应用中,WAND生成模型针对不同品类、不同业务需求分别训练了处理策略:换装能区分毛衣、西装的版型与材质差异,套图贴合电商运营实际的构图与风格,因而报错率更低、图片可用率更高。

   WAND AIGC生产赋能电商场景

   WAND还解决了生产效率的问题。WAND把生成、理解、处理、编码的能力收进同一套体系,并以Agent友好的方式开放编排接口。Agent可以从内容理解走到素材生成,再自动完成画质增强与编码适配,端到端跑通整条链路,无需切换工具。由此,音视频的媒体AI能力不再是彼此独立的单一工具,而是可被Agent统一调度的生产级能力。

  以短漫剧创作为例,WAND依托生成、擦除、增强、压缩等模型能力,将剧本生成、分镜制作、角色一致性保持、智能配音、合成增强串成一条自动链路,从生产到交付整套素材由Agent驱动产出,平均生产效率提升90%,目前已服务国内80%以上的头部漫剧平台。其中,AI增强与无痕擦除双双荣获NAB Show2026年度产品奖。

   WAND AIGC内容处理赋能视频处理分发

  赛事直播对实时性与并发要求极高,需要在毫秒级延迟下同步完成解说、集锦生成、画质提升与多语种分发。WAND通过自研模型协同调度,将识别、生成、合成、编码整合为全自动化流程:实时追踪进球、扑救等高光时刻,自动触发集锦生成与多语种解说合成,再按终端适配编码下发,码率较传统方案节省超50%。该方案已累计支撑FIFA世界杯、英超、西甲、ICC板球世界杯、英雄联盟S赛、冬奥会等数千场全球顶级赛事和活动,成为亚太地区最大的赛事直播技术底座。

   WAND AI全能赛事制播Agent解决方案

  腾讯云音视频团队表示,WAND的发布,标志着腾讯云音视频从提供单点媒体处理能力,升级为面向AI应用与Agent的原生媒体底座。未来,腾讯云将与更多客户共同探索AI Agent时代的音视频应用形态。

所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。

举报邮箱:1002263188@qq.com

相关标签: