【数字创意】腾讯混元图像3.0图生图模型发布:自研算法,一句话就能P图(2026-01-27)
【摘要】 01月26日,快科技讯,腾讯混元宣布混元图像3.0图生图(HunyuanImage 3.0 - Instruct)模型正式发布,支持图片编辑与多图融合,该模型在元宝同步上线,用户可用于制作表情包、设计电商海报等。此模型总参数量80亿,采用混合专家(MoE)架构,基于混元图像3.0的原生多模态架构基础模型,引入图生图的多任务数据。它能深度理解与处理用户输入的图像和编辑指令,生成的图片一致性高、真实感强、情绪表现力佳,生成速度明显提升。模型在收到图片和提示词后,会推理出编辑区域、步骤等。其支持多样化的图片编辑与多图融合能力,如增删改、风格变换等。混元团队构建千万量级图生图数据,构造思维链提升编辑效果,后训练阶段采用自研MixGRPO算法,高效对齐用户偏好。
【关键词】腾讯混元,图像3.0,图生图模型
【数字创意】周鸿祎官宣短剧智能体,AI拍片时代要来了(2026-01-27)
【摘要】 01月27日,自由小宇宙讯,2026年1月,360集团创始人周鸿祎在崇礼论坛透露,360将发布“短剧智能体”产品,用户输入网络小说或剧本,就能转化为“漫剧大片”,标志人工智能从聊天机器人进化为创意生产者。周鸿祎预测2026年迎“百亿智能体时代”,大模型需升级为智能体才能落地。“短剧智能体”基于360“纳米AI多智能体蜂群”技术积累,独创蜂群协作框架,能组织超5万个L3级垂直智能体完成复杂任务,将视频生成时长提至10分钟。其核心是降低创作门槛,周鸿祎试用验证了个人创作可行性,能解决中小微企业和自媒体痛点,60秒产出商用级内容。周鸿祎提出“五力模型”,指出未来算力需求在“推理算力”。智能体普及将催生“智能体经济”,互联网或分化。360推出“360智能体工厂”推动落地,愿景是让员工成“超级个体”、团队成“超级组织”、产品成“超级产品”。
【关键词】短剧智能体,360集团,AI创作
【数字创意】TikTok Shop加码AI购物工具,可购物图片功能浏览量比视频高172%(2026-01-23)
【摘要】 01月20日,亿恩网讯,TikTok Shop在电商领域不断创新,积极加码AI购物工具。其新推出“AI时尚视频生成器”,允许商家无需模特或拍摄即可创建可购物视频,系统能自动将商品图片转化为带语音和口型同步的视频片段,“AI列表生成”功能也为商家提供便利。此外,平台上线“可购物图片”功能,支持创作者通过轮播图直接标注商品链接,数据显示该功能浏览量比可购物视频高172%,超70%的销量来自新用户。
【关键词】TikTok,Shop,AI购物,可购物图片
【数字创意】光峰蜻蜓G1 mini:单目体积仅0.2cc,让AR眼镜极致轻盈(2026-01-04)
【摘要】 1月4日,vr陀螺网讯,光峰科技推出的蜻蜓G1 mini是专为轻量化AR眼镜定制的LCoS AR光学引擎,也是2025年9月光博会推出的蜻蜓G1架构升级款。它延续“单光机驱动双目显示”设计,仅一枚核心光机就能实现双目独立成像,成为闪极科技Loomos AI显示眼镜S1的独家光学引擎解决方案。该引擎确定了“轻量化 + 低成本”的行业发展路径,明确了AR光学引擎核心进化逻辑。其单目体积仅0.2cc,较初代缩小40%,分辨率、对比度等表现出色,还解决了佩戴的压迫感与灼热感问题。光峰与闪极从技术对接到产品落地不足3个月,凸显其快速迭代和定制化开发能力。全球AR核心技术赛道竞争中,光峰的LCoS方案与Micro LED方案竞争,蜻蜓G1 mini具“低成本 + 高适配性”优势,且中国完整的LCoS产业链为其规模化落地提供支撑。光峰深耕LCoS技术,相关专利储备领先,推动全球AR眼镜行业迈向“规模化应用期”。
【关键词】光峰科技,蜻蜓G1,mini,AR眼镜
【数字创意】万兴科技发布万兴喵影2026,实现全流程AI视频创作(2025-12-31)
【摘要】 12月31日,三湘都市报、证券日报等媒体讯,AIGC软件A股上市公司万兴科技面向国内市场发布视频创意软件万兴喵影2026桌面端(海外版:Wondershare Filmora V15)。该软件全新升级,深度整合AI能力,率先在业内打通全链路智能视频创作流。它聚焦智能生成与创作流管理,首次在通用型视频创意软件中实现从AI素材生成、AI续写到精细剪辑的一站式体验,将AI系统性融入视频制作全流程,形成以“AI提效+专业可控”为特征的内容生产工作流,为视频创作者提供从算力到应用的完整服务链,大幅降低专业视频创作门槛。
【关键词】万兴科技,万兴喵影2026,AI创作
【数字创意】数美万物申请基于文生图大模型的卡通角色概念注入方法专利(2025-12-31)
【摘要】 12月27日,金融界等媒体讯,国家知识产权局信息显示,数美万物(广州)网络技术有限公司申请一项名为“基于文生图大模型的卡通角色概念注入方法及系统”的专利,公开号为CN121213704A。该专利旨在革新卡通角色的生成方式,在推理时能以短描述生成高保真角色图像。数美万物旗下还有“造好物”“Hitems”等为AI创作者提供社区和交易平台的项目,以及完全自研的图生3D模型、基于开源模型精调的图片生成模型等设计AI工具。
【关键词】数美万物,文生图,卡通角色
【数字创意】捷成股份发布四阶影视理解大模型,AI视觉中枢重构产业生态(2025-12-24)
【摘要】 12月19日,证券日报讯,12月18日,在2025中国数字文娱大会上,捷成股份首席技术官张俊祺发表演讲,首次系统性披露自研的四阶影视视频理解大模型如何重构影视工业全链路,并宣布基于该技术的“视觉智能中枢”已产业化落地且达成多项合作。当前AIGC技术下,文娱行业存在“高理解成本、低表达效率”痛点,捷成股份的四阶大模型构建了标准化技术评价框架,从L0到L3层逐步深入,实现影视从记忆检索到风格结构的认知跃迁,为创作提供深层次语义支持。该模型依托公司超20万小时素材库及AI生成的大量素材,打造全球最大影视级AI向量库。目前已应用于旗下平台,弥补通用模型短板,提升制作效率。捷成股份还与头部IP平台合作,构建完整产业闭环。业内人士认为,这彰显其先发优势与硬实力,有望引领影视工业迈向AI驱动的高质量发展新阶段。
【关键词】捷成股份,影视模型,视觉中枢
【数字创意】单集入片比达38.4%,爱奇艺《与晋长安》获颁创新影像大赛虚拟制...(2025-12-24)
【摘要】 12月19日,极客公园讯, 12月16日,首届创新影像大会在京举行,爱奇艺选送的《<与晋长安>虚拟制作集锦》获2025年中国创新影像大赛虚拟制作赛道专业组一等奖。《与晋长安》是今年虚拟制作赛道唯一获奖的剧集类作品,其虚拟制作部分拍摄时间集中、翻景时间短。爱奇艺虚拟制作团队为该剧定制全案,探索多项技术创新。行业首创虚拟制作「月相」插件,让月亮状态与日期联动;首次尝试对同一造景的虚实分区连接拍摄,使虚实完美融合;还利用AIGC技术生成虚拟卫兵3D模型及巡逻运动,降低成本。最终团队30天完成全套系统搭建,进行多次调试和拍摄,该剧虚拟制作部分单集最高入片比达38.4%,位居行业前列。目前,爱奇艺积累多项虚拟制作专利及软著,2025年虚拟制作项目数量大增,还将有首部全流程参与的头部院线电影春节上映,多个主创团队也选择复购其虚拟制作服务。
【关键词】爱奇艺,《与晋长安》,虚拟制作
【数字创意】Meta推出WorldGen:一句话生成50米×50米可交互3D世界(2025-11-28)
【摘要】 11月23日,TechWeb讯,Meta推出WorldGen系统,仅需单条文本提示词就能生成可交互、可导航的三维世界。该系统融合程序化逻辑推理、扩散模型的三维生成技术及面向对象的场景分解方法,能输出几何结构严谨、视觉丰富的三维场景,适用于游戏开发、模拟仿真及沉浸式社交环境。目前,它可生成50米×50米尺度的全纹理三维场景,在生成质量和一致性上比现有方法有显著优势。虽然生成内容可直接兼容主流游戏引擎,但该系统暂未向开发者开放。并且,WorldGen仍处于研究阶段,Meta正努力拓展空间生成范围并降低生成延迟。
【关键词】Meta,WorldGen,3D世界
【数字创意】中兴发布全新VR电影方案:5.5G高速网,支持4K/90fps(2025-11-21)
【摘要】 11月19日,快科技讯,在2025金鸡百花电影节·虚拟现实电影季上,中兴推出5G-AVMAXVR电影方案。该方案依托EasyOn·Meta专网与XRExplore元宇宙引擎,能实现4K/90fps画质的大规模并发播放,助力VR电影商业化落地。传统VR电影存在背包设备笨重、网络卡顿等问题,而中兴的5.5G方案通过室内专网覆盖,可实现100路4K内容同时传输,端到端时延低于15ms。观众只需佩戴轻量化头显,就能在虚拟场景中自由移动且交互无延迟。技术上,方案采用“云-边-端”协同架构,边缘云承担算力渲染,XRExplore统一能力平台打造高度兼容的渲染播放系统,支持多平台内容开发、适配多品牌头显,降低了开发成本和部署难度。
【关键词】中兴,VR电影,5.5G方案
【数字创意】万兴科技以AI重塑数字创意生产力(2025-11-21)
【摘要】 11月21日,潇湘晨报讯,2025世界计算大会于11月20日在湖南长沙开幕,万兴科技携万兴天幕音视频多媒体大模型及多款数字创意软件亮相。公司副总裁张铮分享了AI布局成果,指出AIGC技术重塑视频内容生产流程,推动“创意平权”。万兴科技持续推进AI技术创新,2024年发布万兴天幕,今年6月推出万兴天幕2.0,性能大幅提升。在视频创意、文档及绘图创意领域,公司焕新上线多款产品,降低创作门槛。作为“湘商回归”企业,万兴科技回湘发展后建成全球运营总部和研发中心,参与本地数字化建设。在人才建设上积极引才,应届生平均年薪达50万元。其业务覆盖全球,累计活跃用户超20亿。
【关键词】万兴科技,AI技术,数字创意
【数字创意】Meta推升级版高拟真虚拟场景Hyperscape(2025-11-21)
【摘要】 11月21日,Donews讯,当地时间周四,Meta宣布推出升级版Hyperscape,该版本支持多人共享高拟真虚拟空间。用户能通过Quest3或Quest3S扫描现实房间生成数字场景,还可邀请最多8人共同进入该虚拟空间,未来人数上限可能还会提升。此次更新将渲染迁移至本地设备,同时新增音频功能,用户既可以通过头显加入,也能通过Meta Horizon手机应用加入。不过已有的扫描空间需要重新扫描才能进行分享。该功能将分阶段推送,部分用户需要等待。Meta表示,这一举措意在推动混合现实与元宇宙社交体验的发展,鼓励创作者构建更丰富的内容。
【关键词】Meta,Hyperscape,虚拟场景
【数字创意】蚂蚁国际推出虹膜识别智能眼镜支付方案(2025-11-13)
【摘要】 11月13日,蚂蚁国际讯,蚂蚁国际在第十届新加坡金融科技节上推出面向智能眼镜的Alipay+GlassPay支付方案。该方案集成多模态生物识别技术,包括AI语音交互、意图识别及声纹核身,并展示了虹膜认证技术。虹膜认证通过比对260余个生物特征点,结合AI与活体检测技术,可抵御欺诈手段,实现精准识别。用户可通过智能眼镜完成叫车、司机对接、行程履约及会员奖励领取等操作,所有交易经声纹与虹膜认证核验,提供安全流畅的消费体验。Alipay+GlassPay由蚂蚁集团gPass技术驱动,致力于构建面向眼镜厂商和开发者的安全AI数字服务生态。
【关键词】Alipay,虹膜识别,智能眼镜支付
【数字创意】RAONTECH推出0.13英寸的LCoS显示模组(2025-10-31)
【摘要】 10月31日,VR陀螺讯,韩国AR/VR微显示解决方案商RAONTECH推出0.13英寸LCoS显示模组“P13”。P13尺寸仅为6.25毫米×4.65毫米,比以往同等分辨率产品缩小约60%,采用3μm像素技术,分辨率800×800,像素密度是同尺寸LEDoS显示屏两倍以上。其单面板设计可在紧凑光学系统中实现高质量色彩还原,完整光引擎模组可嵌入智能眼镜镜腿中,进一步丰富RAONTECH全彩显示产品组合。
【关键词】RAONTECH,LCoS,显示模组
【数字创意】Shiftall收购Diver-X公司的位置追踪技术“ContactTrack”(2025-10-31)
【摘要】 10月31日,VR陀螺讯,日前,Shiftall公司收购Diver-X公司旗下位置追踪技术“ContactTrack”业务,旨在强化XR领域位置追踪技术。Shiftall是一家从事VR/XR及IoT相关产品开发、制造与销售的企业,近期推出小型轻量化PCVR头显“MeganeX”系列及VR控制器。“ContactTrack”是高精度位置追踪技术产品,对实现下一代VR/XR体验具有关键作用。收购完成后,Shiftall将推进开发高性能位置追踪产品,目标是实现全身追踪。
【关键词】Shiftall,Diver-X,ContactTrack
【数字创意】东京大学开发出超低功耗的戒指型控制器picoRing mouse(2025-10-31)
【摘要】 10月31日,VR陀螺讯,东京大学研究团队开发出超低功耗指环型无线控制器“picoRing mouse”,可作为“鼠标”来操作。这款小型设备可检测手指动作,适用于VR头显的虚拟空间操作及AR眼镜的交互控制。传统指环式输入设备仅能搭载小型电池,存在数小时即耗尽电量的问题。尤其采用BLE(蓝牙低功耗)通信时,连续传输存在局限性,难以实现长时间使用。相比之下,picoRing mouse单次充电即可持续运行一个月以上。其核心在于指环与腕带间采用了超低功耗无线通信方案,将通信部分功耗降至传统方案的2%左右,成功突破了BLE的限制。该方案应用磁场背散射通信机制,全球首次将微瓦级(μW)无线通信技术应用于指环型设备。相较传统磁场后向散射技术,其通信距离延长约2倍,在低功率状态下仍能实现抗外部噪声的稳定性能。最大功耗仅449μW,成功打造出超低功耗输入设备。这款指环可与AR眼镜及腕带组合使用。在公共交通或户外环境中,用户能自然操控虚拟界面而不引人注目。轻量化设计使其隐蔽性强,适合长时间佩戴使用。
【关键词】AR眼镜,东京大学,戒指控制器
【数字创意】尼康与Lipronext启动联合创新项目“体积视频AR”(2025-09-30)
【摘要】 9月30日,VR陀螺讯,尼康与Lipronext宣布启动联合创新项目“体积视频AR”。该技术融合尼康的体积拍摄技术与Lipronext的Web AR开发能力,可实现人物与物体的立体拍摄,并通过智能手机或平板设备呈现沉浸式体验。用户无需下载应用程序,扫描二维条码或访问URL即可使用。该技术可应用于展会、促销、教育等多个领域。Lipronext代表董事藤田献児表示,该技术将为展会、旅游、教育、娱乐等广泛领域带来“体验型宣传推广”。
【关键词】尼康,Lipronext,体积视频AR
【数字创意】苹果Vision Air屏幕或采用CoE封装(2025-09-30)
【摘要】 9月30日,VR陀螺讯,苹果计划在2027年发布的iPhone 20和Vision Air中引入OLED屏幕的CoE封装技术。CoE封装技术通过将彩色滤光片集成到OLED薄膜封装层并去除偏光片,实现更轻薄、高亮度、低功耗和更好的反光控制。该技术最早应用于三星可折叠手机。部分业内人士透露,苹果计划在2027年将CoE应用于直板型智能手机,以纪念iPhone上市20周年,同时该技术也可能应用于Vision Air,使设备更加轻薄。
【关键词】苹果,CoE封装,Vision,Air,
【数字创意】影石官宣支持苹果空间视频格式,全景视频将可一键导出到Vision P...(2025-09-30)
【摘要】 9月30日,VR陀螺讯,全景影像品牌影石Insta360宣布其与苹果Vision Pro的生态合作取得重要进展,旨在为用户提供更无缝、更沉浸的全景视频体验。苹果在visionOS 26操作系统中推出APMP框架,使创作者能在Vision Pro上原生播放沉浸式视频。影石Insta360旗下软件Insta360 Studio现已支持通过APMP协议一键导出,用户可将360°全景视频导出为Vision Pro兼容格式,并通过AirDrop无线传输到Vision Pro中观看。此次更新深化了双方在Vision Pro生态的合作,双方合作始于2016年,影石多款产品入驻苹果官方商店,其最新产品X5也即将上线苹果商店。
【关键词】影石,苹果,Vision,Pro,
【数字创意】未来Meta眼镜将具备主动式“情境AI”(2025-09-30)
【摘要】 9月30日,VR陀螺讯,Meta Reality Labs首席科学家Michael Abrash在Meta Connect期间发表演讲,展望了智能眼镜上的AI助手发展方向。目前,Meta眼镜上的AI是反应式的,用户可向其发出命令或提问,如播放歌曲、设置计时器或询问“这是什么”,AI会通过摄像头捕捉图像并分析回应。在美国和加拿大,Meta眼镜还推出了Live AI功能,用户可与之进行持续对话,无需重复唤醒词,但受大型语言模型上下文窗口限制,第一代Ray-Ban Meta支持30分钟,新一代提升到1小时左右。Abrash表示,未来智能眼镜的AI将始终在后台运行,持续创建动态3D地图,记录环境、用户动作和物体交互,并存储这些日志以提供“情境AI”服务。例如,用户可直接询问“我今天消耗了多少卡路里”或“我把钥匙放哪儿了”,无需事先记录信息,只要当时戴着眼镜,AI就能回答。为实现这一点,需大幅提升芯片和算法的能效,甚至可能需要定制传感器和芯片,Meta Reality Labs Research正在研发这两者。此外,眼镜可能还需要拥有自己的蜂窝连接,而不是依赖于手机。扎克伯格此前也提到“始终在线情境AI”,认为其进展会比很多人预期的更快。
【关键词】Meta眼镜,情境AI,主动式