【软件产业】智象未来提出全新自回归图像编辑框架VAREdit(2025-09-05)
【摘要】 9月5日,OSCHINA讯,近日,智象未来团队将视觉自回归(VAR)架构引入图像编辑,提出全新指令引导编辑框架VAREdit,解决了扩散模型固有顽疾。该框架把下一尺度预测范式引入其中,基于文本指令和量化源图像特征预测目标图像多尺度视觉残差,还提出新颖SAR模块,实现图像编辑精准性和高效性双重提升。团队表示,VAREdit能“指哪打哪”,实现精准度与速度双重突破。
【关键词】图像编辑,自回归,框架
【软件产业】腾讯优图实验室开源智能体框架Youtu-Agent(2025-09-05)
【摘要】 9月5日,OSCHINA讯,近日,腾讯优图实验室正式开源智能体框架Youtu-Agent。该框架以极简高性能为核心,为科研和开发人员提供高效易用的开发工具。它面向多方向应用,已支持腾讯云业务。不依赖海外闭源大模型API和额外训练模型,能在实际场景有好效果。在多个基准测试成绩领先,框架设计开源友好、架构灵活、自动化且简洁。
【关键词】智能体框架,开源,Youtu-Agent
【软件产业】小米澎湃OS 3发布,Beta版首批机型开启推送(2025-09-04)
【摘要】 9月4日,OSCHINA讯,近日,小米正式发布澎湃OS 3,优化升级多项系统化服务功能并全面接入苹果生态。该系统在自研芯片技术积累上,深入性能和图形根技术。新增“热点编译加速”“窗口绘制下沉”技术,提升能效和渲染效能。首推“小米超级岛”,跨端互联支持苹果设备,超级小爱全面升级,预计9月底支持众多应用和能力。8月29日Beta版首批机型陆续推送。
【关键词】小米澎湃,系统升级,跨端互联
【软件产业】GTK 4.20发布,跨平台开源图形工具包升级(2025-09-04)
【摘要】 9月4日,OSCHINA讯,GTK 4.20正式发布。新版本在Wayland、渲染器兼容性、跨平台支持、无障碍以及视频与图形处理方面有重大更新,为Linux、macOS、Android与Windows提供更稳定体验,也为GNOME 49桌面环境提供技术基础。它在多方面功能提升,还将被GNOME 49默认采用。
【关键词】图形工具,开源图形,跨平台
【软件产业】开源直播录制工具OBS Studio 32.0.0 Beta1发布(2025-09-03)
【摘要】 9月2日,OSCHINA讯,近日,开源直播与录制工具OBS Studio 32.0.0首个Beta版发布。此版本有诸多更新,包括引入内建插件管理器简化操作,可选自动崩溃日志上传助力问题修复。在NVIDIA RTX方面有新音频和视觉功能,还支持Hybrid MOV容器,增强跨平台兼容性。此外,有多项其他改进与修复,涵盖插件、UI、视频捕获、编码等方面,修复大量Bug。
【关键词】直播录制,开源工具,修复
【软件产业】具身智能高质量合成数据集开源发布(2025-09-03)
【摘要】 9月2日,OSCHINA讯,近日,国家数据局发文宣布,具身智能灵巧手多样抓取仿真数据集(DexonomySim)开源发布。该数据集由银河通用在国家数据局指导下介绍发布,专为具身智能机器人灵巧抓取任务设计,含超950万条高质量抓取姿态,覆盖超1万个物体与31种常用抓握类型,是当前开源最大规模相关数据集。
【关键词】具身智能,数据集,合成数据
【软件产业】快手开源向量化引擎Auron加入Apache孵化器(2025-09-02)
【摘要】 9月2日,OSCHINA讯,近日,快手开源并捐赠的向量化引擎Auron项目(原Blaze项目)近期进入Apache软件基金会孵化器。加入源于对开源生态认同和项目可持续发展考量,Auron已在多家公司应用。它基于向量化技术,有原生执行、向量化计算等核心能力,在TPC-DS上相比Spark有2+倍性能提升。
【关键词】Auron,向量化引擎,Apache
【软件产业】UltraRAG 2.0发布,开源RAG框架革新(2025-09-02)
【摘要】 9月2日,OSCHINA讯,近日,清华大学THUNLP实验室、东北大学NEUIR实验室、OpenBMB与AI9Stars联合推出UltraRAG2.0(UR-2.0),这是首个基于ModelContextProtocol(MCP)架构设计的开源RAG框架。该设计让科研人员用YAML文件就能声明复杂逻辑,快速实现多阶段推理系统。
【关键词】RAG框架,MCP架构,推理系统
【软件产业】群核科技发布空间大模型并后续开源(2025-09-01)
【摘要】 9月1日,OSCHINA讯,群核科技在首届技术开放日发布新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,后续将逐步面向全球开发者开源。SpatialLM 1.5能理解空间关系,生成结构化场景脚本;SpatialGen可生成多视角图像。
【关键词】群核科技,空间大模型,开源
【软件产业】开源低代码引擎TinyEngine发布v2.8.0(2025-09-01)
【摘要】 9月1日,OSCHINA讯,近日,开源低代码引擎TinyEnginev2.8.0正式发布。该引擎能使能开发者定制低代码平台,支持在线实时构建与二次开发等。v2.8.0在AI新特性、区块管理等多方面有变更,还进行了文档更新、bug修复等。
【关键词】低代码引擎,开源引擎,AI集成
【软件产业】Java开源工具集Hutool-5.8.40发布(2025-08-29)
【摘要】 8月29日,OSCHINA讯,近日,Java开源工具集Hutool-5.8.40发布,此次为常规bug修复。修复了StrBuilder插入错误等多个问题,还新增了MathGenerator四则运算不生成负数结果、增加多种数据库驱动支持等特性。
【关键词】Java工具,Hutool更新,Bug修复
【软件产业】货拉拉开源两款三方库解决开发痛点(2025-08-29)
【摘要】 8月29日,OSCHINA讯,近日,货拉拉开源了AspectPro Aop Plugin和page - spy - harmony两款实用三方库,解决应用开发中“代码耦合高”“远程调试难”问题。前者可让横切逻辑与业务代码解耦,提升代码质量;后者能实现远程可视化调试,加速问题定位修复。
【关键词】货拉拉,开源库,代码调试
【软件产业】Docker Desktop修复高危漏洞CVE-2025-9074(2025-08-28)
【摘要】 8月28日,OSCHINA讯,Docker发布更新,修复了Windows 10/11和macOS版Docker Desktop中编号为CVE-2025-9074的高危漏洞,该漏洞评分达9.3/10,利用难度低。官方在v4.44.3版本完成修复,建议用户尽快升级。
【关键词】漏洞修复,高危漏洞,网络安全
【软件产业】新一代中国操作系统银河麒麟V11发布(2025-08-28)
【摘要】 8月28日,OSCHINA讯,近日,2025中国操作系统产业大会上,新一代中国操作系统银河麒麟V11正式发布。该系统采用全新磐石架构,操作体验、安全性和生态丰富度大幅提升,是首个突破百万生态的国产操作系统,与国产主流芯片全面兼容。
【关键词】银河麒麟,操作系统,国产化生态
【软件产业】腾讯游戏发布AI工具集VISVISE提升动画制作效率(2025-08-27)
【摘要】 8月27日,OSCHINA讯,在科隆国际游戏展上腾讯游戏发布游戏创作AI工具集VISVISE,涵盖动画、模型等四个核心领域。其中MotionBlink工具动画生成效率提升8倍,GoSkinning工具提升3D角色蒙皮效率,还重新设计游戏开发流程。
【关键词】游戏,动画制作,效率提升
【软件产业】rsyslog 8.2508.0版本发布(2025-08-27)
【摘要】 8月27日,OSCHINA讯,近日,rsyslog 8.2508.0版本发布。此版本意义重大,推进负责任的AI First战略,迈向云原生运营,在质量、安全和文档方面有重大改进,亮点包括云原生进展、网络优化、安全增强等。
【关键词】rsyslog,新版本,云原生
【软件产业】百度发布视频生成大模型“蒸汽机2.0”(2025-08-26)
【摘要】 8月26日,OSCHINA讯,近日,百度发布中文音视频一体化生成的I2V模型“百度蒸汽机 2.0”,宣称是吃中文语料长大的,可一步到位生成音画同步、口型精准、情感自然的中文对话视频。此次百度蒸汽机 2.0实现全系模型开放,Turbo版、Lite版、Pro版及有声版均可体验。该模型是行业首个中文音视频一体化生成的I2V模型,支持环境音效和多角色语音一体化生成,能实现语音与唇形、表情、动作的毫秒级精准对齐。还首创多模态潜在空间规划技...
【关键词】百度,视频生成,大模型
【软件产业】FFmpeg8.0“Huffman”正式发布(2025-08-26)
【摘要】 8月26日,OSCHINA讯,近日,FFmpeg8.0“Huffman”正式发布,此版本因多次延期和项目基础架构现代化升级,是迄今规模最大的版本之一。新功能丰富,涵盖多个方面。在解码器上,新增Nativedecoders如APV、ProResRAW等;VVC解码器有IBC、ACT、调色板模式等改进;基于纯Vulkan计算实现新的编解码器,如FFv1(编码和解码)、ProResRAW(仅解码),适用于任何Vulkan1.3实现,使用相同hwaccelAPI和命令,用户启用Vulkan解码即可使用,...
【关键词】新功能,视频处理,编码器
【软件产业】钉钉联手通义推出Fun-ASR语音识别大模型(2025-08-25)
【摘要】 8月25日,OSCHINA讯,近日,钉钉与通义实验室语音团队宣布联手推出新一代语音识别大模型 Fun - ASR。该模型能听懂家装、畜牧等十大行业黑话,支持企业专属模型定制训练,可准确转写各种语音信号,识别多行业术语、不同语言与口音,结合上下文实现精准转录。
【关键词】语音识别,大模型,定制
【软件产业】赛昉推出低价RISC-V开发板VisionFive2Lite(2025-08-25)
【摘要】 8月25日,OSCHINA讯,近日,中国RISC-V企业赛昉科技StarFive在众筹平台Kickstarter推出入门级RISC-V开发板VisionFive2Lite。该开发板是单板计算机,外形规格与树莓派相同,为85mm×56mm。其定价亲民,最低的2GB内存版本仅售19.9美元(约合143元人民币)。VisionFive2Lite搭载2GB/4GB/8GBLPDDR4内存,正面配备1组40-PinGPIO、3个USB-A480Mbps、1个USB-A3.0/2.0、1个仅供电USB-C、1个MIPI-CSI、1个MIPI-DSI、1个HDMI2.0、1个RJ451...
【关键词】赛昉科技
【软件产业】智谱发布AutoGLM 2.0:全球首个手机Agent(2025-08-22)
【摘要】 8月22日,OSCHINA讯,近日,智谱宣布推出AutoGLM2.0,称将Agent应用提升到新高度。它是全球首个手机Agent,人人可用,开创Agent+云手机/云电脑新技术范式,突破硬件限制,由国产模型驱动,具备全能能力。即日起人人可用,还将快速迭代推出新功能。
【关键词】手机Agent,国产,AI应用
【软件产业】腾讯Kuikly开源框架新增支持Web(2025-08-22)
【摘要】 8月22日,OSCHINA讯,近日,腾讯广泛应用的跨端开发框架Kuikly基于Kotlin Multiplatform技术构建,由腾讯大前端领域Oteam推出。此次在Android、iOS、鸿蒙开源基础上,新增开源Web版,支持H5和微信小程序,进一步扩展多端适配场景,且已接入腾讯多款业务,如搜狗输入法、鹅毛市集、QQ小游戏等。
【关键词】开源框架,Web支持,多端适配
【软件产业】PowerToys 0.93 发布(2025-08-21)
【摘要】 8月21日,OSCHINA讯,近日,Microsoft PowerToys v0.93正式发布,这是供Windows系统高级用户调整和简化体验、提高生产力的实用程序。此次更新修复大量错误,进行细微用户体验调整并带来诸多新内容。命令面板启动内存占用减少15%,加载时间减少40%,内置扩展程序加载时间减少70%,安装体积减少约55%,还解决超99个Command Palette问题,如剪贴板历史记录回归等,重新设计的dashboard更清晰。Mouse Highlighter推出全新Spotlight...
【关键词】Windows,系统工具,更新修复
【软件产业】中山大学联合美团打造X-SAM模型(2025-08-21)
【摘要】 8月21日,OSCHINA讯,近日,中山大学、鹏城实验室与美团三方联合研发的X-SAM图像分割模型正式发布。该模型在图像分割领域实现重要突破,将传统“分割万物”升级为“任意分割”,提升适应性和应用范围。研究团队针对传统SAM局限性,提出视觉定位分割任务框架。X-SAM技术架构有多项创新,支持统一输入输出格式,核心双编码器架构和分割连接器提升分割精度,集成Mask2 Former架构突破传统技术限制。采用三阶段渐进式训练策略,在...
【关键词】图像分割,多模态大模型,校企联合
【软件产业】蚂蚁集团开源新一代JVM即时编译器Jeandle(2025-08-20)
【摘要】 8月20日,OSCHINA讯,蚂蚁集团正式开源基于LLVM的JVMJIT编译器Jeandle。公告以“筋斗云”为喻,期望Jeandle为JVM提升性能、拓宽生态边界。Jeandle是基于OpenJDK Hotspot JVM的全新即时编译器,利用LLVM进行编译优化与代码生成,把LLVM的性能和生态优势引入JVM。但整合JVM和LLVM两个复杂系统需攻克诸多技术难题,如支持JVM的垃圾回收机制、为JVM各种功能定制LLVM特性、基于LLVM实现针对Java语言的多类优化算法等。目前Jeandle开...
【关键词】即时编译器,开源,Java
【软件产业】港大联手月之暗面等开源OpenCUA,可自主操作电脑的Agent(2025-08-20)
【摘要】 8月20日,OSCHINA讯,近日,香港大学XLANGLab联合月之暗面、斯坦福大学等机构正式开源OpenCUA框架,助力开发者低门槛构建和扩展CUA(计算机使用智能体)。该框架包含三部分:无缝捕获人类计算机使用演示的注释基础设施、首个跨越3个操作系统及超200个应用程序和网站的大规模计算机使用任务数据集AgentNet、可将演示转换为具有反思性长思维链推理“状态-动作”对的可扩展工作流程。项目由港大计算机科学系助理教授TaoYu负责,月...
【关键词】开源,校企联合,CUA,
【软件产业】昆仑万维发布Skywork Deep Research Agent v2(2025-08-19)
【摘要】 8月19日,OSCHINA讯,近日,昆仑万维集团推出Skywork Deep Research Agent v2,标志着天工超级智能体核心引擎显著增强,为用户带来多模态、高质量、高效率体验。v2引入“多模态深度调研”Agent,首次整合多模态检索、理解和生成,解决传统产品依赖纯文本检索分析局限。通过多模态爬取技术MM-Crawler、长距离多模态信息收集等技术突破,让研究人员等用户能获取完整、顺畅、视觉友好的深度报告。此外,还推出“多模态深度浏览器...
【关键词】多模态调研,Agent,SOTA
【软件产业】2024年中国隐私计算市场规模近10亿(2025-08-19)
【摘要】 8月19日,OSCHINA讯,近日,国际数据公司IDC发布《2024中国隐私计算平台主要厂商市场份额》报告。2024年中国隐私计算市场规模达9.8亿元,同比增长10.1%,蚂蚁数科以36.7%的市场占有率位居首位,且连续三年蝉联中国隐私计算市场份额第一。IDC认为,市场增长主要源于数据要素相关项目建设,大模型向各行业渗透使隐私保护需求升高,为隐私计算应用增长增添新动能。大模型在产业快速应用时,数据安全与隐私保护成为规模化落地的挑...
【关键词】隐私计算,市场规模,蚂蚁数科
【软件产业】DeepSeek App更新,支持对话内容生成分享图(2025-08-18)
【摘要】 8月18日,OSCHINA讯,近日,手机应用商店显示,DeepSeek App发布1.3.0版本更新,首次支持对话内容生成分享图功能,用户问答对话可通过原生功能生成图片,比截图分享更便捷。今年6月DeepSeek团队曾加紧推进R2模型开发,CEO梁文锋对模型能力不满意,团队内部仍在提升性能,未准备好正式投用,原计划5月推出也因各种原因延迟,新模型预计能生成更高质量代码,具备用非英语语言进行推理的能力。
【关键词】DeepSeek,App,对话分享图,R2模型
【软件产业】Warm - Flow 1.8.0版本重大更新,自研仿钉钉设计器发布(2025-08-18)
【摘要】 8月18日,OSCHINA讯,近日,Warm-Flow工作流引擎迎来1.8.0版本重大更新,带来全新功能与卓越用户体验。核心亮点是自主研发仿钉钉设计器,基于logic-flow研发,同时支持经典和仿钉钉双设计器,避免维护两套代码,提升统一性与可维护性。智能交互体验升级,绘制回退线条时系统自动识别设置为退回跳转类型,经典模式下节点和连线文字可自由拖动调整,设计器根据流程发布状态自动判断是否可编辑。功能增强与优化方面,新增getFirst...
【关键词】工作流引擎,仿钉钉,智能交互
【软件产业】阿里通义发布Wan2.2-I2V-Flash图生视频模型(2025-08-15)
【摘要】 8月15日,OSCHINA讯,近日,阿里通义大模型推出最新图生视频模型Wan2.2-I2V-Flash。该模型将电影级视觉呈现融入其中,在生成速度与性价比方面实现全面跃升,致力于为用户带来更快速、专业、稳定的图生视频体验。与Wan2.1相比,其推理速度提升12倍,创作效率显著提高。指令遵循能力大幅提升,能精准实现各种特效提示词、精准控制运镜,使指令落地更精准。还能稳定输出风格化图像,对各类风格化图像都可保持风格,并实现合理自然...
【关键词】图生视频,稳定,数字内容
【软件产业】国内首个隧道与地下空间领域垂直大模型发布(2025-08-15)
【摘要】 8月15日,OSCHINA讯,近日,我国首个隧道与地下空间领域垂直大模型由中国中铁隧道局隧道掘进机及智能运维全国重点实验室研发发布。该模型依托盾构/TBM工程大数据中心的773条工程线路、1200亿条工程建造数据,构建了通用大模型调度中小模型驱动的垂直领域大模型技术体系,形成全生命周期场景+AI的数智互馈赋能技术体系新形态。研发了隧道侠AI助手,搭建行业科普、专业问答等功能新引擎;突破大模型对齐与微调技术,研发系列中小...
【关键词】地下空间,垂直大模型,数智决策
【软件产业】deepin 25适配魔方派3开发板,推动国产操作系统硬件融合(2025-08-14)
【摘要】 8月14日,极客网讯,近日,deepin(深度)社区宣布deepin 25已正式适配RUBIK Pi 3(魔方派3)开发板并完成产品兼容性认证。测试显示,双方在兼容性、性能及稳定性方面达预期,运行流畅。此次适配实现系统稳定运行,还预装UOS AI、跨端协同等自研应用,为开发者和极客玩家提供强大平台。魔方派3基于高通QCS6490芯片,具备12 TOPS的AI性能,有丰富接口和功能设计,能满足多样开发需求。适配在魔方派3开发板(8核 + 8GB)上成果显...
【关键词】操作系统,兼容性,生态建设
【软件产业】百川智能开源医疗增强大模型Baichuan-M2(2025-08-14)
【摘要】 8月14日,OSCHINA讯,近日,百川智能正式开源医疗增强大模型Baichuan-M2。针对医疗领域模型私有化部署需求,团队对其进行极致轻量化,量化后精度接近无损,可在RTX4090单卡部署,相比DeepSeek-R1H20双节点部署成本降低57倍。基于Eagle-3架构优化的Baichuan-M2-Spec版本,在单用户场景下token速度跃升74.9%,适用于急诊、门诊等对交互速度要求高的场景。M2模型通用核心性能不降反升,可用于医疗以外领域。测评显示,Baichuan-M2...
【关键词】智能医疗,大模型,轻量化
【软件产业】百度搜索PC端全面上线AI搜索功能(2025-08-13)
【摘要】 8月13日,OSCHINA讯,近日,百度搜索PC端首页全面上线一系列AI功能,将传统信息入口转变为任务中枢。新上线的“超级智能双行框”可一键深度搜索,解答复杂问题,提升搜索体验。“工作台”模块集成AI阅读、AI写作和AIPPT三大工具。AI阅读能一键总结链接、图片及超大文档,节省阅读时间;AI写作提供超20种文风选择,支持划线修改,助力创作编辑;AIPPT可根据全网内容自动生成演示文稿,方便演示。据Quest Mobile报告,百度AI搜索...
【关键词】PC端,AI搜索,智能功能
【软件产业】科大讯飞推出星火代码画布,一键生成交互网页(2025-08-13)
【摘要】 8月13日,OSCHINA讯,近日,讯飞开放平台上线“星火代码画布”创新功能,通过语音指令、草图、链接或文字描述,就能快速生成交互网页,提升开发效率,对非技术背景用户尤为友好。产品经理小马用一句话生成招聘官网职位详情页,设计师阿夏上传草图生成AI论文评审助手界面demo,品牌视觉设计师阿珊参考链接复刻珠宝品牌形象页,展示了其在不同场景的强大功能。它不仅能快速生成页面,还能精准还原UI细节,前端实习生阿豪借此为公...
【关键词】科大讯飞,星火代码画布,交互网页
【软件产业】昆仑万维发布Matrix-Game2.0国产开源Genie3(2025-08-12)
【摘要】 8月12日,OSCHINA讯,昆仑万维推出自研世界模型Matrix系列升级版「Matrix-Game2.0」,这是业内首个通用场景实时长序列交互式生成世界模型开源方案。相较于上一版本,2.0版本侧重低延迟、高帧率长序列交互性能,能以25FPS在复杂场景稳定生成连续视频,时长可扩展至分钟级,提升连贯性与实用性,且保持对物理规律和场景语义精准理解,支持用户自由探索构建虚拟环境。它提出全新视觉驱动交互世界建模方案,摆脱传统语言提示生成模...
【关键词】昆仑万维,开源,图像
【软件产业】智谱AI开源视觉推理模型GLM-4.5V(2025-08-12)
【摘要】 8月12日,OSCHINA讯,智谱AI发布并开源新一代旗舰视觉推理模型GLM-4.5V。该模型基于MOE架构,总参数量达106B,激活参数量12B,支持视频、图像、文本、文件输入,输出文本,上下文窗口为64K。它基于智谱新一代旗舰文本基座模型GLM-4.5-Air,延续GLM-4.1V-Thinking技术路线,在41个公开视觉多模态榜单中综合效果达同级别开源模型SOTA性能,涵盖多种常见任务。模型由视觉编码器、MLP适配器和语言解码器三部分组成,支持64K多模态...
【关键词】智谱,视觉推理,处理效率
【软件产业】华为宣布CANN全面开源开放(2025-08-11)
【摘要】 8月11日,OSCHINA讯,近日,在昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链也全面开源,支持用户自主深度挖潜和自定义开发,以加速开发者创新,提升昇腾易用性。徐直军提到华为AI战略核心是算力且坚持昇腾硬件变现,峰会还探讨构建开源开放的昇腾生态,发起《CANN开源开放生态共建倡议》。CANN是华为面向AI的端云一致异构计算架构,承上启下,是提升昇腾...
【关键词】华为,CANN,开源开放
【软件产业】百度智能云推出全球首批AI数字员工(2025-08-11)
【摘要】 8月11日,OSCHINA讯,近日,百度智能云宣布推出全球首批AI数字员工,涵盖营销经理、还款助理等核心业务职能。百度副总裁阮瑜表示,大模型飞速进化推动AI从Copilot形态向Agent及Agentic方向深化,数字员工作为新型“劳动者”将推动组织生产力变革。这些数字员工有四大升级,即“智能化大脑”,以端到端语音语义大模型驱动业务闭环,实现真人级交互体验,语音识别准确率达98%,对话延迟降至1秒内;“真人级形象”,用4D扫描技术...
【关键词】数字员工,百度智能云,智能化升级