通义百聆语音双子星升级并开源,大幅提升语音合成与识别能力(2025-12-16)
【摘要】 12月15日, OSCHINA讯,通义百聆宣布其语音大模型Fun-CosyVoice3与Fun-ASR完成重大升级并同步开源。Fun-CosyVoice3首包延迟降低50%,中英混说错误率下降56.4%,支持9种语言、18种方言及情感控制,其开源版本Fun-CosyVoice3-0.5B具备zero-shot音色克隆能力。Fun-ASR在嘈杂环境下准确率达93%,新增歌词与说唱识别功能,支持31种语言自由混说与多种中文方言,流式识别首字延迟仅160毫秒,轻量化版本Fun-ASR-Nano-0.8B同步开源。模...
【关键词】语音合成,语音识别,开源升级
Gfast 快速开发框架 V3.3。10 版发布(2025-12-16)
【摘要】 12月16日, 资讯讯,Gfast V3.3。10版本发布,基于Go Frame 2。x+Vue3+Element Plus开发,是一款全栈前后端分离的管理系统。该版本前端采用vue-next-admin、Vue和Element UI,具备高生产率和模块化特点,支持插件化扩展,包括工作流引擎、自定义表单、CMS等功能。认证机制采用gftoken用户状态认证及casbin权限认证。本次更新主要涉及多租户版本优化,包括代码生成配置页面样式调整、树形雪花ID父级PID精度优化、左侧菜单经典布...
【关键词】Gfast,Vue3,管理系统
Rudis v0.2。0 正式发布,高性能内存数据库(2025-12-16)
【摘要】 12月11日, 资讯讯,Rudis v0.2。0 正式发布,这是一款高性能内存数据库。新版本对 Keys 命令的内部算法进行了重构,在大数据集场景下性能提升高达 99.55%。解决了与 Redis-insight 的 Set 预览兼容性问题,增强了可视化工具的使用体验。新增了 maxclients 配置项以限制客户端连接数量,并增加了 appendsync 配置项,提供三种 AOF 持久化策略(always、everysec、no)。此外,新增了 43 个命令,大幅扩展了功能覆盖面,并通过...
【关键词】内存数据库,性能优化,配置强化
高通宣布收购 RISC-V 初创企业 Ventana 微系统公司(2025-12-16)
【摘要】 12月15日, OSCHINA讯,高通宣布收购 RISC-V 初创企业 Ventana 微系统公司,此举可能推动其启动双架构并行战略,未来芯片产品有望同时集成自研 Arm 架构核心与高性能 RISC-V 架构核心。Ventana 成立于 2018 年,专注于数据中心及企业级市场的高性能 RISC-V CPU 设计,已推出多代产品。高通表示收购后将持续推进自研 Arm 架构 Oryon 核心的研发,同时迭代 Ventana 的 RISC-V 设计方案。高通在 RISC-V 领域早有布局,2019 年骁龙...
【关键词】高通,收购,双架构
Manus 1.6 发布:Max 性能、移动开发和 Design View(2025-12-16)
【摘要】 12月16日, OSCHINA讯,Manus正式发布1.6版本,核心更新包括旗舰级Agent Manus 1.6 Max、移动开发功能和Design View。Manus 1.6 Max通过先进架构实现性能提升,单次任务成功率显著提高,用户满意度在双盲测试中提升19.2%。Max在电子表格任务中表现突出,可处理复杂财务建模和数据分析,同时优化了Web开发,支持构建精美界面的内部工具。新增的移动开发功能支持端到端构建移动应用程序。Design View提供交互式图像创建和编辑,...
【关键词】Manus,Max,Agent
阿里通义提出 SAPO:一种稳定且高性能的 LLM 强化学习方法(2025-12-16)
【摘要】 12月10日, OSCHINA讯,阿里通义Qwen团队提出了一种名为Soft Adaptive Policy Optimization(SAPO)的新型强化学习方法,旨在解决大语言模型(LLM)强化学习中策略优化的不稳定问题。与现有的GRPO和GSPO方法采用硬剪切不同,SAPO使用平滑、温度控制的门控函数替代硬剪切,避免了梯度丢失和难以平衡的问题。SAPO的特点包括连续信任域、序列级一致性、token级自适应性以及非对称温度设计,从而在稳定性和性能上均有所提升。
...
【关键词】强化学习,大语言模型,策略优化
开发者工具箱 Kairoa v1.1。8 发布:新增证书查看和密码强度检测功能(2025-12-16)
【摘要】 12月15日, 资讯讯,现代化跨平台桌面开发者工具箱 Kairoa v1.1。8 版本发布,新增证书查看器和密码强度检测器两个安全相关功能,并对颜色转换器进行了全面优化。证书查看器支持 PEM、CRT、CER 等多种格式,可展示主题、颁发者、有效期等详细信息,并自动检测证书状态。密码强度检测器提供多维度安全检查,显示强度等级和破解时间估算,并给出改进建议。颜色转换器界面经过重构,支持 HEX、RGB、HSL 等更多格式,实现双向转换...
【关键词】开发者工具,安全功能,版本更新
Snow-IntelliJ v1.2。0 发布:文档注释、结构视图与缩进格式化增强(2025-12-16)
【摘要】 12月10日, 资讯讯,Snow-IntelliJ v1.2。0版本发布,重点优化了文档注释、结构视图与缩进格式化功能。本次更新重构了文档注释与格式化体系,统一了行注释与块注释的前缀定义,新增SnowDocCommentPostFormatter以规范文档注释的缩进与星号对齐。通过CodeStyleManager精确计算缩进,修复了模型不同步导致的异常问题。结构视图方面,重构了SnowStructureViewElement,完善了层次关系,新增函数节点图标与签名信息展示,提升了语...
【关键词】文档注释,结构视图,缩进格式化
ionet 25.2 发布,纳秒级延迟的分布式网络通信框架(2025-12-16)
【摘要】 12月15日, 资讯讯,ionet 25.2版本发布,这是一个基于Java语言开发的轻量级分布式网络编程框架,能够实现纳秒级别的端到端延迟。该框架采用Aeron+SBE组合实现消息传输层,具备真零拷贝、零回环、零反射、零GC等技术特性,通过无锁共享内存环形缓冲区设计避免内核态切换和锁竞争。框架支持TCP、WebSocket、UDP等多种连接方式,打包后仅15MB,启动时间在0。x秒内完成。适用于网络游戏服务器、物联网、高频金融交易等对延迟要求...
【关键词】分布式网络,纳秒延迟
阿里云正式发布函数计算 AgentRun(2025-12-16)
【摘要】 12月10日, OSCHINA讯,阿里云正式发布函数计算AgentRun,这是一款以全球领先的函数计算FC为技术底座的一站式Agentic AI基础设施平台。该平台深度融合Serverless的极致弹性、零运维和按量付费特性与AI原生应用场景,助力企业平均TCO降低60%。其核心功能包括:支持0到百万级并发极致弹性,通过忙闲时精细化计费降低成本;采用浅休眠(1毫秒极速唤醒)与深休眠技术实现性能加速和会话状态持久化;借助会话亲和机制突破Serverless...
【关键词】函数计算
MIT创企Liquid AI推出企业级小模型训练蓝图LFM2(2025-12-08)
【摘要】 12月8日,OSCHINA讯,近日,麻省理工学院创企Liquid AI推出第二代Liquid Foundation Models(LFM2),采用“liquid”架构,提供市场上最快的设备端基础模型。LFM2最初推出350M、700M和1.2B参数的密集检查点,基准测试显示其在质量和CPU吞吐量上优于Qwen3、Llama3.2和Gemma3等竞争对手。该系列模型适用于手机、笔记本电脑和车辆等设备,实现实时且隐私保护的AI应用。Liquid AI还拓展了产品线,增加任务和领域特定变体、小型视频...
【关键词】AI,小模型,企业级
Gemini 3 推出Deep Think模式:面向Ultra订阅用户的深度推理升级(2025-12-08)
【摘要】 12月8日,OSCHINA讯,Google正式推出Gemini 3 Deep Think模式,面向Ultra订阅用户提供深度推理升级。该模式在Gemini 3 Pro基础上增加算力并引入新技术,专注于复杂数学、科学与逻辑推理任务。Deep Think在多项高难度基准测试中表现优异:Humanity’s Last Exam得分41%,ARC-AGI-2测试借助代码执行拿下45.1%,GPQA Diamond科学知识测试获得93.8%,均标注为“最先进水平”。其依托“高级并行推理”能力,可同时探索多种假设路径...
【关键词】深度推理,新模式,算力
企业级Node.js框架Egg.js4.0原生支持AI开发能力(2025-12-08)
【摘要】 12月8日,OSCHINA讯,Egg.js4.0版本发布,原生支持AI开发能力,新增对象生命周期管理功能,使项目从框架到对象都透明可控。该版本提供AOP切面编程能力,比koa中间件更强大,可直接应用于类或方法。集成MCP和LangChain,通过简单装饰器即可构建MCPserver和Agent。升级指南建议在旧版项目中开启@eggjs/tegg-plugin和@eggjs/tegg-config插件。未来计划包括内置多种Agent构建能力、支持serverless场景及新增教学视频。
【点...
【关键词】框架AI开发生命周期
美国初创公司 Arcee AI 发布开源 MoE 模型 Trinity(2025-12-03)
【摘要】 12月3日,OSCHINA讯,近日,美国人工智能初创公司Arcee AI发布开源MoE模型系列Trinity,包括已推出的Trinity Nano(约6B参数MoE,1B active)和Trinity Mini(26B参数MoE,3B active),以及计划2026年1月推出的Trinity Large(约420B参数,13B active)。该系列采用多专家架构(afmoe),每层128个专家,每个token激活8个专家,基于10T级别数据训练,支持grouped-query attention等技术。Nano面向移动和嵌入式场景,Mini适用...
【关键词】开源模型,MoE
Anthropic 宣布收购开源 JavaScript 运行时 Bun(2025-12-03)
【摘要】 12月3日,OSCHINA讯,近日,Anthropic宣布收购开源JavaScript运行时Bun,Bun将成为Claude Code、Claude Agent SDK及未来AI编码产品的底层基础设施。收购后Bun保持开源和MIT许可,团队不变并继续公开开发。Bun由Jarred Sumner于2021年创立,集运行时、包管理器、打包器和测试运行器于一体,速度远超竞争对手。Claude Code在发布六个月后年化运营收入达10亿美元。Anthropic表示Bun正在重新定义现代软件工程的速度与性能,其团队...
【关键词】Bun,Code
苹果发布开源视频生成模型 STARFlow-V(2025-12-03)
【摘要】 12月3日,OSCHINA讯,近日,苹果在GitHub发布了开源视频生成模型STARFlow-V,该模型拥有70亿参数,基于Normalizing Flow架构,在时空潜在空间中运行,采用全局-局部架构,旨在实现高效、高保真度的视频生成。STARFlow-V支持480p分辨率(640x480),81帧(16 FPS,约5秒),是首个基于归一化流的因果视频生成器,支持端到端训练、原生似然估计,并能原生支持文本到视频、图像到视频以及视频到视频的生成任务,无需更改架构或重...
【关键词】视频生成,开源项目,苹果公司
豆包手机助手发布技术预览版(2025-12-01)
【摘要】 12月1日,OSCHINA讯,近日,豆包手机助手宣布推出技术预览版,这是豆包与手机厂商在操作系统层面合作的手机AI助手。该助手基于豆包大模型能力和手机厂商授权,提供语音、侧边键或豆包Ola Friend耳机唤醒功能,支持任意界面屏幕内容提问。助手整合了语音通话、视频通话和屏幕共享等常用功能,双击侧边AI键即可调用。多模态方面,助手打通系统原生相册,支持语音修图指令如删除人物、清理杂物。目前,搭载该助手的工程样机nubia ...
【关键词】技术预览版,多模态交互
玲珑应用商店极速版1.0.9已经发布(2025-12-01)
【摘要】 12月1日,OSCHINA讯,近日,玲珑应用商店极速版1.0.9已发布,该版本专注于简化功能,提升启动速度与用户体验。与官方版本相比,极速版去除了不必要的信息展示,仅保留基础的应用管理与升级功能。技术栈采用Flutter3.38.3和Dart3.10.1,运行于FedoraGNU/Linux43x86-64系统。本次更新修复了“全部应用”页面的布局问题,优化了应用升级后的信息刷新效率,并微调了代码逻辑。此外,全部应用页面的重置按钮现在会同步清除用户输入...
【关键词】应用商店,极速版
Meta 推出 DreamGym 框架,低成本高效训练 AI 代理(2025-11-24)
【摘要】 11月24日,OSCHINA讯,近日,Meta公司与芝加哥大学及加州大学伯克利分校的研究人员共同开发了DreamGym框架,旨在解决使用强化学习(RL)训练大型语言模型(LLM)代理的高成本、复杂基础设施和不可靠反馈等问题。该框架通过模拟RL环境动态调整任务难度,逐步提升代理处理复杂应用程序的能力。DreamGym由三部分组成:基于推理的经验模型、经验重放缓冲区和课程任务生成器,形成一个封闭的高效训练系统。实验表明,DreamGym在电子...
【关键词】强化学习,AI代理
IntelliJ IDEA 2025.2.5 发布(2025-11-24)
【摘要】 11月24日,OSCHINA讯,近日,IntelliJ IDEA 2025.2.5版本发布,主要更新包括:优化了对Docker Engine v29版本的API调用支持,解决了Gradle Runner在运行Spring Boot的Gradle 9.x项目时的问题。修复了IDE在扫描特定JSON结构的HTTP请求文件时可能挂起的缺陷,并改进了GitLab插件对大型pipeline ID的处理能力。详细更新内容可参考官方发行说明。
【关键词】IDEA,版本
Ant Design 6.0 正式发布(2025-11-24)
【摘要】 11月24日,OSCHINA讯,Ant Design v6正式发布,重点进行技术侧深度优化,提升与React 19及未来版本的兼容性和性能,最低要求React 18。此次升级为平滑迁移,v5用户可直接升级无需兼容包或工具,v5进入1年维护周期。v6移除IE支持,采用纯CSS Variables模式,支持实时主题变化和多主题复用,性能表现更优。所有组件完成DOM语义化改造,支持逻辑位置描述和RTL,可通过ConfigProvider统一配置样式。v6移除了v4废弃的API,如findDOM...
【关键词】Ant,React,技术升级
虚幻引擎 5.7 正式发布(2025-11-17)
【摘要】 11月17日,OSCHINA讯,近日,虚幻引擎5.7正式发布,提供构建逼真世界的工具,支持本世代硬件高保真实时渲染。新版本核心功能包括:一、开放世界构建工具链成熟,程序化内容生成框架(PCG)进入稳定状态,新增PCG编辑模式和试验性程序化植被编辑器(PVE),提升GPU计算速度;二、光影系统重大突破,MegaLights功能进入Beta测试,支持更多动态光源和逼真软阴影;三、引入Nanite植被试验性功能,基于Nanite体素几何渲染系统,实现...
【关键词】虚幻引擎,57,程序化生成
微软正式发布.NET 10(2025-11-17)
【摘要】 11月17日,OSCHINA讯,微软在.NET Conf 2025上正式发布.NET 10,这是迄今为止最高效、最现代、最安全、最智能和性能最佳的NET版本。作为长期支持(LTS)版本,.NET 10将支持至2028年11月10日,适合生产系统和长期项目。新版本在性能、内存占用、JIT编译器、硬件加速支持及Native AOT等方面均有显著提升。语言生态更新包括C# 14和F# 10,引入自动生成backing field的field-backed properties等特性。安全性方面增强了后量子加密...
【关键词】微软,发布,开发
谷歌严打“偷电”安卓 App:24 小时内无正当后台唤醒超 2 小时算违规(2025-11-17)
【摘要】 11月17日,IT之家讯,近日,谷歌发布新的应用质量指南,针对安卓App过度消耗电池电量问题加强管控。新规核心针对“唤醒锁“机制,该功能允许App在屏幕关闭后保持CPU运行,但部分App滥用导致电量异常消耗。具体标准为:手机端App在24小时内无正当理由累计唤醒设备超过2小时即违规;穿戴设备上每小时耗电超过总电量4.44%视为异常。违规应用将面临两项处罚:Play商店详情页添加耗电警告标签,以及降低商店推荐页面的曝光度。此政...
【关键词】谷歌,安卓App,电池优化
生产力再升级:微软官宣Visual Studio最新AI路线图,含4大亮点(2025-11-10)
【摘要】 11月10日,IT之家讯,近日,微软发布博文,公布了Visual Studio的最新AI路线图,旨在通过AI驱动的智能体体验提升开发者效率。路线图涵盖四大重点:一是推出自定义、测试、调试等多种新智能体并支持并发运行;二是改进聊天功能,如引入斜杠命令;三是实施MCP规范以增强企业安全性;四是集成GPT-5 Codex等最新模型并提供自动模型选择功能。微软计划简化AI模式切换流程,探索并发运行智能体的技术,优化聊天交互体验,并完善MCP协...
【关键词】AI工具,开发效率,智能体
Fish Shell4.2正式发布,Rust重写的“老牌”命令行Shell(2025-11-10)
【摘要】 11月10日,OSCHINA讯,Fish Shell4.2正式发布,这一版本包含近500次commits,主要变化是将Rust的最低支持版本提升至Rust1.85。Fish Shell是一款适用于Linux、macOS的命令行Shell,已有20年历史,以其友好、易用、功能强大和智能著称,许多其他Shell需配置的功能在Fish中默认提供。新版本增强了交互体验,包括历史命令的自动建议功能支持多行命令,修正了提示行显示问题,并优化了多语言翻译及界面提示。此外,修复了Fish4.1版...
【关键词】Fish,Shell,Rust
生产力再升级:微软官宣 Visual Studio 最新 AI 路线图,含 4 大亮点(2025-11-10)
【摘要】 11月10日,IT之家讯,近日,微软发布博文,公布了Visual Studio的最新AI路线图,旨在通过AI驱动的智能体体验提升开发者效率。路线图涵盖四大重点:一是推出自定义、测试、调试等多种新智能体并支持并发运行;二是改进聊天功能,如引入斜杠命令;三是实施MCP规范以增强企业安全性;四是集成GPT-5 Codex等最新模型并提供自动模型选择功能。微软计划简化AI模式切换流程,探索并发运行智能体的技术,优化聊天交互体验,并完善MCP协...
【关键词】AI工具,开发效率,智能体
群联 CEO 潘建成:当前存储行情“或许一生只会见到一次”(2025-11-10)
【摘要】 11月10日,IT之家讯,群联首席执行官潘建成在2025Q3财报电话会议上表示,当前由AI推理推动的存储行情极为罕见,可能是其职业生涯中仅见的一次。群联三季度营收达181.37亿新台币(约41.68亿元人民币),环比增长1.4%,创历史新高;毛利润58亿新台币,同样为历史最佳。由于市场供应紧张,群联正调整供应资源,优先满足企业级、工业级等需求。NAND闪存价格自7月以来涨幅达50-75%,7月1Tb TLC价格为4.8美元,11月初涨至10.7美元,...
【关键词】群联,CEO,存储行情
Meta AI 推出“全语种”语音识别系统,支持1600+ 语言(2025-11-10)
【摘要】 11月10日,OSCHINA讯,Meta的基础人工智能研究(FAIR)团队近日开源了Omnilingual ASR自动语音识别系统,支持转录超过1600种口语语言,其中包括500种此前未被任何AI系统覆盖的语言。该系统基于PyTorch的fairseq2框架,提供从3亿参数到70亿参数的不同版本。测试结果显示,78%的语言错误率低于10个字符,资源丰富语言(训练音频≥10小时)的准确率覆盖达95%,低资源语言(音频<10小时)也有36%达到该标准。系统创新性地引入“自...
【关键词】语音识别,Meta,AI
苹果iOS26.2酝酿升级隔空投送:一次PIN配对,30天内随时分享(2025-11-05)
【摘要】 11月5日,IT之家讯,近日,苹果在iOS26.2首个开发者Beta测试版中计划升级隔空投送功能,新增基于PIN码的长期配对机制。用户可通过输入简短PIN码,在两台设备间建立持续30天的配对关系,期间设备靠近即可相互可见,无需反复设置“对所有人开放10分钟”的临时选项。当前该功能在Beta1版本中尚不可用,最终形态和发布时间可能变化。
【关键词】iOS,隔空投送,更新
微软宣布其首个自研图像生成模型MAI-Image-1已整合入Bing与Copilot,逐步减少对OpenAI的依赖(2025-11-05)
【摘要】 11月5日,IT之家讯,11月5日,微软宣布其首个自研AI图像生成模型MAI-Image-1已整合至BingImageCreator和CopilotAudioExpressions(欧盟暂除外)。该模型在生成食物、自然风景、艺术化光效及写实细节等图像方面表现突出,尤其在逼真光影效果和风景类图像生成上优于部分更大、更慢的模型。MAI-Image-1还将用于CopilotAudioExpressions的“故事模式“,为AI生成的音频故事配图。微软今年8月推出首批自研AI模型,包括MAI-Voice-1和...
【关键词】微软,图像生成,AI模型
微软承认Win11驱动安装流程存0x80070103错误,可能无法彻底修复(2025-11-04)
【摘要】 11月3日,IT之家讯,据Windows Latest报道,Windows 11系统长期存在的0x80070103驱动安装错误仍是反馈中心上报率最高的问题之一。微软在支持文档中承认该问题,并表示正采取措施减少其发生率,但可能无法彻底修复。反馈中心相关帖文获得约1000个赞,用户反映该错误导致系统重启变慢、启动延迟及应用程序运行迟缓。微软员工解释错误原因为系统重复安装已有内容,虽不影响正常使用但降低性能。微软已于10月发布补丁改进底层机制...
【关键词】Win11,驱动错误,微软
Canonical推出新版UbuntuLinux认证体系,助力技能验证与多元增收(2025-11-03)
【摘要】 11月3日,OSCHINA讯,Canonical在UbuntuSummit25.10线上活动上宣布推出“CanonicalAcademy”,推出全新徽章和认证体系,助力个人和企业验证开源技能。该平台的首批上线路线为系统管理员(SysAdmin)路线,包含四项考察Linux及Ubuntu实际操作能力的考试,合格者获数字徽章。考试模块化、自主节奏,今日先上线三门,“Linux终端使用”公开,“Ubuntu桌面使用”和“Ubuntu服务器使用”处于社区测试beta阶段。新认证体系是Canonica...
【关键词】Ubuntu认证,新版体系,技能验证
中国科大与字节发布MoGA长视频生成模型,突破国产视频生成技术(2025-11-03)
【摘要】 11月3日,OSCHINA讯,近日,中国科学技术大学与字节跳动即将联合发布端到端长视频生成模型,能直接生成分钟级、480p分辨率、24帧/秒的高质量视频,支持多镜头场景切换,实现国产视频生成技术在全球生成式AI竞赛中的关键突破。其核心创新底层算法MoGA专为解决长视频生成问题设计,可处理长达580Ktoken的上下文信息,降低计算成本。传统模型受限只能生成短片,而该模型能生成多镜头切换的“迷你短片”,拓展应用边界。MoGA模块化...
【关键词】长视频生成,MoGA,模型突破
Hugging Face发布huggingface_hubv1.0版本,开启开源机器学习新基础(2025-11-03)
【摘要】 11月3日,OSCHINA 讯,近日,Hugging Face正式发布基础库huggingface_hub的v1.0里程碑版本,旨在为未来十年的开源机器学习构建基础。此版本有多项重大更新与破坏性变更,将HTTP后端迁移至httpx,全面革新命令行界面(CLI),把hf_xet作为默认文件传输协议。旧命令被全新hf命令取代,采用“资源-动作”模式,还引入新功能,重构缓存管理命令,提供智能shell自动补全等。官方提供跨平台沙盒化安装程序,CLI功能内置于核心包。同...
【关键词】机器学习,开源库,版本更新
deepin 25成功适配瑞莎Dragon Q6A,开启高性能ARM桌面体验(2025-10-27)
【摘要】 10月27日,OSCHINA讯,近日,deepin社区宣布最新deepin25操作系统已成功适配瑞莎科技(Radxa)推出的DragonQ6A开发板,覆盖核心硬件驱动与系统功能,为开发者提供稳定软硬协同基础。瑞莎DragonQ6A是基于高通QCS6490处理器的高性能、低功耗嵌入式开发平台,主频最高2.7GHz,集成高通Adreno643GPU和高通Hexagon770NPU,支持多种扩展接口,采用1+3+4三丛集CPU设计,具备先进AI加速和多媒体处理能力。deepin25以易用性和美观界面著...
【关键词】适配,高性能桌面,生态
美团开源语音编解码方案LongCat-Audio-Codec(2025-10-27)
【摘要】 10月27日,OSCHINA讯,近日,美团LongCat团队正式开源专用语音编解码方案LongCat-Audio-Codec。该方案提供一站式Token生成器与还原器工具链,能将原始音频信号映射为语义与声学并行的token序列,实现高效离散化,再通过解码模块重构高质量音频,为SpeechLLM提供全链路音频处理支持。其开源平台有Github和HuggingFace。LongCat-Audio-Codec有三大创新设计:一是语义-声学双Token并行提取机制,采用“级联训练-并行推理”,兼顾...
【关键词】美团,语音编解码,开源
商汤科技与寒武纪达成战略合作,重点推进软硬件的联合优化(2025-10-27)
【摘要】 10月27日,OSCHINA讯,近日,商汤科技与中科寒武纪科技股份有限公司签署面向新发展阶段的战略合作协议,重点推进软硬件的联合优化,共同构建开放共赢的产业生态。双方发挥技术和产业资源优势,围绕国产化人工智能基础设施构建、垂直业务开拓与科技出海等方向开展深度合作,响应国家“人工智能 +”战略部署。结合商汤科技在大模型研发等方面的领先能力,以及寒武纪在智能计算芯片等方面的深厚积累,推动形成软硬协同的新一代人...
【关键词】商汤科技,寒武纪,软硬件优化
OPPO应用生态多维度助力全球开发者高效增长(2025-10-20)
【摘要】 10月20日,OSCHINA讯,近日,2025OPPO开发者大会(ODC25)应用生态分论坛上,OPPO推出“OPPO隐私安全智护体系”。该体系升级权限管理机制,助用户实现隐私透明可控与精细管理,平台还全面升级合作策略,为开发者提供全链路解决方案。在安全筑基方面,OPPO对“上架-下载-安装-运行”全链路优化,上架提前审核检测,下载简化流程,安装减少验证步骤。同时上线“OPPO隐私安全智护体系”,通过系统级安全控件保障高敏隐私数据安全...
【关键词】OPPO,安全底座,开发者增长
微软截图工具更新,支持即时标注功能 (2025-10-20)
【摘要】 10月20日,OSCHINA讯,近日,微软截图工具迎来重大更新,最新版本Snipping Tool v11.2508.28.0开始支持即时标注功能,并向所有用户推送。此次更新让用户无需保存截图或打开额外应用程序,即可直接对选定屏幕区域进行标注。用户通过Win+Shift+S快捷键进入截图模式后,截图工具不再自动保存截图,而是在选定区域下方显示浮动工具栏,提供绘图、高亮文本、插入选项、Bing反向图像搜索及发送至Copilot应用等功能,操作方式类似QQ和...
【关键词】截图工具,即时标注,浮动工具栏,,