【软件产业】巨人网络与清华开源DiaMoE-TTS方言语音合成框架(2025-10-22)
【摘要】 10月20日,OSCHINA讯,近日,巨人网络AILab与清华大学电子工程系SATLab研究团队联合发布多方言语音合成大模型框架DiaMoE-TTS,并全方位开源数据、代码和方法,以推动方言语音合成的公平与普惠。
【关键词】校企合作,框架,方言
【摘要】 10月20日,OSCHINA讯,近日,巨人网络AILab与清华大学电子工程系SATLab研究团队联合发布多方言语音合成大模型框架DiaMoE-TTS,并全方位开源数据、代码和方法,以推动方言语音合成的公平与普惠。
【关键词】校企合作,框架,方言
【摘要】 10月22日,OSCHINA讯,近期国家安全机关破获美国重大网络攻击案,掌握美国家安全局攻击中国国家授时中心铁证。2022年3月25日起,美方利用手机短信服务漏洞控制工作人员手机窃取敏感资料;2023年4月18日起,多次利用窃取凭证入侵计算机;2023年8月至2024年6月,部署平台、启用武器攻击内部网络系统。国家互联网应急中心报告显示美方攻击特点及工具情况,中方已采取防护措施。
【关键词】网络攻击,授时中心,窃密工具
【摘要】 10月21日,OSCHINA讯,近日,贝恩公司与亚马逊云科技联合发布《中国软件企业出海热点观察》。分析中国软件出海势能,给出4个成功要素及行动建议。技术上,到2027年AI软硬件整体市场规模将达7800亿至9900亿美元,平均增速40% - 55%,应用程序和交易平台平均增速60% - 85%。市场角度,北美是重点关注地区,新兴市场增长潜力强劲。还指出中国软件企业出海的四大关键成功要素及面临的挑战。
【关键词】AI软硬件,中国软件出海,市场规模
【摘要】 10月21日,OSCHINA讯,近日,阿里旗下通义千问宣布正式推出Qwen Chat Memory功能,用户可通过chat.qwen.ai直接体验。该功能让Qwen迎来“长记忆”时代,能在多轮对话中记住用户偏好、习惯及过往交流内容,提供更具连续性和个性化的响应,标志着通义千问在多轮对话智能化方向迈出关键一步,将推动其成为更贴近用户长期需求的智能助手。
【关键词】通义千问,长记忆,智能助手
【摘要】 10月20日,OSCHINA讯,近日,巨人网络AILab与清华大学电子工程系SATLab研究团队联合发布多方言语音合成大模型框架DiaMoE-TTS,并全方位开源数据、代码和方法,以推动方言语音合成的公平与普惠。
【关键词】校企合作,框架,方言
【摘要】 10月20日,OSCHINA讯,近日,字节跳动发布人脸理解与生成的视觉-语言模型FaceCLIP,通过文本提示和参考图像生成保持身份一致性的多样化人脸图像,在多模态AI人脸语义处理领域有新突破。
【关键词】字节跳动,FaceCLIP,人脸生成
【摘要】 10月17日,OSCHINA讯,近日,高性能JavaScript运行时Bun发布1.3版本,这是其迄今最重大更新,标志其从单纯运行时工具变为功能完备的全栈JavaScript开发平台。核心突破是将前端开发能力深度整合进运行时,新增对前端开发一级支持,开发者可直接运行HTML文件,执行特定命令,Bun会自动识别并启动含热模块替换等功能的开发服务器。其开发服务器并非简单静态文件服务器,集成了原生转译与打包能力,能让开发者同进程处理前后端代码...
【关键词】Bun,JavaScript,开发平台
【摘要】 10月17日,OSCHINA讯,近日,中国电子技术标准化研究院开发的国内首个标准化领域垂直大模型“同道”互联网版正式上线,旨在解决标准检索、撰文、应用等难题。它有四大核心功能模块,覆盖标准全生命周期,以新机制提供标准信息。“同道”支持多格式、多模态交互,使用便捷。
【关键词】同道大模型,标准化工作,垂直领域
【摘要】 10月16日,OSCHINA讯,美国总统特朗普宣布从11月1日起对中国输美商品征额外100%关税,还对所有“关键软件”实施出口管制,开源软件也受波及。2021年NIST指出,若开源软件执行“行政令关键”功能,就属于“行政令关键”范畴,这类软件类型多样,且实践中常被整合进其他产品。
【关键词】美国,软件出口管控,开源软件
【摘要】 10月16日,OSCHINA讯,近日,在vivo开发者大会上,蓝心3B端侧多模态推理大模型正式发布。这是行业首个在30亿参数规模下,集成语言理解、多模态处理等五大核心能力的“One Model”,标志终端侧AI进入多能力融合新阶段。
【关键词】vivo,蓝心3B,多模态大模型
【摘要】 10月15日,OSCHINA讯,近日,商务部发布2025年第61号公告对部分境外稀土相关物项实施出口管制,此次公告有两个细节引发热议。一是公告附件首次采用WPS格式,此前多为doc或pdf格式;二是申请文件须用中文提交。受此影响,金山软件股价一度暴涨18%。
【关键词】商务部公告,WPS格式,金山软件
【摘要】 10月15日,OSCHINA讯,近日,ClouGence公司推出的CloudCanal免费社区版v5.2.0.0发布。该工具是全自研、可视化、自动化数据迁移同步工具,支持60 +款数据库等数据互通。新版本支持SaaS全托管模式,开放上海、深圳两区域,还支持多种数据源通过SSH隧道连接,开放多条新链路。
【关键词】CloudCanal,数据迁移,SaaS托管
【摘要】 10月14日,OSCHINA讯,近日,中国农业大学发布神农大模型3.0,这是全国覆盖农业学科和场景最全的大模型,具备农业知识问答、生产决策推理等功能,标志我国农业人工智能发展迈入新阶段。该模型以“小体积、高智能、低成本”为突破,推出多版本,算力提升且性能损失低。还推出智能体平台和专用一体机,已推广应用。
【关键词】神农大模型,农业AI,智能体平台
【摘要】 10月14日,OSCHINA讯,近日,腾讯优图实验室开源企业级通用文本表示模型Youtu-Embedding,可胜任文本检索等六大主流任务,在自然语言处理多任务上性能卓越。模型权重等已开源,20亿参数版本在HuggingFace发布。其有核心优势,如在CMTEB上高分夺冠,训练流程精密,微调框架创新,数据工程精细化。
【关键词】腾讯优图,开源,文本模型
【摘要】 10月13日,OSCHINA讯,近日,Volcano v1.13版本正式发布,为用户提供更完善的云原生批量计算解决方案。新版本新增对大模型推理LWS的支持,增强定时任务管理能力,提供灵活网络拓扑发现机制,提升对主流AI计算框架兼容性,改进混部架构。还引入Cron Volcano Job,支持周期性批量计算任务。未来将持续扩展生态系统集成能力。
【关键词】云原生,大模型调度,批量计算
【摘要】 10月13日,OSCHINA讯,近日,北京航空航天大学软件学院借中国研究生操作系统创新大赛平台,牵头组织“智能时代的开源操作系统”专题研讨会,汇聚产学研力量探讨智能时代操作系统发展。openKylin社区技术委员会主任吴庆波分享《AI OS的思考与探索》,介绍OS发展历程,探讨AI OS技术路线及openKylin探索。众多专家也分享见解。openKylin愿景是与AI深度融合,构建原生支持AI环境,创新端侧体验,加强软硬协同,构建开发者生态。
【关键词】操作系统,产学研,协同发展
【摘要】 10月11日,OSCHINA讯,智谱上线GLM系列最新版本GLM-4.6。该版本在寒武纪国产芯片上实现FP8+Int4混合量化部署,开创国产芯片大模型本地化运行可行路径,降低成本且保持精度;基于vLLM推理框架,摩尔线程新一代GPU可稳定运行该模型,凸显MUSA架构优势。GLM-4.6与国产芯片组合将通过智谱MaaS平台服务大众和企业,未来将优化性能与效率。此外,智谱同步升级GLMCodingPlan,新增多种能力与套餐。
【关键词】本地化,国产芯片,适配升级
【摘要】 10月11日,OSCHINA讯,Fluxv2.7.0正式发布。此版本标志着镜像更新自动化功能正式GA,引入新API支持复杂源组合与拆分。为Flux控制器增添多项功能,如监控引用变更、扩展依赖评估、支持跟踪调和过程。生态系统方面,新版本Flux Operator集成镜像自动更新,支持Git Less Git Ops工作流。部分API升级为稳定版,image-automation-controller支持AzureDevOps仓库认证。
【关键词】功能升级,镜像更新,自动化
【摘要】 10月10日,OSCHINA讯,近日,Dante Cloud 3.5.6.2发布,这是国内首个支持阻塞式和响应式融合的微服务。它是采用领域驱动模型设计思想,基于Spring生态全域开源技术的云原生微服务基座,高度模块化与组件化,支持物联网设备认证与国家三级等保,有安全体系,还能实现一套代码两种架构灵活切换,秉持“简洁、高效、包容、务实”理念,关注系统多方面质量与能力,不过多堆叠业务功能。
【关键词】微服务,融合架构,云原生
【摘要】 10月10日,OSCHINA讯,近日,中国信通院发布“方升”大模型基准测试体系3.0,新增模型基础属性测试,前瞻性布局未来高级智能测试,深化重点行业场景化评测。为支撑该体系,将从扩容测试数据资源、研究应用先进测试方法、构建新一代智能评测基座三方面强化评测基础设施。2024年起每两月开展评测活动,已完成9轮,最新一轮对141个大模型和7个智能体评估,采用多维度复合评估体系。
【关键词】方升体系,大模型评测,基准测试
【摘要】 10月9日,OSCHINA讯,近日,“91助手”已全面停止所有服务,客户端无法启动,手机连接等所有功能及官网、客服渠道均关闭,用户数据将永久丢失。“91助手”最早于2007年由网龙团队开发,原名“91手机助手”,早期凭“越狱”等功能走红,2009年拓展至安卓平台,2013年巅峰时用户超1亿、下载量破100亿,同年百度19亿美元收购91无线,2020年部分功能停运,如今彻底停服。
【关键词】91助手,越狱神器,停服
【摘要】 9月30日,OSCHINA讯,近日,上交所官网显示摩尔线程科创板IPO项目过会,保荐机构为中信证券。从申请受理到过会不到3个月,创科创板纪录,拟募资80亿元用于AI训练芯片等研发。摩尔线程2020年创立,专注全功能GPU芯片设计,创始人张建中曾任职英伟达,组建了优秀团队,还有众多知名投资机构加持。
【关键词】摩尔线程,GPU芯片,科创板上市
【摘要】 9月30日,OSCHINA讯,近日,跨平台AI桌面应用Cherry Studio v1.6.0正式发布。此版本接入全新AI SDK并重构底层框架,性能大幅提升。新增诸多实用功能,如集成新SDK和提供商、增强本地OCR、开放API服务等;优化核心体验与效率,像编辑器、文件处理、交互细节等方面;修复上百个已知问题,增强稳定性和兼容性;还引入新工具链提升开发效率。
【关键词】版本升级,AI客户端,开源升级
【摘要】 9月29日,OSCHINA讯,近日,京东云在JDD 2025大会上发布企业级智能体平台JoyAgent 3.0和AI编程平台JoyCode 2.0,提出“智能体 + 代码平台”双轮驱动范式,推动AI融入企业系统实现智能化升级。JoyAgent 3.0已开源且登顶GAIA全球榜单,内置DataAgent可分析多模态数据、对接核心系统;JoyCode 2.0首创“规约编程”,能自动生成合规代码,缩短开发周期,其IDE可实现开发即部署,两平台协同构建闭环,已在京东内部支撑业务。
...
【关键词】京东云,智能体平台,编程平台
【摘要】 9月29日,OSCHINA讯,近日,开源鸿蒙6.0 Release版本正式发布。该版本在应用框架、媒体能力、系统安全等关键领域实现多项技术突破,提升系统可用性与开发效率,生态适配更友好。应用开发上优化ArkUI组件、新增ArkTS语言能力;媒体能力新增低时延耳返等;图形系统有中西文间距调整等功能;系统安全完善防护体系;测试框架也得到升级。
【关键词】开源鸿蒙,系统升级,技术突破
【摘要】 9月28日,OSCHINA讯,近日,科大讯飞发布星火化学大模型Spark Chemistry - X1 - 13B和文生音频模型AudioFly。前者基于星火X1基座,为化学任务深度优化,采用创新机制提升化学知识问答等任务表现,超越主流通用模型;后者能根据文本合成音效,以44.1kHz采样率生成高质量音频,采用潜在扩散模型架构,训练数据丰富,在多种场景表现良好且部分性能更优。
【关键词】科大讯飞,化学大模型,文生音效模型
【摘要】 9月26日,OSCHINA讯,近日,可灵AI推出最新视频生成模型可灵2.5 Turbo,较之前版本降价近30%。视频生成大模型订阅费原较高,可灵AI定价分层次,相比海螺AI最高1399元有优势。百度曾率先降价,称因算力架构和工程优化,但投入仍高。行业专家认为视频生成是巨头基本能力,快手推理算力毛利率已转正。各大厂商定价策略有差异,可灵AI是唯一公开营收的大模型厂商,二季度营收超2.5亿,2.5 Turbo多方面提升,还参与电影节探讨技术应...
【关键词】可灵AI,可灵2.5,Turbo,视频生成模型
【摘要】 9月26日,OSCHINA讯,近日,百度智能云千帆宣布开源全新视觉理解模型Qianfan-VL,包含3B、8B和70B三个尺寸版本,针对企业级多模态应用场景深度优化。该模型基础通用能力出色,对OCR和教育垂直场景等高频需求专项强化。即日起至10月10日,企业用户和开发者可在百度智能云千帆平台免费体验8B、70B模型。它基于开源模型开发,在百度自研昆仑芯P800上完成计算,具备多尺寸可选、有思考推理能力、OCR与文档理解能力增强三大特点。
【关键词】百度智能云,视觉理解模型,高频需求
【摘要】 9月25日,IT之家讯,近期多名用户投诉QQ音乐、网易云、酷狗等音乐App“滥用”自动续费机制,用户常在收到扣款消息后才发现掉入消费陷阱,维权金额不一。如南京徐女士、嘉兴张先生都遭遇类似问题,平台未显著告知规则和关闭路径,且有的未主动通知扣费。消费保数据显示,2022-2025年(截至9月16日)相关投诉13540件,主流平台投诉量占比近八成,涉及超780万元,今年前三季度投诉量创新高,部分平台较去年增幅大。
【点评...
【关键词】音乐平台,自动续费,投诉
【摘要】 9月25日,OSCHINA讯,近日,小红书将内部办公APP“REDcity”升级为“hi”并启用新Logo。“hi”致力于打造优质工作实践、支持组织管理与社区文化协同的办公平台。此次升级亮点是新增AI助手“hibo”,能生成信息总结、联网搜索与深度思考,快速响应工作需求。还具备文档便捷分享、查阅及多种附件预览功能,也有时间管理与会议邀约等功能,未来还会有其他应用入驻,小红书正融合社区思维与AI技术构建办公生态。
【关键词】小红书,AI办公,hi
【摘要】 9月24日,OSCHINA讯,近日,面壁智能与清华大学深圳国际研究生院人机语音交互实验室联合推出新型语音生成模型VoxCPM。该模型参数尺寸为0.5B,能在自然度等关键指标上达行业领先水平。通过零样本声音克隆技术,用极少数据实现个性化语音合成。已在多平台开源并提供体验平台,在权威评测榜表现出色,实时因子满足实时交互需求,音质和情感表达佳,技术架构融合多种技术提升语音表现力。
【关键词】面壁智能,VoxCPM,语音生成
【摘要】 9月24日,OSCHINA讯,近日,美团发布基于混合专家架构的大型推理模型LongCat-Flash-Thinking,总参数量达5600亿,能按需动态激活186亿至313亿参数,平均约270亿参数。该模型在逻辑、数学、编程及Agent任务表现出色,在AIME25等任务上可减少64.5%的token消耗达到顶级准确率。在多个基准测试中接近领先模型水平,模型权重已按MIT许可证开源,还提供聊天模板并上线官方聊天网站。
【关键词】美团,推理模型,LongCat
【摘要】 9月23日,OSCHINA讯,近日,中科院自动化所李国齐与徐波团队发布全球首款大规模类脑脉冲大模型SpikingBrain1.0。它能以超100倍速度处理400万token超长文本,仅需2%数据量。该模型针对主流Transformer架构计算复杂度高、处理长文本耗时耗能的短板,模拟人脑神经元工作方式,采用混合线性注意力架构降低复杂度,引入自适应阈值脉冲神经元节省能耗,还开发模型转换技术降成本,技术细节和代码已开源。
【关键词】类脑模型,大模型,突破
【摘要】 9月23日,OSCHINA讯,近日,OPPO在ColorOS 16流畅技术沟通会上宣布推出Android首个跨级融合编译技术“繁星编译器”。这是ColorOS 16全新自研编译技术,从底层重构Java代码与专属硬件编译链路,实现硬件级优化,提升编译效率。它能显著提升系统流畅度,在API性能、应用启动速度和响应效率方面优化明显,让千元机等中低端设备也能有接近旗舰的流畅体验,还与极光引擎、潮汐引擎协同提升全场景、全机型持久流畅性。
【点评...
【关键词】OPPO,繁星编译器,编译技术
【摘要】 9月22日,OSCHINA讯,北京深度逻辑智能科技有限公司近日推出首个完全开放、端到端的语音语言模型研究框架LLaSO。该框架为社区提供统一、透明且可复现的基础设施,包含开源的数据、基准和模型。其有LLaSO-Align、LLaSO-Instruct、LLaSO-Eval三个核心开源组件,还基于框架数据训练了参考模型LLaSO-Base,验证了框架有效性。
【关键词】逻辑智能,LLaSO,语音大模型
【摘要】 9月22日,极客网讯,近日,华为坤灵秋季新品发布会在上海举办,华为常务董事汪涛发布“4+10+N”中小企业智能化方案,助力中小企业打通迈向智能世界“最后一公里”,还发布“百&万计划”发展分销伙伴。当前AI成企业发展主引擎,中小企业智能化转型面临挑战。
【关键词】华为,中小企业,智能化方案
【摘要】 9月19日,OSCHINA讯,近日,腾讯大前端领域Oteam推出基于Kotlin Multiplatform的跨端综合解决方案Kuikly,支持多平台。目前该团队已完成对“液态玻璃”的首阶段适配并开源。适配时未引入新组件,通过简洁视图属性扩展为现有组件添加效果,如在iOS平台用一行代码即可启用,且适配工作是在框架渲染层和DSL驱动层扩展,为开发者提供低成本方案。
【关键词】腾讯,Kuikly,液态玻璃
【摘要】 9月19日,OSCHINA讯,国家网络安全宣传周分论坛上,相关部门发布《AI时代网络安全产业人才发展报告(2025)》。报告显示,2025年全球网络安全人才缺口升至480万,同比增长19%,网络安全运营类岗位需求居首,企业青睐有经验与实战能力者。全国792所高校开网络安全专业,多数新增AI安全课程、建成实训室。报告还列出AI驱动的网络安全岗位图谱,给出多方发展建议。此外,我国物流供应链领域人工智能应用渗透率较高。
【点...
【关键词】网络安全,人才缺口,AI安全
【摘要】 9月18日,OSCHINA讯,近日,清华大学携手中国软件评测中心发布《2025大模型服务性能排行榜》,PPIO在DeepSeek-R1-0528的吞吐测试中排名第一。该榜单从延迟、吞吐等指标评测,保障客观公正,覆盖多个代表性模型,PPIO在20余家MaaS供应商中表现出色,在部分模型吞吐与延迟性能上进入前五。
【关键词】大模型服务,PPIO,吞吐测试
【摘要】 9月18日,OSCHINA讯,近日,阿里巴巴通义实验室推出端到端语音识别大模型FunAudio-ASR,专为解决企业落地难题,有高精度通用识别能力,创新Context增强模块优化工业场景关键问题,提升高噪声环境下识别准确率,降低幻觉率。
【关键词】阿里巴巴,语音识别,大模型