昆仑万维发布Matrix-Game2.0国产开源Genie3(2025-08-12)
【摘要】 8月12日,OSCHINA讯,昆仑万维推出自研世界模型Matrix系列升级版「Matrix-Game2.0」,这是业内首个通用场景实时长序列交互式生成世界模型开源方案。相较于上一版本,2.0版本侧重低延迟、高帧率长序列交互性能,能以25FPS在复杂场景稳定生成连续视频,时长可扩展至分钟级,提升连贯性与实用性,且保持对物理规律和场景语义精准理解,支持用户自由探索构建虚拟环境。它提出全新视觉驱动交互世界建模方案,摆脱传统语言提示生成模...
【关键词】昆仑万维,开源,图像
智谱AI开源视觉推理模型GLM-4.5V(2025-08-12)
【摘要】 8月12日,OSCHINA讯,智谱AI发布并开源新一代旗舰视觉推理模型GLM-4.5V。该模型基于MOE架构,总参数量达106B,激活参数量12B,支持视频、图像、文本、文件输入,输出文本,上下文窗口为64K。它基于智谱新一代旗舰文本基座模型GLM-4.5-Air,延续GLM-4.1V-Thinking技术路线,在41个公开视觉多模态榜单中综合效果达同级别开源模型SOTA性能,涵盖多种常见任务。模型由视觉编码器、MLP适配器和语言解码器三部分组成,支持64K多模态...
【关键词】智谱,视觉推理,处理效率
百度智能云推出全球首批AI数字员工(2025-08-11)
【摘要】 8月11日,OSCHINA讯,近日,百度智能云宣布推出全球首批AI数字员工,涵盖营销经理、还款助理等核心业务职能。百度副总裁阮瑜表示,大模型飞速进化推动AI从Copilot形态向Agent及Agentic方向深化,数字员工作为新型“劳动者”将推动组织生产力变革。这些数字员工有四大升级,即“智能化大脑”,以端到端语音语义大模型驱动业务闭环,实现真人级交互体验,语音识别准确率达98%,对话延迟降至1秒内;“真人级形象”,用4D扫描技术...
【关键词】数字员工,百度智能云,智能化升级
华为宣布CANN全面开源开放(2025-08-11)
【摘要】 8月11日,OSCHINA讯,近日,在昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链也全面开源,支持用户自主深度挖潜和自定义开发,以加速开发者创新,提升昇腾易用性。徐直军提到华为AI战略核心是算力且坚持昇腾硬件变现,峰会还探讨构建开源开放的昇腾生态,发起《CANN开源开放生态共建倡议》。CANN是华为面向AI的端云一致异构计算架构,承上启下,是提升昇腾...
【关键词】华为,CANN,开源开放
智谱推出Zread.ai开发效率工具,搭载GLM-4.5(2025-08-08)
【摘要】 8月8日,OSCHINA讯,近日,智谱推出基于大模型的开发效率工具Zread.ai,旨在解决开发者接手旧项目、文档撰写和理解开源项目的痛点,提升开发效率。其核心功能有源项目深度学习、快速接手历史代码库、构建团队知识协作系统,可通过输入GitHub仓库链接生成项目Guide,梳理项目结构等。该工具选用GLM-4.5作为核心底座,此模型在代码理解等多方面表现出色,能准确识别代码关系,输出稳定性高,适合复杂代码场景。使用Zread.ai操作...
【关键词】开发工具,效率提升,降低门槛
阿里中标工商银行AI编程项目(2025-08-08)
【摘要】 8月8日,OSCHINA讯,近日,中国工商银行公布《软件开发中心智能研发平台》中标结果,阿里云凭借通义灵码独家中标,将为该平台提供代码补全、代码问答及单测智能体等服务。此前工商银行已将阿里Qwen模型用于智能风控。此项目是工商银行多部门对阿里云通义灵码1年期订阅,用户数量5000个。虽百度、华为等为推荐供应商,但工商银行最终选阿里云。通义灵码是阿里云AI编程助手,2024年以来中标多个类似项目,其基于阿里云自研Qwen模...
【关键词】阿里云,通义灵码,工商银行
腾讯开源文档理解与语义检索框架WeKnora(2025-08-07)
【摘要】 8月7日,OSCHINA讯,近日,腾讯开源文档理解与语义检索框架WeKnora(维娜拉),这是为复杂异构文档场景打造的智能问答解决方案。它采用现代化模块化设计,有文档处理、知识建模、检索引擎、推理生成、交互展示五个核心模块,构建了完整流水线。基于大语言模型,融合多种技术打造端到端文档问答流程。具有多模态认知、模块化RAG流水线、精准推理与可信决策、灵活适配生产环境、开箱即用交互体验等特性,适用于企业级文档问答场...
【关键词】WeKnora,文档理解,语义检索
小红书开源基于VLM的文档解析模型dots.ocr(2025-08-07)
【摘要】 8月7日,OSCHINA讯,近日,小红书发布并开源了基于视觉语言模型(VLM)的文档解析模型dots.ocr,支持多语言识别、布局检测与内容识别一体化处理。该模型在单一视觉语言模型中统一布局检测和内容识别,还能保持良好阅读顺序。虽是17亿参数的“小模型”,但在多个benchmark上获得匹配超大参数量闭源模型的业界领先(SOTA)性能。其亮点包括在OmniDocBench上三项任务均获SOTA表现、支持多语言填补开源社区空白、可灵活切换任务、...
【关键词】文档解析,视觉语言,开源
字节Seed发布实验性扩散语言模型Seed Diffusion Preview(2025-08-06)
【摘要】 8月6日,OSCHINA讯,近日,字节跳动Seed团队推出实验性扩散语言模型Seed Diffusion Preview,以结构化代码生成为实验领域,验证离散扩散技术路线作为下一代语言模型基础框架的可行性。实验结果显示,该模型代码推理速度达2146 tokens/s,相比同等规模自回归模型提升5.4倍,在多个业界基准上性能与优秀自回归模型相当,且在代码编辑等任务上实现超越。项目页面和体验链接已公布。官方表示,该模型验证了离散扩散模型的推理加速...
【关键词】扩散模型,代码生成,推理加速
企查查开源弹窗组件库QuickDialog(2025-08-06)
【摘要】 8月6日,OSCHINA讯,近日,企查查将其自研的鸿蒙弹窗组件库“QuickDialog”开源,并上线至OpenHarmony三方库中心仓。这是鸿蒙生态首个支持“弹窗堆栈暂存能力”的非侵入式弹窗解决方案,有望成为管理复杂弹窗场景的最佳实践之一。QuickDialog以“可维护、可拓展”为理念,具备弹窗堆栈暂存、无侵入式控件创建等核心技术能力。在企查查鸿蒙App开发中已全面替代传统方案,改善用户体验。开发者接入无需改动现有结构,能降低成本...
【关键词】开源,弹窗组件库,鸿蒙生态
生命周期不足三个月,Windows10市占率急剧下降(2025-08-05)
【摘要】 8月5日,OSCHINA讯,按微软计划,Windows 10主流支持将于2025年10月14日结束,虽会提供一年免费更新,但许多用户已开始找替代方案。Statcounter数据显示,2025年7月Windows 10市场份额急剧下降,从与Windows 11平分秋色到低于Windows 11。当月其份额从47.98%降至42.99%,降了4.99个百分点,同比降22个百分点;而Windows 11份额从47.98%增至53.39%,增5.41个百分点,同比增22.56个百分点。目前受支持的Windows 10和11占超96%市...
【关键词】Windows,市占率,技术迭代
阶跃星辰新一代基础大模型Step3正式开源,专注多模态推理(2025-08-05)
【摘要】 8月5日,OSCHINA讯,既然你,阶跃星辰正式开源最新一代基础大模型Step3。该模型采用专家混合(MoE)架构,总参数量321B,激活参数量38B,为企业和开发者提供性能与成本均衡的推理方案,专注于多模态推理,端到端设计最小化解码成本,在视觉语言推理任务表现出色。技术上采用自研MFA注意力机制和AFD系统架构,还开源专用通信库StepMesh。在多个基准测试中优于同类开源模型,社区测试展现不错能力,vLLM项目支持并报告高吞吐量。...
【关键词】Step3大模型,多模态推理,开源
MOSS-TTSD开源:百万小时训练打造AI播客新王者(2025-08-04)
【摘要】 8月4日,OSCHINA讯,近日,由清华大学语音与语言实验室联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(TexttoSpokenDialogue)正式开源。该模型基于Qwen3-1.7B-base续训练,以约100万小时单说话人语音数据和40万小时对话语音数据为基础,采用离散化语音序列建模方法,实现中英双语高表现力对话语音生成,适用于AI播客等长篇内容创作。其核心创新XY-Tokenizer采用双阶段多任务学习,能压缩语音信号并保留信息。模型支持...
【关键词】语音模型,播客,开源
360集团宣布纳米AI“多智能体蜂群”上线(2025-08-04)
【摘要】 8月4日,OSCHINA讯,近日,360集团正式宣布纳米AI完成品牌焕新,升级为“多智能体蜂群”,成为全球首个达到L4级的智能体系统。它不再是单个AI“单兵作战”,而是让数万只专业AI自动组队、分工、协作,能一口气完成上千步复杂任务,20分钟就能做出10分钟电影级大片,进入“成果直接交付”时代。L4级智能体如同人类雇佣团队工作,可实现能力无限扩展。纳米AI创造了全新「蜂群协作框架」,多个推理型智能体可灵活拉群、多层嵌套、...
【关键词】纳米AI,多智能体蜂群,L4级智能体
腾讯开源“短视频理解模型”ARC-Hunyuan-Video-7B(2025-08-01)
【摘要】 8月1日,OSCHINA讯,近日,腾讯发布开源多模态模型ARC-Hunyuan-Video-7B,专为真实世界短视频“结构化理解”设计,具备跨模态推理和时间感知能力,旨在解决常见短视频挑战,实现深度结构化理解。
【关键词】短视频,理解模型,开源
豆包图像编辑模型3.0发布(2025-08-01)
【摘要】 8月1日,OSCHINA讯,近日,火山引擎宣布正式发布豆包图像编辑模型3.0、豆包同声传译模型2.0以及豆包大模型1.6系列全新升级版本。同时,火山引擎持续优化AI云原生全栈服务,开源扣子核心能力,发布多个模型服务和工具产品,为企业和开发者构建Agent、落地AI夯实基础设施。
【关键词】豆包模型,图像编辑,同声传译
阿里巴巴1688发布“AI版”App与“88查”(2025-07-31)
【摘要】 7月31日,OSCHINA讯,近日,阿里巴巴旗下B2B批发平台1688正式发布多项AI新品和升级举措,旨在通过人工智能技术全面赋能中小企业,提升采购效率。此次发布的核心亮点包括推出全新的“1688AI版”App、上线免费企业查询工具“88查”,并对现有“阿里巴巴1688”App进行全面AI化升级。
【关键词】中小企业,采购,数字化
商汤发布“日日新SenseNova V6.5”大模型体系(2025-07-31)
【摘要】 7月31日,OSCHINA讯,近日,商汤科技在WAIC2025上发布“日日新SenseNova V6.5”大模型体系,其推理和多模态能力超越多个主流模型,性价比提升3倍。
【关键词】商汤科技,大模型,性价比
国内首个农业智能大模型上线,每亩地增收可达200元(2025-07-30)
【摘要】 7月30日,OSCHINA,近日,中国中化集团推出国内首个“农业种植综合大模型”。该模型依托全国数百座农业技术服务中心,整合超千万条农业知识资源,为农业生产提供强大支撑。其贯穿“耕、种、管、收”整个过程,能高效处理复杂任务。农艺师通过手机或平板就能线上智能决策,线下为农民提供贴身服务。农民可实时监测作物生长、土壤湿度、气象和病虫害等情况,获取如“每亩需要多少肥料、何时浇水”等精准建议。
【关键词】农业智能大模型,农业种植,农民增收
蚂蚁inclusionAI团队发布Ming-lite-omni v1.5(2025-07-30)
【摘要】 7月30日,OSCHINA讯,近日,蚂蚁集团inclusionAI团队发布全面升级版全模态模型Ming-Lite-Omniv 1.5。该模型基于Ling-lite-1.5构建,总参数量达203亿(其中MoE部分活跃参数为30亿),在图像-文本理解、文档理解、视频理解、语音理解与合成、图像生成与编辑等全模态能力上显著提升。其模型架构参考Ming-lite-omni v1版本,升级Visionhead支持参考图特征输入以增强图像编辑人物和场景一致性。
【关键词】蚂蚁集团,Ming-lite-omni,v1.5,全模态模型
昆仑万维开源多模态统一预训练模型Skywork UniPic(2025-07-29)
【摘要】 7月29日,OSCHINA消息,近日,昆仑万维正式推出并开源采用自回归路线的多模态统一预训练模型Skywork UniPic。该模型在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力,基于大规模高质量数据端到端预训练,通用性与可迁移性良好。
【关键词】昆仑万维,模型,图像
豆包App视觉推理能力升级,图片分析支持深度思考(2025-07-29)
【摘要】 7月29日,OSCHINA讯,近日,豆包App在视觉推理领域迎来重大升级,其图片分析功能现支持深度思考模式。用户在该模式下拍摄或上传图片,豆包可进行放大、裁剪等精细处理,还支持边想边搜的图片搜索功能,提升搜索结果准确性。
【关键词】豆包App,视觉推理,图片分析
字节跳动AI Agent平台扣子拥抱开源(2025-07-28)
【摘要】 7月28日,OSCHINA讯,近日,字节跳动旗下AI Agent开发平台扣子(Coze)宣布正式拥抱开源。扣子旗下有「扣子空间」、「扣子开发平台」、「扣子罗盘」及Eino四款子产品,目前扣子开发平台(Coze Studio)与扣子罗盘(Coze Loop)已在Apache 2.0许可证下开源。Coze Studio是一站式AI Agent可视化开发工具,开源核心功能有完整工作流引擎,可轻松编排复杂业务逻辑;插件核心框架,能将第三方API或私有能力封装成插件;开箱即用的开...
【关键词】AI,开源平台,扣子
阶跃星辰发布最强开源多模态推理模型Step3(2025-07-28)
【摘要】 7月28日,OSCHINA讯,近日,阶跃星辰宣布发布新一代基础大模型Step3,这是其首个全尺寸、原生多模态推理模型,主打多模态推理。该模型在国产芯片32K上下文推理效率最高可达DeepSeek R1的300%,在英伟达H800芯片上推理效率提升70%以上,将于7月31日向全球开源。
【关键词】阶跃星辰,Step3,多模态推理模型
Qwen3系列模型迎来新第三方部署和价格特惠(2025-07-25)
【摘要】 7月25日,OSCHINA讯,阿里巴巴的Qwen3系列模型近期在多个平台获得部署并开启价格特惠。Cerebras宣布推出Qwen3-235B模型,推理速度达每秒1500个token,可进行有限制免费体验。阿里云通义灵码IDE集成Qwen3-Coder并去掉原有的DeepSeek模型。GMI inference cloud上线Qwen3 Coder 480B A35B Instruct FP8版本,输入定价1.00美元/M Tokens,输出定价2.00美元/M Tokens。阿里云百炼平台对Qwen3-Coder-Plus进行为期一个月限时降价,并...
【关键词】系列模型,第三方部署,价格特惠
周鸿祎:大模型降低攻击门槛,人人皆可“注入攻击”(2025-07-25)
【摘要】 7月25日,OSCHINA讯,在2025中国互联网大会上,360集团创始人周鸿祎剖析了人工智能时代网络安全面临的全新挑战,着重指出大模型带来三大安全风险。一是大模型的“幻觉”问题,在工业生产等关键领域,其错误判断危害成倍放大;二是大模型降低网络攻击门槛,非编程人员可通过自然语言交互编写程序,诱导大模型泄露企业机密文件的“注入攻击”门槛也随之降低;三是国家级高级威胁攻击智能化升级,黑客将能力经验嵌入大模型,未来...
【关键词】大模型,网络安全,注入攻击
蜻蜓FM开源SmartXPlayer音频播放组件(2025-07-24)
【摘要】 7月24日,OSCHINA讯,近日,蜻蜓FM研发的音频播放组件“SmartXPlayer”开源并上线OpenHarmony三方库中心仓。这是一款专为鸿蒙多端场景打造的音频播放引擎,基于鸿蒙系统分布式能力和多线程架构,能提供高性能、易集成的音频播放能力,助力开发者构建优质音频播放体验。
【关键词】蜻蜓FM,SmartXPlayer,音频播放
昆仑万维正式上线音乐模型Mureka V7(2025-07-24)
【摘要】 7月24日,OSCHINA讯,昆仑万维宣布推出最新音乐模型Mureka V7以及全新音频模型Mureka TTS V1(支持Voice Design音色设计能力)。Mureka V7被形容为“24小时不打烊的私人录音棚”,只需输入主题、歌词和风格,两分钟就能生成完整音乐作品。
【关键词】昆仑万维,音乐模型,提升
首个基于AI的恶意软件LameHug现身窃取Windows设备数据(2025-07-23)
【摘要】 7月23日,OSCHINA讯,科技媒体BleepingComputer报道新型恶意软件LameHug出现,它利用阿里开源的Qwen2.5-Coder-32B-Instruct大型语言模型,针对Windows10和Windows11设备窃取数据。LameHug用Python编写,依赖HuggingFaceAPI与QwenLLM交互,通过特定提示词动态生成窃取数据的指令。
【关键词】恶意软件,AI,LameHug
我国网民规模达11.23亿人互联网普及率79.7%(2025-07-23)
【摘要】 7月23日,OSCHINA讯,近日,中国互联网络信息中心(CNNIC)发布第56次《中国互联网络发展状况统计报告》。截至6月,我国网民规模达11.23亿人,互联网普及率达79.7%,意味着越来越多不同群体共享数字发展成果。报告显示“十四五”期间我国互联网建设成就显著,新型信息基础设施加速布局,互联网基础资源持续丰富,为互联网普及和数字经济发展提供了坚实支撑。互联网普惠深入推进,60岁及以上银发网民规模达1.61亿人、农村网民规...
【关键词】网民规模,互联网普及,数字发展
北京上半年工业和信息软件业增加值突破9000亿元(2025-07-22)
【摘要】 7月22日,人民网讯,近日,从北京市经济和信息化局2025上半年北京市工业和信息软件业经济运行新闻发布会获悉,今年上半年北京市工业和信息软件业合计实现增加值突破9000亿元,占全市地区生产总值比重达36.2%,创历史新高,对全市经济增长贡献率达61.6%。规上工业增加值连续16个月高于全国平均水平,信息软件业规模、增速居全市各行业首位。投资动能持续迸发,市场活力加速释放,产业高端化、智能化、绿色化转型步伐加快。数字...
【关键词】北京,工业,信息软件业
美团开源OIBench与CoreCodeBench揭示大模型编程真实水平(2025-07-22)
【摘要】 7月22日,OSCHINA讯,近日,Meituan-M17团队联合上海交大等机构,推出OIBench(聚焦高区分度算法题评测)与CoreCodeBench(聚焦多场景工程级代码基准)两大数据集,已在GitHub和Huggingface开源。当前大语言模型在编程领域宣称能力强,但现有评估体系有局限,传统算法评测集区分度不足、数据易泄漏,工程基准任务类型单一、数据构建方法有缺陷,无法全面评估模型能力。
【关键词】大模型,编程评测,数据集
京东开源JoyAgent-JDGenie多智能体系统,GAIA基准测试表现卓越(2025-07-21)
【摘要】 7月21日,OSCHINA讯,近日,京东正式开源产品级端到端通用多智能体系统JoyAgent-JDGenie,在GAIA基准测试中总体准确率达75.15%,超越OWL、OpenManus等竞品位居行业前列。该系统在GAIA基准难度分级任务中表现出色,Level1任务准确率超85%,Level2接近78%,Level3达55%。它是完整的端到端多智能体系统,支持简单输入获答案,集成多模块,开发者可扩展功能。采用多层级协作设计处理复杂任务,开箱即用降低开发门槛。具备多模态与...
【关键词】多智能体,开源系统,GAIA测试
MaxKB V2正式发布助力企业级智能体构建(2025-07-21)
【摘要】 7月21日,OSCHINA讯,近日,MaxKB V2版本正式发布。MaxKB是致力于解决企业AI落地难题的企业级智能体平台,秉承“开箱即用,伴随成长”理念,支持企业快速接入主流大模型,构建专属知识库,提供渐进式升级路径,赋能多种应用场景。
【关键词】MaxKB,智能体,企业级
QuestDB 9.0正式发布,高性能开源时序数据库(2025-07-18)
【摘要】 7月18日,IT之家讯,近日,开源时序数据库QuestDB发布重大版本9.0。该版本增加了N维数组、日历感知的物化视图,提高了数据去重效率、实现了更智能的JOIN,还重构了Web控制台的UX。如支持真正的N维数组,引入二进制行协议,新增高效的replace commit机制等,同时改进Web控制台界面,新增ASOF JOIN with TOLERANCE参数。
【关键词】QuestDB,时序数据库,9.0版本
AI写代码导致开发者效率下降19%(2025-07-18)
【摘要】 7月18日,IT之家讯,近日,非营利性AI研究机构METR的随机对照实验发现,经验丰富的开源开发者使用AI编程工具(如Cursor Pro或Anthropic Claude)时,完成任务时间比不使用时平均增长19%。开发者预期节省24%时间且认为提高20%效率,但实际并非如此。研究追踪16名资深开发者完成的246项涉及复杂代码库的任务,AI工具虽减少部分时间,但增加了审查、提示、等待及空闲时间。开发者接受无需修改的AI生成代码比例不到44%,约9%任务时...
【关键词】AI写代码,开发者效率,METR实验
Manus清空国内社交平台账号内容,前员工透露“不会继续推进”中文版(2025-07-17)
【摘要】 7月17日,开源资讯讯,近日,网友发现通用AI智能体公司“Manus”的官方微博和小红书账号内容被清空,其官网首页显示“Manus在你所在的地区不可用”,此前为“Manus中文版本正在开发中”。近期Manus因大规模裁员传闻受关注,澎湃新闻7月8日报道其回应是基于经营效率考量调整部分业务团队,继续专注核心业务。蓝鲸新闻7月10日报道,Manus与阿里通义千问合作开发中文版一事,一员工称“不会继续推进”。
【关键词】社交账号,清空,合作终止
智源全面开源RoboBrain2.0与RoboOS2.0(2025-07-17)
【摘要】 7月17日,IT之家讯,近日,智源研究院宣布开源具身大脑RoboBrain2.032B版本以及跨本体大小脑协同框架RoboOS2.0单机版。RoboBrain2.0是通用具身大脑,32B版本时空认知能力有突破,在多项基准刷新纪录,7B版本轻量化适配边缘设备。其采用模块化架构,针对具身推理任务优化。RoboOS2.0是全球首个具身智能SaaS开源框架,集成多种技术,推出单机版及技能商店等,降低开发门槛,性能提升,新增多项功能。
【关键词】智源研究院,模块化,开源框架
字节跳动Seed最新强化学习配方POLARIS开源(2025-07-16)
【摘要】 7月16日,IT之家讯,近日,字节跳动Seed团队联合香港大学与复旦大学推出创新强化学习训练方法POLARIS。该方法通过ScalingRL策略提升小模型数学推理能力,采用此方法训练的40亿参数开源模型Qwen3-4B在AIME25和AIME24数学测试中准确率高,且能在消费级显卡部署。POLARIS核心创新在于训练策略,包括定制训练数据和超参数、采样控制、引入长度外推技术、采用多阶段RL训练方法等。目前其详细内容已全部开源,在多个评测集验证有效。...
【关键词】字节跳动,POLARIS,强化学习
秘塔AI搜索上线“深度研究”功能(2025-07-16)
【摘要】 7月16日,开源资讯讯,秘塔AI搜索在“浅度研究”上线五个月后,正式推出可公开免费使用的“深度研究”功能。该功能通过任务拆解和可视化“问题链”提升中文场景的搜索准确率与透明度。秘塔采用把整体任务拆成多个子任务、分段强化学习等方法,在降低GPU消耗的同时,使中文场景准确率优于最新WebSailor等模型。系统还会为每个提问实时生成可视化的问题链,让用户看到模型输出报告的过程。
【关键词】AI搜索,深度研究功能,中文搜索