人工智能 - 中国行业发展报告

【人工智能】苹果AI框架MLX正新增英伟达CUDA支持，助开发者降低硬件成本（2025-07-16）

【摘要】　　7月16日，IT之家讯，Appleinsider发现苹果专为Apple Silicon设计的机器学习框架MLX正新增CUDA支持。此前，因MLX深度集成于苹果平台的Metal框架，无法在macOS之外运行，开发者需额外购置硬件用于部署和测试。如今，由GitHub开发者@zcbenz主导，数月前开始构建CUDA相关支持代码并逐步并入苹果MLX主分支。此支持仅针对从适配苹果环境的MLX框架导出代码，使其能在Nvidia显卡及服务器硬件运行，并非让Mac Pro等本地运行机器学习应用或基于CUDA项目直接在Apple Silicon上运行。对开发者来说，可利用Apple Silicon设备开发测试，量产阶段用Nvidia硬件，节省成本。且MLX在CUDA系统运行性能远超Mac，能获更强算力。　　

【关键词】MLX框架，CUDA支持，成本控制

【人工智能】消息称大模型公司MiniMax即将完成近3亿美元新融资，估值超40亿美...（2025-07-14）

【摘要】　　7月14日，IT之家讯，大模型公司MiniMax近3亿美元（现汇率约合21.52亿元人民币）的新一轮融资已接近完成，投后估值超过40亿美元（现汇率约合286.96亿元人民币），目前国内达到这一估值的大模型公司还有智谱。MiniMax曾于去年年底完成一轮估值30亿美元的融资，今年6月，彭博社报道其正在筹备赴港上市。晚点科技还提到，智谱、MiniMax都已启动上市进程，智谱今年上半年估值已达300亿元人民币。MiniMax由商汤科技前员工于2021年创立，今年6月，该公司宣布推出全球首个开源大规模混合架构的推理模型M1，性能超DeepSeek-R1。　　

【关键词】MiniMax，企业融资，大模型

【人工智能】新石器与深汽租协达成战略合作，推动1000台无人车落地应用（2025-07-04）

【摘要】　　7月4日，IT之家讯，新石器无人车7月1日与深圳市汽车租赁行业协会（简称“深汽租协”）签署战略合作协议，正式达成千台级规模合作。双方将在无人驾驶产品技术应用、智慧物流服务等方面展开深度协作，共同推动汽车租赁行业的自动化、科技化、智能化、绿色化转型升级。根据协议内容，深汽租协及其合作伙伴将累计采购1000台新石器无人车及其配套技术服务，用于提升行业整体运力结构与运营效率。新石器无人车将为深汽租协及其合作伙伴提供自动驾驶产品与服务支持，助力其在智慧出行、绿色物流等领域实现降本增效。目前，新石器无人车服务于快递、城配等多种物流场景需求，已在全球15个国家、250个城市累计交付部署无人车近6000辆，运营里程累计超过4200万公里，交付规模和运营里程均居行业第一。　　

【关键词】运营密度，运营规模，自动配送

【人工智能】谷歌Veo3AI文生视频模型正式向Pro/Ultra会员开放，后续将新增“...（2025-07-04）

【摘要】　　7月4日，IT之家讯，谷歌在今年I/O开发者大会中公布了Veo3?AI?文生视频模型，目前谷歌副总裁JoshWoodward宣布这款模型已正式向所有订阅了?Pro/Ultra会员的用户开放。需要注意的是，Pro?会员用户每天只能生成3段视频（Ultra?生成的数量未公布），如果用户当天用完配额，需要等到第二天再试，或者继续使用上一代Veo2模型。JoshWoodward?透露?Veo3的“照片生成视频”功能已接近完成，近期即将上线。此外，他在评论区中透露“谷歌清楚很多人希望能以更实惠的方式使用Veo3”，但具体谷歌是否会进一步降低?Veo3?使用门槛目前尚未确定，当下使用该模型至少需要订阅?Pro?会籍，每月?20美元。　　

【关键词】生成视频，背景音效，即将上线

【人工智能】阿里通义开源旗下首个音频生成模型ThinkSound：可像“专业音效师...（2025-07-04）

【摘要】　　7月4日，IT之家讯，阿里“通义大模型”公众号发文宣布，通义实验室首个音频生成模型?ThinkSound现已正式开源，将打破“静音画面”的想象力局限。ThinkSound首次将CoT（Chain-of-Thought，思维链）应用到音频生成领域，让AI学会一步步“想清楚”画面事件与声音之间的关系，从而实现高保真、强同步的空间音频生成——不只是“看图配音”，而是真正“听懂画面”。为了让AI学会“有逻辑地听”，通义实验室语音团队构建了首个支持链式推理的多模态音频数据集?AudioCoT。AudioCoT融合了来自VGGSound、AudioSet、AudioCaps、Freesound等多个来源的?2531.8小时高质量样本。这些数据覆盖了从动物鸣叫、机械运转到环境音效等多种真实场景，为模型提供了丰富而多样化的训练基础。　　

【关键词】大模型，数据覆盖，动态细节

【人工智能】国内首个：网易有道开源“子曰3数学模型”，单块消费级GPU即可运...（2025-06-24）

【摘要】　　6月24日，IT之家讯，6月23日，网易有道宣布开源“子曰3”系列大模型的数学模型（Confucius3-Math），这是国内首个专注数学教育、能在单块消费级GPU上高效运行的开源推理模型。官方测试数据显示，在CK12-math(Internal)、GAOKAO-Bench(Math)等多个数据集上，14B轻量级的“子曰3数学模型”得分高于DeepSeek-R1等通用大模型，在基于高考数学题的GAOKAO-Bench(Math)评测框架中，得分可达98.5分。该模型通过大规模增强学习与创新算法，实现更优成本效益，训练成本仅2.6万美元（约合18.7万元人民币），推理性能约为DeepSeekR1的15倍。它在消费级GPU（如RTX4090D）即可运行，服务成本每百万token低至0.15美元，降低教育场景AI应用门槛，利于教育机构和开发者低成本部署专业数学AI应用。　　

【关键词】子曰3，数学模型，开源推理

【人工智能】嘉楠科技宣布战略重组，终止非核心的AI芯片业务单元（2025-06-24）

【摘要】　　6月24日，IT之家讯，嘉楠科技宣布启动战略重组，旨在聚焦核心业务，将终止非核心的AI芯片业务单元，该业务单元在2024年年报中被描述为“用于边缘计算应用的ASICs”，预计相关终止程序将在未来数月内完成。嘉楠科技称，此举旨在精简运营、提升资本效率、削减无关支出，将资源和领导层关注重点回归基础优势。尽管AI芯片业务单元曾有创新，但与公司精简增长战略不符。2024财年，该业务通过销售边缘计算产品收入约90万美元，相关运营支出约占公司2024财年总运营支出的15%。早在2022年3月，嘉楠科技就聘请外部顾问，探寻AI芯片业务的战略选择。AI芯片业务单元终止后，预计整体运营支出将显著下降。嘉楠科技2016年开始投入AI芯片研发，2018年发布勘智K210，2021年推出勘智K510。　　

【关键词】战略重组，AI芯片，业务终止

【人工智能】谷歌Google Cloud向Linux基金会捐赠A2A智能体交互协议（2025-06-24）

【摘要】　　6月24日，IT之家讯，在北美开源峰会期间，谷歌Google Cloud宣布向Linux基金会捐赠A2A（Agent2Agent）智能体/代理交互协议、SDK及开发人员工具。同时，Linux基金会与亚马逊AWS、思科、谷歌等多家企业成立Agent2Agent项目实体，欲通过A2A协议等互操作性技术打造AI代理开放且可互操作的生态系统。A2A协议由谷歌于4月9日推出，是能让不同AI智能体实现通信协作的开放标准，超百家公司已支持该协议，它致力于打破限制人工智能潜力的孤岛。Google Cloud称下一步将通过外部合作，制定更广泛开放标准，在可信代理身份、权限、治理策略、安全性和声誉等方面补充A2A协议。　　

【关键词】A2A协议，开源捐赠，智能体协作

【人工智能】谷歌Gemini客户端新增AI视频上传分析功能，支持iOS/安卓平台（2025-06-20）

【摘要】　　6月20日，IT之家讯，谷歌为GeminiAI客户端新添视频上传分析功能。用户将应用更新至最新版本（iOS为1.2025.2362302版本，安卓需将Google应用更新至16.24正式版），无需订阅Gemini会员就能看到视频上传选项。上传视频后，Gemini会依用户提示词逐帧分析视频内容并作答，像上传监控摄像头录屏询问拍摄时间，Gemini能结合时间码与环境给出见解。该功能逐步上线，不同设备和账号开放时间有别，现阶段仅支持Gemini2.5Flash/2.5Pro模型，若遇“文件类型不受支持”提示，说明功能未对该账号开放，需等待。　　

【关键词】谷歌Gemini，视频分析，多平台支持

【人工智能】红杉中国正式开源AI基准测试xbench评测集（2025-06-18）

【摘要】　　6月18日，界面新闻讯，红杉中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch。红杉中国称未来会依据大模型与AI Agent的发展动态更新评测集，并采用“黑白盒”机制。该机制一方面能让xbench服务更多大模型和Agent开发者，另一方面可避免静态评测集常见的过拟合问题，以保证xbench长期有效。此次开源旨在为AI开发者提供更全面、有效的评估工具，助力行业发展，推动AI技术在不同场景下更精准、高效地应用。　　

【关键词】红杉中国AI基准测试评测集开源

【人工智能】硅基流动入驻阿里云云市场，核心API服务将全面接入百炼平台（2025-06-18）

【摘要】　　6月18日，IT之家讯，硅基流动与阿里云达成战略合作，加入阿里云“繁花计划”并入驻阿里云云市场。同时，硅基流动大模型推理平台Silicon Cloud的核心API服务全面接入阿里云百炼平台，以阿里云灵骏智能计算集群为算力支撑，为云上客户提供大模型服务。Silicon Cloud是国内增长迅速的第三方MaaS平台，已集成超百款主流开源大模型，服务600万用户与数千家企业，应用于多场景。硅基流动创始人称合作能增强平台推理场景弹性扩展能力。阿里云灵骏智能计算集群可满足多种AI推理需求。今年4月，阿里云发布“繁花计划”，三年内计划联合伙伴服务百万云上客户，硅基流动是首批战略合作伙伴之一，未来双方还将在算力协同等多方面探索全面合作。　　

【关键词】硅基流动，阿里云，API接入

【人工智能】谷歌云服务严重宕机，致OpenAI、Spotify等多项服务中断（2025-06-13）

【摘要】　　6月13日，新浪财经讯，谷歌云服务出现严重宕机情况，致使OpenAI、Spotify等多项服务中断。此次宕机事件影响范围广泛，涉及众多依赖谷歌云服务的企业与平台。OpenAI作为人工智能领域的重要企业，其服务中断对相关业务开展产生较大冲击；Spotify作为知名音乐流媒体平台，服务中断影响用户正常使用。谷歌云在云计算市场占据重要地位，此次宕机凸显云服务稳定性对依赖其的企业至关重要。宕机原因暂未明确，谷歌方面应尽快查明原因并采取措施恢复服务，同时需加强运维管理，提升云服务稳定性，以降低类似事件对客户造成的损失，维护自身市场声誉。　　

【关键词】谷歌云，服务宕机，影响广泛

【人工智能】豆包大模型1.6正式发布，每百万输入Token低至0.8元（2025-06-11）

【摘要】　　6月11日，IT之家讯，在6月11日举行的火山引擎FORCE原动力大会上，豆包大模型1.6版本正式发布，并采用全新统一定价模式。豆包大模型1.6包含Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash三个大模型，均支持多模态输入，实现256K超长上下文。其中thinking模型强化思考能力且支持多模态；Doubao-Seed-1.6支持on/off/auto三种思考模式。在高考全国新一卷数学测试中，豆包大模型取得144分，在大模型中排名全国第一；海淀模拟全卷考试里，理科获706分，文科得712分。价格方面，豆包大模型进一步降低，每百万Token低至0.8元。　　

【关键词】豆包模型，多模态，价格降低

【人工智能】小红书发布首个开源大模型dots.llm1：11.2万亿非合成数据助力中...（2025-06-09）

【摘要】　　6月9日，AIbase基地讯，小红书近日开源首个1420亿参数大模型dots.llm1，采用MoE架构，推理时仅激活140亿参数，既保持高性能又降低成本。该模型使用11.2万亿非合成高质量训练数据，在中文测试中平均得分91.3，超越DeepSeek的V2、V3及阿里巴巴的Qwen2.5系列等竞品。技术架构上，采用单向解码器Transformer结构，以MoE替换传统前馈网络，含128个路由专家和2个共享专家，处理输入时动态选6个相关专家和2个共享专家运算。训练中引入改进的RMSNorm归一化操作稳定性能，MoE模块有负载平衡策略。还用AdamW优化器提升训练效率，经三级数据处理流水线形成11.2万亿高质量token训练数据，并开源万亿级训练检查点推动科研。　　

【关键词】小红书，大模型，dots.llm1

【人工智能】AI初创公司Manus发布文本转视频功能，挑战OpenAI等竞争对手（2025-06-05）

【摘要】　　6月5日，金融界讯，AI初创公司Manus推出文本转视频功能，踏入OpenAI、阿里巴巴、腾讯等众多对手竞争的领域。Manus以能让AI服务像人类一样执行多步骤任务闻名，现用户可用文本指令生成视频，其AI代理几分钟内就能将文本命令转化为有序视频故事。付费用户可抢先体验这一功能，之后会向所有人免费推出。OpenAI的竞品是Sora，付费用户通过ChatGPT使用，专业版每月收费200美元。Runway、Synthesia及谷歌等西方竞争对手，按用户订阅情况或按次数付费定价产品。　　

【关键词】文本转视频，AI初创公司，竞品定价

【人工智能】Anthropic开源神经网络追踪工具，可生成归因图直观展示AI模型处...（2025-06-03）

【摘要】　　6月3日，IT之家讯，Anthropic公司正式开源新一代神经网络追踪工具，助力研究人员解析大模型内部推理机制。该工具能生成“归因图”，清晰呈现AI模型处理提示词的过程，方便开发者观察与微调。同时，Anthropic与Decode Research团队合作推出Neuronpedia前端平台，用户可在网页与归因图互动。平台设有“示例笔记本”，展示Gemma-2-2b和Llama-3.2-1b等模型运作方式，鼓励用户尝试不同提示词并比较模型行为。Anthropic首席执行官Dario Amodei表示，大模型“可解释性”备受关注，此工具能提升社区参与度，加速开发者对大模型行为逻辑的理解。　　

【关键词】追踪工具，归因图，可解释性

【人工智能】OpenAI抛弃Node.js，用Rust重写AI编程工具Codex CLI（2025-06-03）

【摘要】　　6月3日，IT之家讯，科技媒体Dev Class发布博文，OpenAI公司决定使用Rust语言取代原有的Node.js架构，重写AI命令行编程工具Codex CLI。Codex CLI是OpenAI开发的实验性AI编码工具，可通过ChatGPT网页端或本地命令行运行，采用聊天式界面，支持交互式及非交互式静默模式，在GitHub开源，支持多系统。原版本基于TypeScript和Node.js，现决定用Rust重写。维护者Fouad Matin称，TypeScript版本会持续修复BUG直至Rust版本体验和功能与之相当。使用Rust重写原因包括：零依赖安装，解决现行版本对Node.js版本要求的障碍；实现沙箱隔离，在不同系统采用不同沙箱技术；优化性能，Rust无运行时垃圾回收，内存需求低；支持现有MCP实现，Rust作为系统语言更高效。　　

【关键词】OpenAI，Rust，Codex，CLI

【人工智能】阿里巴巴开源自主搜索AI智能体WebAgent（2025-05-30）

【摘要】　　5月30日，IT之家讯，阿里巴巴于5月29日在Github上开源自主搜索AI Agent——WebAgent，该智能体具备端到端的自主信息检索与多步推理能力，能像人类一样在网络环境主动感知、决策和行动。例如面对特定领域最新研究成果需求，它可主动搜索多学术数据库，筛选文献并深入分析总结。WebAgent分为WebDancer和WebWalker，前者为端到端智能体训练框架，增强网络AI智能体多步骤信息搜索能力；后者属“Web遍历中的LLM基准测试”。WebDancer框架由数据构建到训练优化共4大块组成，采用两种创新数据合成方法解决传统数据集局限，利用短推理和长推理确保生成轨迹有效连贯，经监督微调初始化训练，在强化学习阶段采用DAPO算法，通过动态采样机制提高数据效率与策略鲁棒性，最终实现高效多步推理和信息检索。　　

【关键词】AI智能体，信息检索，开源技术

【人工智能】Opera推出代理浏览器Neon：AI直接帮你写代码、创建网站（2025-05-29）

【摘要】　　5月29日，IT之家讯，5月28日挪威科技公司Opera推出最新浏览器Opera Neon，这是一款“代理浏览器”，搭载AI引擎，具备上下文感知能力，能借助云AI代理代用户执行多项任务，如创建游戏、报告、代码片段、网站，还能在用户离线时同时处理多项任务。Opera高级人工智能产品总监称这将改变人们使用互联网及在浏览器执行任务的方式。此外，Opera Neon提供类似微软Copilot和OpenAI Operator的AI工具，用户可通过聊天机器人界面搜索网络、获取网页上下文信息，还配备“浏览器操作员”AI代理，可自动化执行购物、填表、预订等常规网络任务，并强调本地交互保障隐私安全。目前该浏览器发布时间和价格未公布，仅知为付费订阅产品，细节信息有限，这是Opera继2月推出Air浏览器后第五款浏览器。　　

【关键词】代理浏览器，AI代理，付费订阅

【人工智能】王兴披露美团AI业务进展：基础大模型能力接近GPT-4o水平（2025-05-27）

【摘要】　　5月27日，IT之家讯，在美团2025年第一季度财报电话会上，美团创始人王兴透露美团AI大模型进展。美团计划6月推出业务决策助手，助力商家把握AI趋势实现数字化转型。上个季度，美团为内部工程师提供自动代码生成工具，内部已有52%代码由AI生成。美团基础大模型能力已接近GPT-4o水平。本月消息，美团将上线AI编程工具“NoCode”，定位VibeCoding方向，类似面向非技术人群的Lovable，用户通过多轮对话可让其完成编码及部署，应用于数据分析等场景。今年3月，美团核心本地商业CEO王莆中透露美团在做NativeAI产品，愿景是为每人提供专属生活小秘书，目前在招聘相关人员。王兴强调美团在AI技术上采取“主动进攻”策略。　　

【关键词】美团，AI大模型，数字化转型

中国行业发展报告

月度监控

行业周评（热点专题）

政策解读

近期政策

国内新闻

前沿技术

国外同业

公司动态

公司研报

关键指标

趋势预测

碳中和

绿色金融

新基建