Anthropic上线Claude AI医疗合规服务(2026-01-21)
【摘要】 1月21日,OSCHINA讯,近日,Anthropic旗下AI助手Claude正式上线符合美国HIPAA法案的医疗合规服务,可合法处理医院、机构及个人用户的敏感健康数据。该服务整合了多种科学数据库,强化了生物医学研究支持能力。个人用户可将苹果健康等应用中的数据导入Claude,由AI协助整理医疗记录,提升医患沟通效率。目前医疗巨头班纳健康系统已有2.2万名员工使用Claude,85%的临床人员反馈其提升了工作效率和准确性。Anthropic还与诺和诺德...
【关键词】AI医疗,健康数据
中国高校研发新型架构UniCorn,解决AI图像系统逻辑失准难题(2026-01-20)
【摘要】 1月20日,OSCHINA讯,近日,中国科学技术大学及国内多家高校科研团队发布名为“UniCorn”的新型技术框架,旨在解决AI图像系统在生成内容时出现的逻辑失准问题。研究发现,现有系统虽能理解复杂视觉信息,但在生成图像时常出现认知与表达不一致的现象,如空间顺序颠倒。UniCorn框架通过引入协同机制,将系统划分为观察者、执行者和质检员三个角色,利用其“审美评估”能力实时指导生成过程并纠偏。初步测试表明,该框架显著提升...
【关键词】AI技术,图像处理,逻辑纠错
腾讯优图开源主动式端侧AI助手:Youtu-Tip(2026-01-20)
【摘要】 1月20日,OSCHINA讯,近日,腾讯优图开源主动式端侧AI助手Youtu-Tip,由自研轻量级模型Youtu-LLM(1.96B)驱动,支持桌面自动化和Agent调用。该助手完全开源,可离线使用,保障用户隐私安全。Tip能智能理解工作上下文(如选中文本或截图),实现一键任务处理,模拟鼠标/键盘操作执行桌面任务,并接入智能体、MCP服务器等工具,支持文件读取、网页浏览等复杂操作。用户可通过“技能”机制教授自定义桌面操作。Tip还包含即将开源...
【关键词】AI助手,开源模型,隐私安全
ElevenLabs发布转录模型Scribev2,支持90多种语言(2026-01-19)
【摘要】 1月19日,OSCHINA讯,近日,ElevenLabs发布了Scribe v2转录模型,专注于离线批量转录和字幕制作场景。该模型在英语中的词错率约为5%,在印地语等90多种语言中低于10%。Scribe v2已集成至ElevenLabs Studio,支持超过10小时的大文件处理,并符合GDPR和HIPAA等合规要求。其功能包括支持自定义术语的Keyterm Prompting以及智能多说话人日志。模型支持90多种语言,适用于跨语种场景,提供关键词提示功能,用户可提供多达100个词语...
【关键词】转录模型,多语言支持,企业合规
Demo上线,方便快速了解teanary(2026-01-19)
【摘要】 1月19日,OSCHINA讯,近日,Teanary的Demo已上线,提供AI算力1折优惠以加速AI应用落地。前台数据每8小时自动重置,当前Demo运行在树莓派上,性能有限。Teanary欢迎赞助服务器资源以部署多节点同步演示环境,展示完整功能,联系方式为hello@teanary。com。文章展示了Teanary的前端界面(8张),包括前端首页、分类页面、商品详情、购物车、结算页面、订单页面、文章推荐和联系我们页面;后台管理(20张),涵盖商品管理、分类管...
【关键词】AI算力,商品管理,多节点同步
C#击败Python成为TIOBE2025年度编程语言,业界地位仍面临Java生态优势挑战(2026-01-16)
【摘要】 1月16日,IT之家讯,近日,TIOBE编程社区指数公布2025年度编程语言为C#,取代了2024年的Python。TIOBE CEO Paul Jansen指出,C#在所有语言中同比排名提升幅度最大,这是继2023年后C#第二次获此殊荣。C#经历了从Windows平台到跨平台、从微软内部主导到全面开源的关键转型。Java与C#在企业级软件市场的竞争依然胶着,Java的生态优势能否持续压制C#仍是未知数。2025年TIOBE前十榜单中,C与C++互换了排名,C语言在嵌入式系统市场表...
【关键词】C#,编程语言,挑战
PicList v3.1.1发布,图床管理和上传工具,修复UI问题(2026-01-16)
【摘要】 1月16日,IT之家讯,PicList v3.1.1版本发布,这是一款基于PicGo深度二次开发的云存储和图床平台管理工具。新版本新增插件搜索严格模式,优化相册元素选中显示和滚动性能,调整管理页面布局,修复了设置拷贝格式时页面崩溃、更新下载进度条显示异常等问题。PicList完整保留PicGo所有功能,兼容大部分PicGo插件,扩展了WebDav、本地图床等内置图床平台,支持云端文件同步删除。其特色功能包括全面的云存储管理、内置图像处理工...
【关键词】图床管理,云存储,图像处理
ip2region3.11.2发布-Java&C#内存占用优化(2026-01-15)
【摘要】 1月15日,OSCHINA讯,ip2region是一个离线的IP数据管理框架和定位库,支持IPv4和IPv6,具备亿级别IP段管理能力和10微秒级查询性能。3.11.2版本主要针对Java和C#进行内存占用优化:Java方面,LongByteArray新增固定切片支持,提升寻址效率,默认sliceBytes设置为50MiB,减少堆内存峰值占用;C#方面,ContentCacheStrategy直接实现ICacheStrategy接口以降低启动内存消耗。官方社区已上线,提供商用离线数据、在线查询测试及技术...
【关键词】IP定位,内存优化,版本更新
Linux内核引入更灵活的启动Logo自定义配置选项(2026-01-15)
【摘要】 1月15日,OSCHINA讯,近日,Linux内核出现了一组新的补丁,允许开发者和高级用户更方便地更换内核启动时显示的图像Logo。这些补丁由开发者Vincent Mailhol提交,通过增强内核的配置系统Kconfig实现Logo文件的可配置化。新增的配置选项包括LOGO_LINUX_MONO_FILE(单色PBM格式)、LOGO_LINUX_VGA16_FILE(16色PPM格式)和LOGO_LINUX_CLUT224_FILE(最多224色PPM Logo)。过去更换启动Logo需要手动修改源代码和Makefile,而现在可...
【关键词】自定义配置
“开源Windows”ReactOS向兼容WindowsNT6迈出关键一步(2026-01-14)
【摘要】 1月14日,OSCHINA讯,开源操作系统项目ReactOS在2026年取得重要进展,通过同步MSVCRT(MicrosoftC运行时库)与Wine10.0版本,显著提升了对WindowsAPI的兼容性。此次改进使API测试失败率降低约30%,修复了7574个测试失败项(占测试总数的29.6%),并改善了多款应用程序的运行表现。这一进展被视为向WindowsNT6(如Vista/7等时代的核心)兼容性迈出的关键一步。ReactOS自1990年代末开始开发,目标是实现一个开源且兼容WindowsNT...
【关键词】NT6,兼容性,开源
F-Droid核心基础设施升级:更快的服务器上线(2026-01-14)
【摘要】 1月14日,OSCHINA讯,自由Android应用仓库F-Droid宣布完成核心基础设施升级,新投入的高性能服务器显著提升了构建与发布效率。旧服务器已运行12年,近五年几乎持续工作,硬件老化导致性能瓶颈,更新周期一度长达3~4天。新服务器使发布频率提升至每日甚至每日两次,大幅缩短应用更新到达用户设备的时间。F-Droid采用独特托管方式,将服务器交由资深贡献者管理,同时保留完全远程控制权和明确物理访问权限,强调透明性与安全性...
【关键词】服务器升级,开源社区,应用更新
微信推出AI应用及线上工具小程序成长计划:提供一年期免费云开发资源、AI算力、流量激励等支持(2026-01-13)
【摘要】 1月13日,IT之家讯,近日,微信宣布推出AI应用及线上工具小程序成长计划,提供云开发资源、AI算力、流量激励等支持。激励期为2026年全年,个人及企业主体均可参与,要求小程序类目包含文娱、工具、社交等。新开发者可免费创建个人版云开发环境6个月,已有开发者可领取大额抵扣券。活动期间提供1亿Token的腾讯混元文生文模型额度和1万张文生图模型额度。免费赠送We分析专业版权限1年,并提供专属推荐入口和公域流量支持。广告接...
【关键词】微信,AI,小程序
Free Fs v2.0.0-alpha已经发布,现代化文件管理网盘系统(2026-01-13)
【摘要】 1月13日,OSCHINA讯,近日,Free Fs v2.0.0-alpha版本已发布,这是一款现代化文件管理网盘系统。本次更新主要完善了预览插件架构,新增了服务端渲染式文件预览功能,支持Excel和Word文件预览。系统还添加了Minio支持,扩展了对S3体系的支持,并引入了RustFS插件。此外,更新内容还包括scope权限功能的改进,以及分享内文件下载逻辑的优化。多位贡献者参与了本次更新。
【关键词】文件管理,网盘系统,预览插件
《胜利女神:NIKKE》宣布联动雷蛇(2026-01-09)
【摘要】 1月9日,IT之家讯,近日,二次元游戏《胜利女神:NIKKE》官方宣布将与外设品牌雷蛇展开联动,计划于2026年3月启动。联动内容包括游戏内推出全新联名服装道具,更多细节将在未来公布。此次合作是游戏IP与硬件品牌的跨界尝试,旨在通过内容与硬件的结合提升用户粘性。
【关键词】游戏联动,雷蛇,二次元
微软CopilotAI应用免费上线GPT5.2,“专家级”处理复杂办公任务(2026-01-09)
【摘要】 1月9日,IT之家讯,微软面向网页版、Windows 11版和移动端Copilot用户全量推送GPT 5.2模型,命名为“智能+”模式。该更新为免费升级,与基于GPT 5.1的“智能”模式共存。GPT 5.2被定义为“Thinking”变体,显著增强处理复杂任务能力,支持快速完成电子表格、演示文稿、代码编写与审查、长文档理解及图像处理等办公任务。在GDPval评估中,GPT-5.2 Thinking在70.9%的测试案例中表现优于或持平人类专家,而GPT-5仅为38.8%。
...
【关键词】微软,AI,GPT52
微信鸿蒙版升级(2026-01-08)
【摘要】 1月8日,IT之家讯,近日,微信鸿蒙版App8.0.14.34(8392226)版本在华为应用市场发布尝鲜升级,测试将持续至2026年1月28日。此次更新虽官方说明为“修复已知问题”,但用户反馈新增多项功能,包括移动网络改善语音质量开关、朋友圈地址查看、按时间查看朋友圈、全屏输入、通话铃声播放、无损音质选项(QQ音乐会员专属)、蓝包功能预埋等。此外,灰度测试了打字表情包联想功能,并优化了后台资源占用与响应速度。微信鸿蒙版自20...
【关键词】微信鸿蒙版,功能更新,灰度测试
开源转译层D7VK1.1版本发布,让现代显卡流畅运行老游戏(2026-01-08)
【摘要】 1月8日,IT之家讯,近日,开源转译层D7VK发布1.1版本。该工具通过将Direct3D 7图形接口调用转换为Vulkan API,使老游戏能在新硬件上流畅运行。其核心机制是将Direct3D 7指令先转为DirectX 9,再通过Proton项目的DXVK层转为Vulkan API,利用现有生态系统提升性能。1.1版本新增前端界面降低配置门槛,并实验性支持Direct3D 6,扩展了对90年代中后期游戏的支持。相比WineD3D方案,D7VK转译效率更高,性能损耗更低,运行速度可达全...
【关键词】开源转译层,D7VK,怀旧游戏
字节Trae发布《2025年度产品报告》(2026-01-07)
【摘要】 1月7日,OSCHINA讯,近日,字节跳动旗下AI原生编程工具Trae发布《2025年度产品报告》,披露其增长与用户洞察。截至报告发布,Trae总注册用户超600万,覆盖近200个国家和地区,月活跃用户突破160万。用户周均活跃天数近5天,国际版付费用户接近“自然周全勤”。全年用户发起近6000万个会话、5亿条查询,生成近1000亿行代码,近半年日均Token消耗量提升700%。2025年,Trae从Agent1.0迭代至SOLO正式版,代码补全延迟降低60%,内存...
【关键词】用户增长,代码生成,年度报告
华为鸿蒙生态提速,HarmonyOS5.0以上终端设备超过3600万(2026-01-07)
【摘要】 1月7日,IT之家讯,华为中国官方发布2026年新年致辞,回顾2025年取得的成就:助力运营商建设5G-A网络,为6000万用户提供极速网络联接体验;鸿蒙5.0以上终端设备超过3600万;乾崑智驾累计为140多万辆乘用车提供辅助驾驶,行驶里程近70亿公里;鲲鹏发展6800多家合作伙伴、380万开发者,openEuler系操作系统装机量超1600万套;昇腾发展3000多家合作伙伴、400万开发者;在医疗病理、炼钢炉温预测等领域探索AI应用;累计生产绿电超2...
【关键词】鸿蒙生态,终端设备
字节跳动与南洋理工大学开源StoryMem框架(2026-01-06)
【摘要】 1月6日,OSCHINA讯,近日,字节跳动与南洋理工大学联合发布开源AI视频生成框架StoryMem,采用“Memory-to-Video(M2V)”机制,将单镜头扩散模型升级为支持多镜头、超1分钟连贯叙事的长视频生成系统。该框架通过动态记忆库存储关键帧信息,结合轻量LoRA微调,在角色外貌、场景风格和叙事逻辑上实现跨镜头高度一致,一致性指标较现有方法提升29%。开源地址已公布,ST-Bench数据集包含300个多镜头故事提示,支持标准化评估。社区...
【关键词】开源框架,多镜头叙事
Karafkav2.5.4发布,基于Apache Kafka的应用程序开发框架(2026-01-06)
【摘要】 1月6日,OSCHINA讯,Karafkav2.5.4现已发布,这是一个用于简化基于ApacheKafka的Ruby应用开发的框架。该框架允许开发者在使用异步Kafka消息时采用类似于标准HTTP约定的方法(params和params_batch),并支持构建复杂的数据流应用程序。
【关键词】Kafka,异步消息
通义实验室开源GUI智能体基座模型:MAI-UI(2026-01-05)
【摘要】 1月5日,OSCHINA讯,阿里通义实验室多模态交互团队开源了全尺寸GUI智能体基座模型MAI-UI,该模型首次将用户交互、MCP工具调用、端云协同三大能力通过自主进化数据管线和大规模在线强化学习技术集成于统一架构中(2B与8B模型已开源)。MAI-UI旨在理解和执行复杂自然语言指令,在图形用户界面上自动完成任务,解决跨应用操作、模糊语义理解等挑战。MobileWorld测评任务难度高于传统基准,平均27.8步长程任务,超60%需跨App协作,...
【关键词】开源模型,跨应用协作
蚂蚁阿福:问答结果无广告及商业排名(2026-01-05)
【摘要】 1月5日,OSCHINA讯,近日,蚂蚁集团旗下AI健康助手阿福声明其问答结果无广告推荐、商业排名或商业干扰。2025年6月,蚂蚁集团发布AI健康应用AQ,同年12月15日品牌升级为“蚂蚁阿福”,定位从AI工具转向AI健康朋友,新增健康陪伴功能。该应用整合健康科普、就诊咨询、报告解读等上百项AI功能,连接30万真人医生及500多位名医AI分身,月活用户超1500万,国内AI健康管理应用排名首位,并跻身AI应用前五。Quest Mobile报告显示,其...
【关键词】AI健康,无广告,品牌升级
中国首部大模型国家标准实施(2026-01-04)
【摘要】 1月4日,OSCHINA讯,近日,中国国家市场监管总局公布,GB/T 45288《人工智能大模型》系列国家标准近日正式实施,标志着中国大模型产业进入“科学权威、统一规范”新阶段。该系列标准为首部聚焦通用大模型的国家标准,填补了技术评价体系空白,明确性能、安全与服务能力要求,配套评测能力已获中国合格评定国家认可委员会认可。基于此构建的“求索”-LMBench评测基准整合方法、数据集与自动化平台,成为行业公认的“能力标尺”...
【关键词】人工智能,国家标准,评测体系
智谱华章启动港股招股,市值突破511亿港元(2026-01-04)
【摘要】 1月4日,OSCHINA讯,近日,智谱华章正式启动港股招股,计划发售3741.95万股,其中香港发售187.1万股,国际发售3554.85万股。股票代码为“2513”,招股持续至2026年1月5日,预计2026年1月8日在港交所主板上市。发行价定为每股116.20港元,募资规模扣除费用后约43亿港元,对应IPO市值超511亿港元。此次上市获得11家基石投资者支持,包括JSC International Investment Fund SPC、JinYi Capital Multi-Strategy Fund SPC、上海高毅...
【关键词】港股,IPO,AI算力
微语1.1.0发布,开源智能客服(2025-12-31)
【摘要】 12月31日,OSCHINA讯,近日,微语1.1.0版本发布,这是一款开源企业级多租户团队协作工具,集成多种功能于一体,包括企业IM、在线客服、知识库、客户之声、工单系统、AI对话、工作流、呼叫中心、视频客服和开放平台。该工具提供智能文字客服、智能语音客服、智能外呼、智能营销、智能质检等完整解决方案,并在Gitee 2025年度开源项目评选中获得认可。支持多渠道大模型+智能体客服工作台,功能涵盖企业IM、全渠道客服、知识库对...
【关键词】开源,智能客服,多租户
字节跳动团队发布DreaMontage,帧引导视频生成技术(2025-12-31)
【摘要】 12月31日,OSCHINA讯,近日,字节跳动发布了名为DreaMontage的帧引导视频生成技术,其核心功能包括多关键帧条件生成、多视频片段过渡、混合条件生成、视频末帧条件生成和视频扩展。该技术通过三大维度攻克技术难点:在DiT架构中集成轻量级中间条件机制;构建高质量数据集并实现视觉表达SFT阶段;应用定制化DPO方案提升生成内容的成功率与可用性。此外,DreaMontage设计了内存高效的分段自回归(SAR)推理策略以支持长序列生成...
【关键词】视频生成,AI技术,字节跳动
网络游戏应以国家通用语言文字为基本用语用字拟写入法律(2025-12-30)
【摘要】 12月30日,IT之家讯,近日,十四届全国人大常委会第十九次会议继续审议国家通用语言文字法修订草案。草案二审稿进一步明确了国家通用语言文字在网络领域及国际交流中的使用规范,规定网络游戏等网络出版物应以国家通用语言文字为基本用语用字。此前征求意见期间,部分常委会组成人员、人大代表及公众建议规范网络用语用字,二审稿对此予以采纳。国际交流方面,草案要求境内国际展览、会议等使用外国语言文字时需同时使用国家通...
【关键词】网络游戏,国际交流
字节跳动正推进与多家厂商的AI手机合作:免收Token分成、开启“让利换入口”(2025-12-26)
【摘要】 12月26日,OSCHINA讯,近日,字节跳动正推进与vivo、联想、传音等硬件厂商的AI手机合作,计划在设备中预装AIGC插件以获取用户入口。多位vivo员工证实双方已确认合作,联想内部人士称与「豆包」、火山引擎等字节系业务保持紧密合作。知情人士透露,字节跳动此举旨在构建新的流量变现路径,让手机厂商参与流量分发与会员订阅等收益。讨论中的模式包括不收取定制化开发费或Token销售分成,并给予手机厂商二次流量的分成收益。项目...
【关键词】字节跳动,AI手机,流量变现
阿里开源分层图像编辑模型Qwen-Image-Layered(2025-12-26)
【摘要】 12月26日,OSCHINA讯,近日,阿里巴巴旗下人工智能部门Qwen开源了图像编辑模型Qwen-Image-Layered。该模型能将静态照片分解为多个具有透明背景的独立RGBA图层,支持3层或8层智能分割。用户可对特定图层进行缩放、重新定位、更换颜色或删除等操作,实现更换背景、替换人物、修改文字等功能,且分层过程可重复进行。相比传统AI图片编辑对整图重绘的方式,该技术提供了类似Photoshop的结构化操作能力,在标准图像与可编辑表示之间...
【关键词】图像编辑,AI模型,开源
开源BI工具DataEasev2.10.18LTS版本发布(2025-12-25)
【摘要】 12月25日,OSCHINA讯,近日,开源BI工具DataEase发布v2.10.18 LTS版本。该版本在仪表板、数据大屏、图表、数据集和组件等方面进行了多项功能更新和优化。仪表板新增移动端样式适配和数值格式统一设置功能;图表优化了地图、气泡地图和热力图的交互与格式设置;数据集新增排序字段;级联组件支持下拉树形态。X-Pack增强包新增阈值告警数据设置功能。此外,版本还修复了查询组件、仪表板、图表、数据大屏、数据集、SQLBot、应用...
【关键词】版本更新
feilong4.5.0发布了,让Java开发更简便的工具库(2025-12-25)
【摘要】 12月25日,OSCHINA讯,近日,feilong4.5.0版本发布,该工具库旨在简化Java开发。Maven依赖配置为<groupId>com.github.ifeilong</groupId>和<artifactId>feilong</artifactId>,版本号为4.5.0;Gradle依赖配置为com.github.ifeilong:feilong:4.5.0。本次升级包含11处变更,涉及功能增强和依赖库更新。功能改进包括CollectionsUtil.groupOne方法升级到lambda、新增CollectionsUtil。
【关键词】版本升级,依赖配置
微软承认12月更新导致Win10消息队列瘫痪,引发多种异常症状(2025-12-24)
【摘要】 12月24日,IT之家讯,近日,科技媒体BornCity报道微软承认12月9日发布的累积更新存在BUG,影响Windows 10和Windows Server系统,导致消息队列(MSMQ)功能失效。受影响的更新版本包括KB5071544(适用于Windows 10 2019 Enterprise LTSC和Windows Server 2019)、KB5071546(适用于Windows 10 22H2)和KB5071543(适用于Windows 10 1607 Enterprise LTSC及Windows Server 2016)。异常症状包括MSMQ队列转为“非活动”状态、IIS...
【关键词】微软,Win10,消息队列
《Dota2》发布7.40版本:新英雄朗戈加入,大规模游戏性更新(2025-12-24)
【摘要】 12月24日,IT之家讯,近日,《Dota 2》发布7.40版本更新,新增英雄朗戈并实施多项游戏性调整。朗戈作为吟游诗人职业英雄,拥有定制乐曲能力,可提升盟友状态或速度,其青蛙设定赋予独特技能机制。本次更新涉及天赋规则调整、四塔防御增强、地图设计改动及英雄物品平衡性重做等内容,属于大规模游戏性迭代。
【关键词】Dota,2,新英雄
因“缺乏实效”,谷歌2026年1月起不再为你扫描暗网数据(2025-12-23)
【摘要】 12月23日,IT之家讯,科技媒体bleepingcomputer报道,谷歌宣布将于2026年1月15日停止“暗网报告”监控服务,相关数据在2026年2月16日彻底下线。该功能此前用于扫描暗网中的用户敏感信息泄露情况,并通知用户采取防护措施。谷歌解释停用原因为用户反馈其未能提供“有助益的后续步骤”,决定将资源转向更高效的安全工具。官方推荐替代方案包括Google密码管理器、密码检查工具及“关于您的结果”功能,后者支持用户主动管控隐私信...
【关键词】谷歌,暗网报告,数据安全
微语1.0.1发布,开源智能客服系统(2025-12-23)
【摘要】 12月23日,OSCHINA讯,近日,微语1.0.1版本发布,这是一款开源企业级多租户团队协作工具,集成了多种功能,包括企业IM、在线客服、知识库、客户之声、工单系统、AI对话、工作流、呼叫中心、视频客服和开放平台。该系统提供智能文字客服、智能语音客服、智能外呼、智能营销和智能质检等完整解决方案。文章详细介绍了系统的功能模块,如企业IM、全渠道客服、知识库、工单系统、AIAgent、工作流、客户之声、呼叫中心和视频客服等...
【关键词】开源,智能客服,企业协作
宇树科技发布全球首个人形机器人App Store(2025-12-22)
【摘要】 12月22日,OSCHINA讯,近日,宇树科技正式推出全球首个人形机器人应用商店“宇树 App Store”,该平台包含用户广场、动作库等模块,支持用户一键下载并部署各类预设动作。目前公测版本已上线“搞笑动作”“扭扭舞”“李小龙”三大预设。未来,平台将逐步构建丰富的动作数据库,拓展普通用户可体验的功能边界。应用商店现已开放访问。
【关键词】人形机器人,应用商店,宇树科技
豆包手机助手发布技术说明:无法截屏受保护安全内容(2025-12-22)
【摘要】 12月22日,OSCHINA讯,近日,豆包手机助手发布技术说明,解释其无法截屏受保护安全内容的机制。该助手通过截屏发送给云端大模型,模型理解后返回操作指令,手机端执行指令并重复此过程,每步操作间隔约3秒。其使用系统原生截屏接口(Window Manager Service.capture Display),该接口自动规避安全内容。说明指出,所需的READ_FRAME_BUFFER等系统权限旨在为虚拟屏中的普通应用提供截屏能力,以供云端AI模型分析执行用户指令。...
【关键词】截屏技术,安全内容
豆包手机助手声明无法截屏受保护内容(2025-12-19)
【摘要】 12月19日,OSCHINA讯,近日,豆包手机助手发布技术说明,称严格遵循系统安全机制,无法截取银行安全键盘等被标记为Secure的受保护界面内容。其通过用户下达指令、截屏传云端大模型分析、返回操作指令执行的流程来操作手机功能,每步操作间隔约3秒。使用系统原生截屏接口,所需权限是为普通应用在虚拟屏截屏供云端分析,受保护页面内容仍受保护,且截图仅用于实时任务推理,完成后不在云端存储。
【关键词】豆包助手,截屏安全,虚拟屏
通义百聆语音双子星升级并开源,大幅提升语音合成与识别能力(2025-12-19)
【摘要】 12月19日,OSCHINA讯,近日,通义百聆宣布其语音大模型Fun-CosyVoice3与Fun-ASR完成重大升级并同步开源。Fun-CosyVoice3首包延迟降低50%,中英混说错误率下降56.4%,支持9种语言、18种方言及情感控制,其开源版本Fun-CosyVoice3-0.5B具备zero-shot音色克隆能力。Fun-ASR在嘈杂环境下准确率达93%,新增歌词与说唱识别功能,支持31种语言自由混说与多种中文方言,流式识别首字延迟仅160毫秒,轻量化版本Fun-ASR-Nano-0.8B同步开...
【关键词】语音合成,语音识别,开源升级