【软件产业】有望改写AI未来!英伟达全新nGPT使训练速度暴增20倍(2024-10-21)
【摘要】 10月21日,快科技网讯,据媒体报道,NVIDIA的最新研究可能彻底改变AI的未来,其研究团队提出了一种名为归一化Transformer(nGPT)的新型神经网络架构。这一架构在超球面(hypersphere)上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,最高可达20倍,同时保持了模型的精度。nGPT架构的核心在于将所有向量,包括嵌入、多层感知机(MLP)、注意力矩阵和隐藏状态,归一化为单位范数。这种归一化处理使得输入的token在超球面表面上移动,每一层模型都通过位移来贡献最终的输出预测。实验结果表明,nGPT在训练时所需的步骤比标准Transformer模型减少了4到20倍,具体加速效果取决于序列长度。例如,在1k上下文中,训练速度提高了4倍;在4k上下文中,提高了10倍;而在8k上下文中,更是提高了20倍。研究人员指出,nGPT的优化路径从超球面上的点开始,通过位移来贡献最终的输出预测,其中位移量由MLP和注意力模块定义。这种方法不仅提高了训练速度,还增强了模型的稳定性。
【关键词】英伟达,训练速度,全新nGPT
【软件产业】中国信通院、北邮与清华联合发布开源“有形”具身智能操作系统(2024-09-29)
【摘要】 9月29日,电子工程世界网讯,据中国信通院27日披露,中国信息通信研究院、北京邮电大学与清华大学联合推出了一款面向智能机器人的开箱即用的具身智能操作系统——有形具身智能操作系统,英文名为:Embodied Operating System(简称“EOS”),并已经于近期开源。从官方介绍获悉,有形具身智能操作系统(EOS)不同于国外知名机器人框架ROS,其不仅限于中间件层面的功能实现,而是从操作系统内核到中间件以及具身智能和空间智能算法库进行了全方位的设计和实现,并支持了实时内核。有形具身智能操作系统(EOS)具备以下4个突出特点:一是对国产芯片进行了深度适配,强调自主可控和开源开放;二是机器人应用于新型工业化中所急需的基础软件;三是为开发者提供了一种低门槛的具身智能应用开发范式;四是为具身智能体的用户提供了AI原生的人机交互体验。
【关键词】信通院,开源有形,智能操作系统
【软件产业】英特尔推出一颗128核心256线程的“算力炸弹”(2024-09-29)
【摘要】 9月29日,电子工程世界网讯,过去三年,英特尔基于公司“四年五个制程节点”战略,持续加速推进产品创新,今年是一个重要的里程碑,其中全新的英特尔至强6处理器系列是极为关键的一个产品。今年6月,英特尔发布了英特尔至强6能效核产品(代号Sierra Forest),为客户提供高密度计算和最佳的每瓦性能。9月26日,英特尔继续向市场投下一枚重磅的“算力炸弹”,即至强6性能核产品(代号Granite Rapids),它将为AI、数据库及科学计算等计算密集型工作负载提供最佳单核性能。尤其是最高128个核心和256条线程设计的产品,简直让人目瞪口呆。从型号上来看,至强6性能核处理器分为至强6900P、6900E、6700P、6500/6300等,其中,6900P是Granite Rapids的“完全体”,也是此次发布的重点,后续型号将在今年底和明年初陆续补齐。此外,英特尔至强6性能核处理器相较于上一代CPU,在计算密度、内存容量、数据处理和能效优化四个方面都得到了显著提升。
【关键词】英特尔,至强6,处理器
【软件产业】科技新突破:首款支持多模态存算一体AI芯片成功问世(2024-09-26)
【摘要】 9月26日,集微网讯,近日,智芯科自主研发的首款支持语音和视频的多模态存内计算AI芯片AT690成功点亮,并成功跑通端侧语音和图像模型。基于架构创新,AT690采用SRAM作为存算一体介质,通过存储单元和计算单元的深度融合,采用22nm成熟工艺制程,有效把控制造成本。与传统架构下的AI芯片相比,该款芯片在算力、能效比,功耗等方面都具有明显的优势。芯片采用AISTARTEK CIM based NPU,能效比7.8Tops/W@INT8,稀疏优化能效比达到24Tops/W@INT8。存内计算AI单核算力达到 300Gops以上,可以通过集成多核(Multi-core)进一步提升算力,优化芯片设计使芯片能以较低功耗满足音频及图像视频的 AI 应用需求。该款芯片支持市面上的主流算法,算子,并且可以灵活支持软件定制算子,有效适配新算子的高速更新,支持算法更新迭代。
【关键词】多模态,存算一体,AI芯片
【软件产业】全球首个真空噪声芯片发布(2024-09-25)
【摘要】 9月25日,电子工程世界讯,近日,北京经济技术开发区(北京亦庄)企业北京中科国光量子科技有限公司(以下简称“国光量子”)成功推出全球首个能够有效对抗电源纹波攻击等侧信道攻击的随机数芯片——真空噪声芯片,在信息安全领域取得了具有里程碑意义的重大突破。与传统基于热噪声或部分量子噪声的方案截然不同,真空噪声芯片的随机数生成过程基于真空的量子本质,其噪声源的特性稳定且难以被外界因素操控。且即使在面对极其复杂的电源纹波攻击时,由于其生成机制与电源因素的弱关联性,攻击者几乎难以通过电源的波动来影响随机数的质量和随机性。国光量子推出的真空噪声芯片,巧妙地将这一前沿物理原理应用于芯片设计之中,为加密算法提供更为可靠的随机数源,极大地增强数据加密的安全性,为金融、通信、国防等对信息安全要求极高的关键领域提供安全技术支撑。
【关键词】国光量子,真空噪声,芯片
【软件产业】阿里达摩院玄铁推出64位高实时能效RISC-V处理器设计R908(2024-08-27)
【摘要】 8月27日,电子工程世界讯,阿里达摩院玄铁本月21日在2024 RISC-V中国峰会上发布了新款RISC-V处理器设计R908。这是一款高性能、高可靠实时处理的处理器IP产品。玄铁表示R908采用64位设计,全面兼容RVA22 profile和RVA矢量扩展,拥有更高可靠性,专为高端工控、存储控制、通信计算、车载等领域设计。玄铁R908采用RISC-V 64GCB [V][H]架构,支持同构多核和多集群,每个集群至多8核心。其采用9级双发按序流水线设计,浮点单元支持BF16、FP16、FP32数据结构。玄铁同时还预告了预计将于年底发布的下代旗舰高性能RISC-V处理器C930:C930为15级乱序超标量流水线设计,采用6译码宽度和10+发射宽度,支持512bit矢量引擎,在体现CPU整数IPC的SpecINT2006上可达15分每GHz,适用于PC、边缘服务器、云计算、自动驾驶等场景。
【关键词】玄铁,高实时能效,处理器设计
【软件产业】紫光同芯推出全球首颗开放式架构安全芯片E450,已获国密二级认证(2024-08-22)
【摘要】 8月22日,电子工程世界讯,8月22日,紫光同芯昨日发布了全球首颗同时具有开放式硬件+软件架构的安全芯片E450R。该芯片应用于数据安全与算法防护领域,目前已获得银联芯片安全认证、银联嵌入式软件安全认证、银联IC卡操作系统产品认证、国密二级等多项认证。借助开放式硬件架构,E450R更新了防攻击机制、非对称密码算法引擎PKE和非易失存储器NVM管理,同时性能得到优化。PKE算法速度提升50%,密钥位数扩展情况下保证性能不变;NVM擦写速度提升15%,同样的擦写时间可以存储更多的信息;硬件底层速度提升,典型的应用交易提升50%。开放式软件架构则可提供一整套虚拟机、应用编程接口、操作系统内核和应用开发工具链。基于开放式软件架构,E450R支持国际标准语言进行应用开发,提供结构化虚拟机实现平台无关化;提供应用资源高效利用指令集,实现应用代码量缩小30%,应用加载速度提升120%;实现全球范围产品快速交付。
【关键词】紫光同芯,开放式架构,安全芯片
【软件产业】我国研发具备共情能力导诊大模型:有望用于术前谈话,减少医患冲...(2024-08-16)
【摘要】 8月16日,电子工程世界讯,据《北京日报》14日报道,中国医学科学院基础医学研究所团队研发的导诊大模型——“特定场景提示增强对话机器人”,近日通过临床试验。该模型兼具专业性和共情能力,不仅能够应用于导诊工作,未来也有望用于患者健康教育、术前谈话等更多复杂场景。据悉,该大模型的构建以不同医学场景全方位采集的真实导诊对话为基础,以提取对话信息形成的知识库作为训练数据,能够解决不同医学场景中出现的各种特定问题。研究团队为采集原始医患对话记录,成立了“真实医学对话语料联盟”,建立了语音采集>自动文字转化>人工校对的标准化流程。截至2024年6月,该团队已在24个不同医学场景收集整理了超过120万例真实医患对话。在前瞻性随机对照试验中,导诊大模型相较于人类,在事实性、安全性、共情能力均展现明显优势,在真实应用场景中,该模型可降低11.2%重复沟通和5.4%医患冲突比例。
【关键词】导诊大模型,共情能力,医患冲突
【软件产业】全球首发!openKylin RISC-V 64G镜像上线,支持中科通量AI PC(2024-08-16)
【摘要】 8月16日,开源资讯网讯,近日,在 openKylin社区RV64G SIG的共同努力下,openKylin操作系统已基于64位高性能RISC-V CPU成功运行,并顺利完成了对中科通量RISC-V AIPC 的兼容适配,这一成就为RISC-V架构在通用高性能领域的进一步优化和快速增长奠定了坚实基础,同时也填补了社区在RV64G领域的空白,为开源桌面操作系统市场注入了全新的活力与机遇。RV64G是RISC-V重要的基础指令架构,采用简化指令译码逻辑,能够更容易预测指令预取模式,进而减少内存访问次数、提高指令执行速度,为广泛的通用计算领域提供了简单且完备的指令集,使开发者可以更好的对高性能计算进行优化。RV64G SIG是由openKylin社区共建单位睿芯发起成立,致力于构建RV64G软件生态体系,以支持更加广泛的RISC-V硬件。
【关键词】openKylin,64G镜像,中科通量
【软件产业】苹果为Swift发布同态加密工具库(2024-07-31)
【摘要】 7月31日,开源资讯网讯,苹果公司发布了新的开源Swift工具库,以便开发者使用Swift实现同态加密(swift-homomorphic-encryption),此举标志着苹果在数据隐私保护方面迈出了重要一步。同态加密是一种前沿的加密算法,它允许对加密数据进行计算,而无需解密即可获取计算结果。这种“可算不可见”的特性,为数据的安全性和隐私性提供了更高级别的保护。苹果已经在最新操作系统iOS 18中部署了同态加密技术。一个典型应用实例是Live Caller ID Lookup功能,该功能利用同态加密技术,能够在不泄露用户电话号码的情况下,向服务器发送加密查询,并接收电话号码信息。通过这种方式,服务器在处理请求期间永远不会解密原始数据,甚至无法访问解密密钥。这不仅为云服务的运行提供了新的机会,也极大地增强了用户数据的隐私和安全。苹果发布的这款开源Swift工具库将同态加密技术开放给更广泛的开发者和研究者,鼓励行业内对这一技术进行更深入的探索和应用。这不仅有助于推动技术的发展,也为保护用户隐私提供了新的解决方案。
【关键词】苹果,同态加密,工具库
【软件产业】高通推出第二代骁龙4s移动平台,让全球数十亿智能手机用户能够使...(2024-07-30)
【摘要】 7月30日,集微网讯,高通技术公司今日宣布推出第二代骁龙?4s移动平台,旨在让5G更普及、更可靠。这一全新平台再次展示了高通致力于用工程技术创新推动进步的承诺,引领全球从4G向5G演进,赋能各个社区和千行百业。第二代骁龙4s还具有丰富的增强特性,包括支持无缝多任务处理和生产力的稳健CPU性能、支持高定位精度的双频NavIC、AI增强音频,以及流畅游戏和强大视频流传输等娱乐体验。高通技术公司高级副总裁兼手机业务总经理Chris Patrick表示:“第二代骁龙4s移动平台是推动5G技术普及的一次重要飞跃,将让更多人能够以5G速度畅游世界。得益于前沿工程技术,我们兼顾经济实惠、强大性能、全天候电池续航和广泛的5G接入,赋能增强的移动体验。”
【关键词】高通,骁龙4s,移动平台
【软件产业】龙芯3C6000服务器CPU流片成功:性能达英特尔至强Silver 4314水平(2024-07-25)
【摘要】 7月25日,集微网讯,在今日举行的2024全球数字经济大会拉萨高层论坛上,龙芯中科技术股份有限公司董事长胡伟武介绍,该公司在研的服务器CPU龙芯3C6000近日已经完成流片。实测结果表明,相比上一代服务器CPU龙芯3C5000,其通用处理性能成倍提升,已达到英特尔公司推出的中高端产品至强(Xeon)Silver 4314处理器水平。龙芯3C6000服务器芯片采用单硅片16核32线程,通用处理性能成倍提升,内存采用DDR4-3200×4,支持LS3D6000双硅片32核64线程、LS3E6000四硅片64核128线程,支持GPGPU、各类加速器扩展。此外,龙芯3C6000通过龙链技术(Loongson Coherenent Link)首次实现片间互联,龙链技术对标nVLink、CXL,可实现Chiplet(小芯片、芯粒)的连接。龙芯3C6000服务器CPU可满足通用计算、大型数据中心、云计算中心的计算需求。胡伟武表示,龙芯基于自主指令系统的基础软件生态基本建成,基于自主IP核CPU性能达到市场主流产品水平,基于自主工艺可以基本满足自主CPU生产要求。当前,龙芯中科正努力构建国产自主信息技术体系。
【关键词】龙芯,服务器,流片成功
【软件产业】我国在量子计算第二阶段取得里程碑式进展(2024-07-11)
【摘要】 7月11日,集微网讯,据中国科学技术大学消息,该校潘建伟、陈宇翱、姚星灿、邓友金等学者成功构建了求解费米子哈伯德模型的超冷原子量子模拟器,以超越经典计算机的模拟能力首次验证了该体系中的反铁磁相变,标志着我国在量子计算研究领域的第二阶段中取得里程碑式进展。此次潘建伟院士团队结合前期研究成果,实现了最低温度的均匀费米简并气体制备,满足了实现反铁磁相变所需要的低温,并进一步创造性地将盒型光势阱和平顶光晶格技术相结合,实现了空间均匀的费米子哈伯德体系的绝热制备。在此基础上,研究团队通过精确调控相互作用强度、温度和掺杂浓度,成功构建出求解费米子哈伯德模型的超冷原子量子模拟器,直接观察到反铁磁相变的确凿证据——自旋结构因子在相变点附近呈现幂律的临界发散现象,从而首次验证了费米子哈伯德模型包括掺杂条件下的反铁磁相变。该工作推进了对费米子哈伯德模型的理解,不仅是理解高温超导机理的有效途径,也是量子计算研究的重大突破。
【关键词】量子计算,第二阶段,里程碑
【软件产业】新思科技推出业界首款PCIe 7.0 IP解决方案,加速万亿参数领域的...(2024-06-25)
【摘要】 6月25日,集微网讯,新思科技(Synopsys)近日宣布,推出业界首款完整的PCIe 7.0 IP解决方案,包括控制器、IDE安全模块、PHY和验证IP。该解决方案可以助力芯片制造商满足计算密集型AI工作负载在传输海量数据时对带宽和延迟的严苛要求,同时支持广泛的生态系统互操作性。大型语言模型对算力的需求正在以惊人的速度增长,数据中心需要尽可能快速且可靠地处理数以万亿计的参数。新思科技提供业界唯一一款基于PCIe标准的解决方案,可在x16配置中实现高达512 GB/s双向安全数据传输,从而缓解AI工作负载的数据瓶颈。新思科技在2024年6月12日至13日在圣克拉拉举办的PCI-SIG DevCon大会上展示了这项全球首创技术。
【关键词】新思科技,解决方案,芯片设计
【软件产业】中国移动完成全球最长距离数据快递广域高吞吐技术验证(2024-06-21)
【摘要】 6月21日,C114网讯,近日,中国移动针对海量数据广域高吞吐传输需求,攻克“长肥”网络(Long-FAT Network,指传输距离远,带宽大的网络)高吞吐传输业界难题,在黑龙江哈尔滨-贵州贵阳完成5000公里超长距、70Gbps超高吞吐数据快递广域高吞吐技术中试验证。本次中试验证由中国移动面向IT云间数据备份场景,基于中国移动哈尔滨和贵阳两大云数据中心及云专网进行数据传输,验证了数据快递广域高吞吐创新技术的多项领先能力。一是超远距离;二是超高吞吐;三是即插即用。此次数据快递广域高吞吐技术中试验证是落实算力网络战略性新兴产业和未来产业任务的重要举措,将有力推动形成全国一体化算力体系,标志着我国“东数西算”也有了“西电东送”“特高压”式的关键技术,助力“网络强国”“数字中国”等国家战略实施。未来,中国移动将继续携手广大合作伙伴,以算网一体原创技术策源重塑产业新格局,开创算网服务新业态。
【关键词】中国移动,数据快递,技术验证
【软件产业】中科通量基于64位高性能RISC-VCPU成功运行openKylin系统(2024-06-20)
【摘要】 6月20日,开源资讯网讯,近日,社区共建单位北京中科通量科技有限公司(以下简称:中科通量)基于64位高性能RISC-V CPU成功运行openKylin操作系统,并顺利推出了openKylin的RV64G PC桌面操作系统。RV64G是RISC-V重要的基础指令架构,采用简化指令译码逻辑,能够更容易预测指令预取模式,进而减少内存访问次数、提高指令执行速度,降低功耗,为广泛的通用计算领域提供了简单且完备的指令集,使开发者可以更好的对高性能计算进行优化。RV64G SIG是由openKylin社区共建单位睿芯发起成立,致力于构建RV64G软件生态体系,以支持更加广泛的RISC-V硬件。基于64位高性能RISC-V CPU的成功运行填补了社区在RV64G领域的空白,为开源桌面操作系统市场带来了全新的活力与机遇,也为RISC-V架构在通用高性能领域的进一步优化和快速增长奠定了基础。
【关键词】中科通量,高性能,openKylin系统
【软件产业】首次应用多项数据中心创新技术,华为云芜湖枢纽正式开服(2024-06-14)
【摘要】 6月14日,C114网讯,6月14日,华为云华东(芜湖)数据中心正式开服,这标志着华为云全国存算网的枢纽节点布局全面完成。而这一芜湖数据中心集群首个开服的项目,也意味着东数西算的长三角枢纽节点可面向华东及中部区域提供超大规模算力服务,将有力推动相关区域的AI产业发展。华为公司常务董事、华为云CEO张平安表示,华为云芜湖数据中心规划占地约6000亩,规划了300万台服务器,秉承华为云在节能、AI集群、液冷机房的丰富经验,芜湖数据中心构筑了绿色低碳、安全可靠等技术优势。同时,为满足超大规模算力需求,芜湖数据中心首次采用了华为云全新研发的多元算力对等池化架构:通过分布式擎天架构实现CPU、NPU、GPU、内存等多样资源统一抽象、池化,从单体算力架构演进到矩阵算力架构,使算力提升50倍;通过超高带宽的Scale Up网络,将资源对等连接起来,打破了单体算力性能和集群线性度瓶颈,可有效提升了大模型的训练效率;此外,通过瑶光智慧云脑可将多种池化资源统一调度管理,实现灵活按需组合,提供百亿到万亿参数模型的最优算力配比。
【关键词】华为云,芜湖枢纽,创新技术
【软件产业】Arm推出人工智能优化的Arm终端计算子系统以及新的Arm Kleidi软件(2024-05-31)
【摘要】 5月31日,极客网讯,5月30日,Arm控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)今日宣布推出Arm终端计算子系统(CSS),以提供领先的人工智能(AI)体验,助力芯片合作伙伴更轻松、快速地构建基于Arm架构的解决方案,并加速其产品上市进程。Arm终端CSS为旗舰系统级芯片(SoC)提供基础计算要素,其具备最新的Armv9CPU、Arm Immortalis GPU、基于三纳米工艺生产就绪的CPU和GPU物理实现,以及最新的Core Link?系统互连和系统内存管理单元(SMMU)。此外,今日同步推出的Arm Kleidi将有助于软件开发者无缝取得Arm CPU上的最佳性能,其包括面向AI工作负载的Kleidi AI和面向计算机视觉应用的Kleidi CV。Arm终端CSS是迄今速度最快的Arm计算平台,提升了30%以上的计算和图形性能,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了59%的AI推理速度,适用于更广泛的AI/机器学习(ML)和计算视觉工作负载。
【关键词】Arm,人工智能,计算子系统
【软件产业】清华大学团队研制出世界首款类脑互补视觉芯片“天眸芯”(2024-05-30)
【摘要】 5月30日,C114网讯,近日,清华大学在类脑视觉感知芯片领域取得重要突破:清华大学依托精密仪器系的类脑计算研究中心施路平教授团队,提出一种基于视觉原语的互补双通路类脑视觉感知新范式,研制出世界首款类脑互补视觉芯片“天眸芯”,基于该研究成果的论文《面向开放世界感知具有互补通路的视觉芯片》(A Vision Chip with Complementary Pathways for Open-world Sensing)被作为本期《自然》(Nature)杂志,这是该团队继异构融合类脑计算“天机芯”后,第二次登上 Nature 杂志封面,标志着中国在类脑计算和类脑感知方向取得重要突破。“天眸芯”在极低的带宽(降低90%)和功耗代价下,实现了每秒10000帧的高速、10bit的高精度130dB的高动态范围的视觉信息采集。它不仅突破了传统视觉感知范式的性能瓶颈,而且能够高效应对各种极端场景,确保系统的稳定性和安全性。基于“天眸芯”,团队还自主研发了高性能软件和算法,并在开放环境车载平台上进行了性能验证。在多种极端场景下,该系统实现了低延迟、高性能的实时感知推理,展现了其在智能无人系统领域的巨大应用潜力。
【关键词】清华大学,类脑互补,视觉芯片
【软件产业】山西大学团队用图调控网络实现高性能点云分割(2024-05-27)
【摘要】 5月27日,金台资讯网讯,5月25日,记者从山西大学获悉,该校智能信息处理研究所团队用图调控网络实现高性能点云分割,相关成果发表在人工智能领域国际期刊《IEEE模式分析与机器智能汇刊》。点云数据分析广泛应用于自动驾驶、三维理解和机器人等领域。点云分割是点云数据分析领域中基本且具有挑战性的任务,旨在根据不同属性与功能将目标点云划分成不同区域。在点云不同分割区域边界处,邻域节点往往存在较强异质性。此前的方法在实现特征聚合过程中忽略了节点之间同质与异质关系。这使得节点特征混入不必要的异质节点信息,导致点云分割边界模糊。针对上述问题,研究团队提出了一种图调控网络,将点云建模为同质—异质图。他们结合图注意力模型,设计了基于同质性指导的图注意力卷积,挖掘局部邻域内同质性特征。研究团队还进一步设计了原型特征提取模块,从全局范围原型空间中进一步挖掘同质性特征,提高节点特征判别性,进一步提升点云分割性能。据悉,研究成果进一步增强了节点特征的判别性,提高了点云分割边界清晰度。
【关键词】山西大学,人工智能,点云分割