【软件产业】谷歌量子计算机另一个里程碑:纠错领域取得突破性进展(2023-02-28)
【摘要】 2月28日,机器之心网讯,周三(2月22日),科学顶刊《自然》上公布了一项壮举:谷歌宣布量子计算机在纠错方面已取得突破性进展,达到了通向实用量子计算机道路上的第二个里程碑。量子计算机被誉为计算的未来,能够运行一些在传统计算机上非常困难或不可能进行的计算。但它们也容易出错,这是该技术实际应用中存在的主要问题之一。所以纠错也是量子计算机面临的主要挑战之一。在加利福尼亚州圣巴巴拉市的一个实验室里,谷歌的研究人员已经证明,他们可以通过增大量子比特的数量来降低计算的错误率。谷歌将这一突破称为,继2019年“量子优势”里程碑后的第二个里程碑。2019年的一项著名实验得出,谷歌的量子计算机实现了“量子优势”——即执行在普通计算机上需要数千年才能完成的计算。
【关键词】谷歌,计算机,量子计算
【软件产业】中科院团队用AI图像识别搭建新系统,允许自动识别和分选单个细胞(2023-01-12)
【摘要】 1月12日,机器之心网讯,直接从原位样本中鉴定、分选和测序单个细胞对于深入分析微生物组的结构和功能具有巨大潜力。在最新的一项研究中,基于用于细胞表型筛选的人工智能(AI)辅助对象检测模型和用于单细胞输出的跨界面接触方法,中国科学院的研究人员开发了一种名为EasySortAUTO的基于索引的自动化系统,其中对单个微生物细胞进行分类,然后将其包装在微滴中,并以精确索引的「单细胞单管」方式自动导出。基于AI辅助对象检测模型自动识别目标细胞,然后通过光镊调动目标细胞进行分选。并且,该团队开发的跨界面接触微流控打印方法可以将细胞从芯片自动转移到管中,从而与后续的单细胞培养或测序相结合。单细胞打印系统的效率>93%。单细胞打印系统的吞吐量约为120个细胞/小时。
【关键词】原位,样本,分选
【软件产业】ChatGPT的狂欢背后:短板犹在,启发甚多,2023有这些事可以做…...(2023-01-12)
【摘要】 1月12日,机器之心网讯,2022年的最后一个月,OpenAI用一个爆款对话机器人——ChatGPT回应了人们一整年的期待,尽管它并不是大家期盼已久的GPT-4。用过ChatGPT的人都能体会到,它是一个真正的「六边形战士」:不仅能拿来聊天、搜索、做翻译,还能写故事、写代码、debug,甚至开发小游戏、参加美国高考……有人戏称,从此以后人工智能模型只有两类——ChatGPT和其他。由于能力过于惊艳,ChatGPT仅上线5天就吸引了100万用户。很多人大胆预测,照这个趋势发展下去,ChatGPT很快就能取代Google等搜索引擎和StackOverflow等编程问答社区了。
【关键词】对话,机器人,惊艳
【软件产业】用于化学动力学模拟的原子神经网络表示(2023-01-12)
【摘要】 1月12日,机器之心网讯,机器学习技术已广泛应用于化学、物理、生物学和材料科学的许多领域。最富有成果的应用之一是从离散量子化学数据中学习势能或相关电子特性的复杂多维函数。特别是,大量努力致力于开发各种原子神经网络(AtNN)表示,这些表示是指将目标物理量表示为由原子NN表示的原子分量之和的一系列方法。这类方法不仅完全保留了系统的物理对称性,而且相对于系统的大小呈线性缩放,从而能够在复杂系统甚至跨相的多个可变大小系统中进行准确有效的化学动力学和光谱模拟。
【关键词】原子,神经网络,对称性
【软件产业】无需人工标注,自生成指令框架打破ChatGPT等LLM的成本瓶颈(2023-01-12)
【摘要】 1月12日,机器之心网讯,当前,大型语言模型的性能已经达到了很高的水平,除了进一步挖掘其潜力,我们还应该关注到模型背后的人工标注成本。ChatGPT是今年年底AI圈的新晋顶流,人们惊叹于它强大的问答语言能力和掌握的编程知识。但越是强大的模型,其背后的技术要求也就越高。ChatGPT是在GPT3.5系列模型的基础上,引入「人工标注数据+强化学习」(RLHF)来不断微调预训练语言模型,旨在让大型语言模型(LLM)学会理解人类的命令,并学会根据给定的prompt给出最优的答案。
【关键词】模型,大型,语言
【软件产业】单卡算力超90000 FPS,墨芯高稀疏率计算卡S30首次亮相GTIC(2022-12-28)
【摘要】 12月28日,机器之心网讯,稀疏化计算引领者——墨芯人工智能携高稀疏率计算卡S30、S10和S4参展GTIC 2022全球AI芯片峰会」(以下简称GTIC),展现稀疏化计算在AI算力和能效比上的领导力,以及推动AI计算向更高算力、更高能效比、更低成本快速发展的最新商业进展。在27日刚结束的上午会议中,墨芯当选“2022中国AI芯片企业50强”。在此次GTIC的核心展台——5号展台,墨芯人工智能首次向业内全面发布首批高稀疏率计算卡S4、S10和S30。
【关键词】AI,芯片,峰会
【软件产业】NeurIPS虚拟电厂竞赛:阿里达摩院夺冠 减碳超一成(2022-12-28)
【摘要】 12月28日,机器之心网讯,在全球AI顶会NeurIPS 2022的虚拟电厂国际竞赛中,阿里达摩院研究团队获得冠军。他们提出的电力调度AI解决方案,创新性地融合预测技术、优化技术和强化学习,使得实验项目在用电量不变的前提下,碳排放量减少13.6%,电费减低28.2%。这项创新有望加速虚拟电厂尤其是零碳园区的落地推广,推动能源绿色转型。
【关键词】电力调度,AI,解决方案
【软件产业】预测更准确,使用机器学习改进化学品的毒性评估(2022-12-28)
【摘要】 12月28日,机器之心网讯,从命运和毒性的角度来看,人类暴露的化学空间随着化学物质的多样性而不断扩大。欧洲和美国的化学品机构列出了大约80万种化学品。对于这些化学品中的大多数,人们对其环境归宿或毒性知之甚少。近日,来自阿姆斯特丹大学、昆士兰大学和挪威水研究所的研究团队,开发了一个基于随机森林的直接分类模型,该模型将分子描述符与毒性联系起来。该模型是通过实验定义的907种有机化学品的急性鱼类毒性96小时LC50值数据集开发、验证和测试的。该分类模型解释了数据中约90%的训练集方差和约80%的测试集方差。与基于定量构效关系(QSAR)建模的传统「计算机模拟」评估相比,该策略使错误分类的频率降低了5倍。与QSAR方法相比,提出的直接分类模型具有更好的性能,使该方法成为评估化学品危害和风险的可行工具。
【关键词】命运,毒性,多样性
【软件产业】屡破世界纪录 云从科技斩获全球权威FRVT测试三项第一(2022-12-28)
【摘要】 12月28日,机器之心网讯,近日,全球权威人脸识别算法测试(NIST-FRVT)发布最新榜单,云从科技研究院在人脸识别1:1、人脸识别1:N和口罩遮挡下的人脸识别三个赛道,全部获得冠军。遥遥领先东芝、三星等其他厂商和科研机构,展现出强大的技术实力,以中国AI力量惊艳全球。NIST-FRVT通过不同类型的照片样本进行上百亿次对比,对人脸识别算法的评估可达到百万分之一精度,是公认的当今全球规模最大、标准最严、竞争最激烈、最权威的人脸识别算法测试,有工业界黄金标准之称。测试集丰富,覆盖场景较全面,要求模型具有足够的泛化性。同时,FRVT数据均来自真实业务场景,测试结果代表该技术在实战场景中的表现,更考验算法的落地价值。
【关键词】全球权威,人脸识别,算法测试
【软件产业】登顶全球最权威AI性能基准评测,百度飞桨给分布式训练创造了标杆(2022-11-21)
【摘要】 11月21日,机器之心网讯,11月10日,机器学习基准测试平台MLPerf放出了最新一期榜单,在BERT模型训练排行榜上,百度使用飞桨框架提交的8机64卡配置在同等GPU配置下获得第一名。而BERT模型中的Transformer结构正是目前主流大模型的基础架构。百度提交的方案中,64块GPU在149秒内训练了BERT模型。在国际权威基准测试中取得领先,体现了飞桨框架在分布式训练性能上的优势,其中用到的技术也已成为百度业务创新的重要组成部分。
【关键词】百度,飞桨框架,第一名
【软件产业】首次将“教导主任”引入模型蒸馏,大规模压缩优于24种SOTA方法(2022-11-21)
【摘要】 11月21日,机器之心网讯,来自人民中科和中科院自动化所的研究者,他们提出了一种基于“教导主任-教师-学生”模式的统一的模型压缩技术。在与24种主流模型压缩方法进行比较后,证明本文所提方法的优越性。面对越来越深的深度学习模型和海量的视频大数据,人工智能算法对计算资源的依赖越来越高。为了有效提升深度模型的性能和效率,通过探索模型的可蒸馏性和可稀疏性,本文提出了一种基于“教导主任-教师-学生”模式的统一的模型压缩技术。
【关键词】模式,模型,压缩
【软件产业】日本研发出半导体“芯粒”集成化关键技术,可改善成品率(2022-11-21)
【摘要】 11月21日,机器之心网讯,据日经中文网报道,日本东京工业大学及AOI Electronics等研究团队开发出了连接功能不同的多个半导体芯片、使其像一个芯片一样工作的关键技术。该技术可以提高芯片的集成密度和电气特性,改善成品率。报道指出,过去,芯粒之间的连接大多使用被称为“中介层(Interposer)”的中间基板。中介层的主流是硅基板,但这种基板在电气特性、定位精度、成本等方面存在问题。而此次的技术优势在于能以最小限度的元素实现芯粒之间或者芯粒与外部的连接。可以轻松提高芯粒的集成密度,或者改善电气特性,而且容易进行连接的定位。另一个优点是能够提高使芯粒与外部实现电气连接的布线的高频特性和散热性能。
【关键词】日本,东京,中介层
【软件产业】瞄准欧洲E级超算需求,SiPearl与AMD宣布合作开发解决方案(2022-11-21)
【摘要】 11月21日,机器之心网讯,据外媒报道,欧洲处理器倡议(EPI)产业化实体SiPearl公司日前宣布与AMD合作,将为百亿亿次级(E级)超算系统提供联合解决方案。根据合作安排,SiPearl将把AMD Instinct加速器与其Rhea处理器进行整合,并评估AMD开源ROC软件与Rhea处理器的互操作性,进行针对性优化,实现对AMD一系列异构计算编程模型、开发框架的兼容,使第三方欧洲研究机构能够较为便利地将其计算需求移植到SiPearl/AMD解决方案,也将有助于SiPearl产品被更多HPC服务器厂商接受。根据公开信息,SiPearl的Rhea处理器是面向EuroHPC计划需求设计,综合了Arm架构和EPI计划中开发的RISC-V矢量加速器,以及包括英飞凌在内的其他EPI计划参与者提供的免费授权IP,计划以6纳米工艺制造。
【关键词】SiPearl,AMD,超算
【软件产业】打破不可能三角、比肩5400亿模型,IDEA封神榜团队仅2亿级模型达...(2022-10-31)
【摘要】 10月31日,机器之心网讯,在今年的一篇文章中指出,自预训练技术被提出以来,NLP界一直存在着一个不可能三角,即一个模型不能同时满足:中等模型大小(10亿以下);SOTA的Few-Shot(甚至是Zero-shot)性能;SOTA的Fine-tuning性能。不可能三角存在的原因是,当前预训练模型的参数量只有达到一定的数量级,并且使用提示学习才能体现出强大的few/zero-shot性能。最近封神榜团队被EMNLP2022收录的论文:《Zero-ShotLearnersforNaturalLanguageUnderstandingviaaUnifiedMultipleChoicePerspective》则打破了这一魔咒,提供了一个灵活高效的解决思路。论文提出的UniMC在拥有模型参数量很小(仅仅是亿级)和SOTA的Fine-tuning能力的前提下,同时还能拥有(与5400亿的PaLM相当的)SOTA的Few/Zero-Shot性能。
【关键词】SOTA,2亿级,模型
【软件产业】1.84Pb/s,两倍于全球互联网带宽总和:单激光器实现最快数据传输...(2022-10-31)
【摘要】 10月31日,机器之心网讯,有些时候,人们形容网络的效率不如卡车运硬盘:亚马逊AWS就有一种名为snowmobile的服务,真的使用集装箱卡车,一次可以传输100Pb。这种大号U盘传数据的体量可谓巨大,但也从另一个方面告诉我们,网络传输数据存在很大的瓶颈。近日,来自丹麦技术大学(DTU)和瑞典哥德堡查尔姆斯理工大学的研究小组实现了迄今为止最高的数据传输效率,并且是世界上第一个仅使用单个激光器和单个光芯片实现每秒传输超过1拍比特(Pbit/s)的研究。在实验中,研究人员仅使用一个光源在7.9公里的距离上实现了传输速率1.8Pbit/s——1Petabit相当于12.5万Gigabyte,根据一些估算,全世界使用的平均互联网带宽约为1Pbit/s,因此它的速度接近全球带宽的两倍。
【关键词】数据,传输,效率
【软件产业】电动汽车11分钟充电70%,华人教授在锂电池中加镍箔登上Nature(2022-10-31)
【摘要】 10月31日,机器之心网讯,在电动汽车越来越热的当下,电池的材料也越来越多样化。电动汽车的电池材料有不同的选择,例如固态锂电池。上个月,哈佛大学自主研发了一种新型固态锂电池,仅需3分钟就可以充满电,使用寿命更是能够超过10000次。举个例子,在传统远程电动汽车的旅行时,电池容量120千瓦时且需要一个小时充满电的电池组可以替换为电池容量60千瓦时且仅充电10分钟的电池组,二者的续航里程保持非常接近。这项研究是由宾夕法尼亚州立大学材料与工程学杰出教授王朝阳(Chao-YangWang)等多位研究人员完成的,并发表在了10月12日的Nature上。王朝阳教授是燃料电池和二次电池领域的专家学者,并于2019年12月当选为美国国家发明家科学院院士。
【关键词】特殊,材料,镍箔
【软件产业】掀起一股中国风,最强中文AI作画大模型文心ERNIE-ViLG2.0来了(2022-10-31)
【摘要】 10月31日,机器之心网讯,AI作画在全世界越来越盛行。近日,百度发布知识增强跨模态大模型——ERNIE-ViLG2.0,在AI作画领域取得新突破。该模型采用基于知识增强算法的混合降噪专家建模,是全球首个知识增强的AI作画大模型,也是目前全球参数规模最大的AI作画大模型。据了解,ERNIE-ViLG2.0在文本生成图像公开权威评测集MS-COCO和人工盲评上均超越了StableDiffusion、DALL-E2等模型,取得了当前该领域的世界最好效果,在语义可控性、图像清晰度、中国文化理解等方面均展现出了显著优势。
【关键词】中文,AI,作画
【软件产业】从古代矿物到新材料:使用图神经网络模型进行熔融温度预测(2022-09-30)
【摘要】 9月30日,机器之心网讯,在常压下,如果你施加足够的热量,大多数东西都会融化,就像炎热夏日的冰淇淋一样。了解准确的熔化温度对于构建任何高性能材料都至关重要。飞机上的桥梁、燃气轮机、喷气发动机和隔热罩的建造和安全取决于对材料性能极限的了解。材料通常采用熔融或液态合成或加工,因此了解熔融对于制造新材料至关重要。然而,高温材料的熔化温度,通常难以快速测量或计算;在200000种已知无机化合物中,只有不到10%的熔点是已知的。在这里,亚利桑那州立大学(ArizonaStateUniversity)的研究人员采用机器学习方法通过建立从化学式到熔化温度的快速准确映射来填补这一空白。他们建立了一个机器学习模型,在包含10,000种化合物的数据库上进行训练,可以在几分之一秒内预测熔解温度。该模型在线公开,具有图神经网络和残差神经网络架构。
【关键词】准确,熔化温度,材料
【软件产业】中山大学通过深度学习分子模拟加速有理PROTAC设计,助力药物研发(2022-09-30)
【摘要】 9月30日,机器之心网讯,蛋白水解靶向嵌合体(PROTACs)已成为通过使用泛素-蛋白酶体系统选择性降解疾病相关蛋白的有效工具。开发PROTAC涉及广泛的测试和试验,以探索广阔的化学空间。为了加速这一过程,中山大学的研究团队提出了一种新的深度生成模型,用于在低资源环境中合理设计PROTAC,然后通过深度强化学习引导对具有最佳药代动力学的PROTAC进行采样。将这种方法应用于含溴结构域的蛋白质4靶蛋白,该团队生成了5,000种化合物,这些化合物通过基于机器学习的分类器和物理驱动的模拟进一步过滤。作为概念验证,研究人员鉴定、合成和实验测试了六种候选的含溴结构域的蛋白质4降解PROTAC,其中三种通过基于细胞的测定和蛋白质印迹分析进行了验证。进一步测试了一种主要候选药物,并在小鼠中证明了良好的药代动力学。这种深度学习和分子模拟的结合可以促进合理的PROTAC设计和优化。
【关键词】深度,模型,PROTAC
【软件产业】存储和操作n维数据的难题,谷歌用一个开源软件库解决了(2022-09-30)
【摘要】 9月30日,机器之心网讯,TensorStore 是专为存储和操作 n 维数据而设计的开源软件库。计算机科学和机器学习 (ML) 的许多应用都需要处理跨坐标系的多维数据集,并且单个数据集可能也需要存储TB或PB的数据。另一方面,使用此类数据集也具有挑战性,因为用户可能会以不规则的间隔和不同的规模读取和写入数据,通常还会执行大量的并行工作。为了解决上述问题,谷歌开发了一个开源的C++和Python软件库TensorStore,专为存储和操作n维数据而设计。谷歌AI负责人JeffDean也在推特上发文表示TensorStore现已正式开源。
【关键词】开源,C++,软件库