导读
周报内容均源自海内外主流媒体报道、高校官网等公开信息梳理、相关领域优质KOL原创深度,主要包括超算快讯、前沿应用、学术研究等。
本期超算&AI应用周报共4262字,预计阅读时间18分钟,您可以重点专注以下内容。
另外,文末有惊喜,我们为您准备了超算&AI应用知识库,可免费获得更多热门软件资源。
超算快讯:超算互联网上线LAMMPS、NAMD国产异构加速版,可免费下载使用
前沿应用:Claude 3在化学领域一骑绝尘,全面碾压GPT-4;全球最强开源模型一夜易主,1320亿参数推理飙升2倍;Stability AI 发布全新代码大模型,3B以下性能最优;StreamingT2V:从文本到千帧级高质量视频流;Neuralink脑机接口实验:意念控制技术的突破
学术研究:研究人员为GPT-4 准确注释单细胞类型开发R 软件包 GPTCelltype;中南大学刘韶团队构建 IMN4NPD 平台;机器学习和物理模型的「双向奔赴」,3种AI气候建模方法;复旦大学团队研发HoGRC框架,提升动力学预测精度
一、超算快讯:
超算互联网上线LAMMPS 国产异构加速版,提升大规模分子动力学模拟效率
LAMMPS是一个用于分子动力学模拟的开源软件包,它广泛应用于计算材料科学、固体力学、化学和生物学等领域,用于模拟原子和分子之间的相互作用及其运动。LAMMPS 国产异构加速版现已上线超算互联网。
国产异构加速版增加了LAMMPS GPU包和KOKKOS包的具体功能,两者均是为了加速模拟计算而开发。LAMMPS GPU包的主要特点:
数据交换:每个时间步长,原子基础数据(例如坐标,力)在CPU和GPU之间来回移动。
邻居列表:邻居列表可以在CPU或GPU上构建。
PPP的部分运算:PPP的电荷分配和力插值部分可以在GPU上运行。
并行计算:不同风格的力计算(配对vs键/角/二面角/不规则)可以分别在GPU和CPU上并行执行。
LAMMPS的KOKKOS包则是一个模板化的C++库,KOKKOS包允许完全的LAMMPS计算,如多时步迭代时,完全在GPU上运行(除非进程间的MPI通信),以致基于粒子的数据(如坐标,力)并不需要在CPU和GPU间来回传递。当每个GPU核上的粒子数大的时候,该方法的加速优势会得到充分体现。
下载链接:
https://www.scnet.cn/ui/mall/detail/goods?type=software&common1=APP_SOFTWARE&id=1773594724688801794&resource=APP_SOFTWARE
超算互联网上线NAMD国产异构加速版,助力生物分子模拟高效计算
NAMD国产异构加速版现已上线超算互联网,可免费下载使用。
NAMD是一款高性能的分子动力学模拟软件,专门设计用于模拟大规模生物分子系统,如蛋白质、核酸和脂质膜等。NAMD国产异构加速版为生物医学研究人员提供一个更快、更可靠的工具,能够在更短的时间内模拟更大、更复杂的生物分子系统。
NAMD 国产异构加速版包含以下特点:
高性能模拟:NAMD 加速版是专为实现大型生物分子系统的高性能模拟而设计,模拟模型越大加速效果越好。
多卡并行计算:NAMD 加速版使用多卡计算时,具有非常高的并行加速比。
自由能扰动计算:基准测试表明,FEP实现速度具有非常大的提升并且没有任何明显的精度损失。
下载链接:
https://www.scnet.cn/ui/mall/detail/goods?type=software&common1=APP_SOFTWARE&id=1773597602561167362&resource=APP_SOFTWARE
二、前沿应用:
Claude 3在化学领域一骑绝尘,全面碾压GPT-4
近日,一支来自OSU的团队构建了一个专门针对化学任务指令微调的数据集,命名为SMolInstruct。
该SMolInstruct测试集涵盖了14种任务,包括名称转换、属性预测、分子描述、分子生成、正向合成和逆向合成等,这些专业任务经过精心挑选,以建立坚实的化学基础。
研究人员在SMolInstruct数据集上对四个开源LLM(Galactica、Llama 2、Code Llama和Mistral)进行微调,创建了一系列专门用于化学任务的LLM,称为LlaSMol。
Claude 3推出后,该团队便在SMolInstruct 该基准测试上对于Claude 3 Opus同样进行了实验。虽然与LlaSMol还是有差距,但在大多数任务中,Claude 3的表现远远超过GPT-4。
虽然在其中的一个名称转换任务S2F中,也就是一个将用于表示分子结构的文本字符串转换为分子式去计算原子数量的任务,Claude 3要比GPT-4差得多,但大多数任务的大幅领先还是展现了Claude 3在专业领域学习能力上的优越性。
论文链接:
https://arxiv.org/pdf/2402.09391.pdf
全球最强开源模型一夜易主,1320亿参数推理飙升2倍
3月28日,全球最强开源大模型王座易主,创业公司Databricks发布的DBRX,超越了Llama 2、Mixtral和Grok-1。
它采用了细粒度MoE架构让DBRX成为开源模型的SOTA,推理速度比LLaMA 2-70B快了2倍!
最重要的是,训练成本直接砍半!只用了1000万美元和3100块H100,Databricks就在2个月内肝出了DBRX。比起Meta开发Llama2所用的成本和芯片,这只是很小一部分。
DBRX在语言理解、编程、数学和逻辑方面轻松击败了开源模型LLaMA2-70B、Mixtral,以及Grok-1。
甚至,DBRX的整体性能超越GPT-3.5。尤其在编程方面,完全击败了GPT-3.5。
并且,DBRX还为开放社区和企业提供了仅限于封闭模型的API功能。现在,基本模型(DBRX Base)和微调模型(DBRX Instruct)的权重,已经在Hugging Face开放许可了。
内容链接:
https://mp.weixin.qq.com/s/88zvF3vwtTJcGl__HR6hBg
集体出走的Stability AI 发布全新代码大模型,3B以下性能最优
Stability AI又有新动作!程序员又有危机了?3月26日,Stability AI推出了先进的代码语言模型Stable Code Instruct 3B,该模型是在Stable Code 3B的基础上进行指令调优的Code LM。
Stable Code Instruct 3B有以下几个功能特点:
自然语言理解 :Stable Code Instruct 3B可以理解以自然语言为主的编程指令,并有效执行生成高质量代码;
支持多种编程语言 :Stable Code Instruct 3B不仅支持Python、Javascript、Java、C、C++和Go等语言,还支持其他广泛采用的语言如SQL、PHP和Rust;
多样化编程任务:Stable Code Instruct 3B不仅精通代码生成,还擅长FIM(填充中间)任务、数据库查询、代码翻译、解释和创作;
更强的代码理解能力:Stable Code Instruct 3B在训练集最初未包括的语言(如Lua)中也能够表现出较强的测试性能。这种熟练程度可能源于其对底层编码原理的理解。(夕小瑶科技说)
内容链接:
https://mp.weixin.qq.com/s/BN6MsuOmKWc-HLQhigfkQg
StreamingT2V:从文本到千帧级高质量视频流
UT奥斯丁等机构提出了一种名为StreamingT2V的技术专门设计用于解决文本到视频转换过程中长视频生成的问题。
StreamingT2V 能够根据文本描述生成包含多达 1200 帧、时长达到 2 分钟甚至更长的连续、高质量视频,且不会出现停滞现象,确保视频的时间一致性、与文本描述的一致性和高帧率的图像质量。
StreamingT2V 技术的主要特点如下:
时间一致性与高图像质量:该技术确保生成的视频不仅与输入的描述性文本高度对齐,还保持了高帧级别的图像质量,保证了整个视频的时间一致性。
平滑过渡与高运动量:通过集成条件注意力模块(CAM),StreamingT2V 能够实现视频块间的平滑过渡,赋予视频丰富的运动动态,避免了传统方法在生成长视频时可能出现的硬剪辑问题。
短期记忆与长期记忆机制:条件注意力模块(CAM)作为短期记忆组件,通过注意力机制捕捉并融合前一视频块的信息来引导当前块的生成,保障相邻块间内容的一致性;而外观保留模块(APM)则作为长期记忆模块,从首个视频块提取并维持高级场景和对象特征,以防止模型在生成过程中遗忘初始场景。
随机混合方法与优化流程:通过随机混合方法,StreamingT2V 可以无限次自回归地应用视频增强器来提升视频质量,且在块与块之间保持视觉效果的连贯性。其整体工作流程包括初始化阶段、流式处理T2V阶段和流优化阶段,以逐步迭代的方式生成并优化长视频内容。
内容链接:
https://streamingt2v.github.io/
Neuralink脑机接口实验:意念控制技术的突破
马斯克的脑机接口公司Neuralink的首位人体试验志愿者Noland Arbaugh(昵称阿堡),该技术通过微创手术将先进的脑机接口芯片植入瘫痪患者的大脑,实现大脑信号与外部电子设备间的实时交互。芯片能捕捉、解码并转换用户的神经活动信号,用户仅凭意念即可实现对外界事物的精细控制。
在实验中,阿堡仅在植入芯片后七小时即打破了原有的光标控制学习任务纪录,不仅能够流畅地玩转《马里奥赛车》,甚至在游戏中击败了正常玩家,同时他还能够进行诸如移动光标下国际象棋、调整直播背景音乐等多元化的复杂任务。
Neuralink团队在项目实施过程中进行了高强度的研发和调试工作,包括频繁的脑机接口会诊和技术优化,确保了系统长期稳定运行,芯片连续工作时间超过5天,收集到了丰富的用户操作数据,共计生成271页详尽的分析报告,证明了该技术在实际应用场景下的可靠性和耐用性。(量子位)
内容链接:
https://mp.weixin.qq.com/s/rL0SwALATgFyNABMMQy7tA
三、学术研究
研究人员为GPT-4 准确注释单细胞类型开发R 软件包 GPTCelltype
哥伦比亚大学梅尔曼公共卫生学院的 Wenpin Hou 和杜克大学医学院的 Zhicheng Ji 证明,大语言模型 GPT-4 可以在单细胞 RNA 测序分析中使用标记基因信息准确注释细胞类型。
当对数百种组织和细胞类型进行评估时,GPT-4 生成的细胞类型注释与手动注释表现出很强的一致性。此功能可以大大减少细胞类型注释所需的人类专家工作量和专业知识。并且,研究人员还为 GPT-4 的自动细胞类型注释开发了 R 软件包 GPTCelltype。
该研究以「Assessing GPT-4 for cell type annotation in single-cell RNA-seq analysis」为题,于 2024 年 3 月 25 日发布在《Nature Methods》。
论文链接:
https://www.nature.com/articles/s41592-024-02235-4
全面挖掘天然药物的药效成分,中南大学刘韶团队构建 IMN4NPD 平台
生物活性天然产物 (NPs) ,即自然界长期进化的物质实体,是生物活性物质和实用药物研发的重要源泉。在药物研发进程中,NPs 对于癌症和传染病治疗药物的创新有着巨大贡献。但时至今日,NPs 仍在筛选、分离、表征、优化等各方面存在技术障碍。其中,从复杂混合物中分离 NPs 可谓是最为严峻的挑战之一,这也成为了药物研究的一大瓶颈。
为了解决这一瓶颈, 中南大学湘雅医院药学部刘韶教授团队,创新性地建立了一种可全面挖掘天然药物药效成分的整合分子网络框架 (integrated molecular networking workflow for NP dereplication, IMN4NPD),不仅加快了分子网络中广泛集群的去复制 (dereplication),而且对现有研究方法中经常被忽略的自循环与成对节点提供标注。相关研究成果日前被发表于美国化学会 (ACS) 期刊 Analytical Chemistry。(HyperAI超神经)
论文链接:
https://doi.org/10.1021/acs.analchem.3c04746
机器学习和物理模型的「双向奔赴」,3种AI气候建模方法
机器学习通过发现数据集中的模式来学习,已经在天气预报中显示出前景,现在正在介入帮助解决气候建模中的一些问题。
研究人员主要通过三种方式使用人工智能进行气候建模。第一种方法是开发一种称为模拟器的机器学习模型,该模型可以产生与传统模型相同的结果,而无需进行所有数学计算。
由华盛顿西雅图艾伦人工智能研究所的大气科学家 Christopher Bretherton 领导的研究人员通过将十组初始大气条件输入基于物理的模型,为该模型创建了一个名为 ACE 的训练数据集。对于每组数据,基于物理的模型都预测了包括气温、水蒸气和风速在内的 16 个变量在未来十年内将如何变化。
第二种方法中,研究人员以更基本的方式使用人工智能,为气候模型提供动力。这些「基础」模型随后可以进行调整,以执行各种下游气候和天气相关任务。
加州大学洛杉矶分校的计算机科学家 Aditya Grover 和微软的研究人员构建了第一个此类基础模型,名为 ClimaX。它根据五个基于物理的气候模型的输出进行训练,这些模型模拟了 1850 年至 2015 年的全球天气和气候,包括气温、气压和湿度等因素,模拟时间尺度从几小时到几年不等。与模拟器模型不同,ClimaX 并未针对模仿现有气候模型的特定任务进行训练。
第三种方法是将机器学习组件嵌入基于物理的模型中以生成混合模型。在这种情况下,机器学习模型将仅替代传统模型中效果表现较差的方面——通常是对小规模、复杂和重要过程的建模,例如云的形成、积雪和河流。
美国宇航局和欧盟委员会正在开展类似的研究,用于创建「数字孪生」地球。欧洲中期天气预报中心的 Florian Pappenberger 表示,这个名为「Destination Earth」(DestinE)的项目将于 2024 年 6 月进入第二阶段,其中机器学习技术将发挥关键作用。(ScienceAI)
内容链接:
https://www.nature.com/articles/d41586-024-00780-8
复旦大学团队研发HoGRC框架,高效整合高阶结构信息提升动力学预测精度
近日,复旦大学林伟教授和朱群喜博士领导的研究团队开发了一种名为高阶格兰杰储备池计算(HoGRC)的轻量级机器学习框架,融合了格兰杰因果关系推理与储备池计算,旨在解决复杂系统高阶相互作用的发现及其动力学预测难题。面对现实中系统高阶结构信息不完全的问题,团队创新设计了贪心迭代算法以推测未知高阶结构,并将其整合入高阶RC模型中。
实验表明,该框架在多个系统实例(如混沌系统、网络系统及英国电网)中表现出优秀的结构推断能力和优于传统方法的动力学预测准确性,尤其在处理电网系统的高阶交互动力学时,显示出显著优势。未来研究将关注扩展HoGRC的应用范围至更复杂的真实系统、优化算法消除间接因果效应,以及深化框架的理论基础与泛化能力等方面。(自然通讯)
论文链接:
https://www.nature.com/articles/s41467-024-46852-1
相关新闻
-
2025-04-18
超算&AI应用周报Vol.53 | 智谱6款GLM模型、Skywork-OR1、InternVL3、HiDream-I1上线
-
2025-04-18
机器化学家:算力=智力=研究力
-
2025-04-17
最佳实践Vol.35 | Wan2.1-ComfyUI实操:玩转AI视频,让文字、图片一键动起来
-
2025-04-17
科研更“晋”一步 - 国家超算互联网生态沙龙在太原顺利开展
-
2025-04-16
智谱GLM开源模型系列上线,32B性能比肩DeepSeek-R1