新闻动态

首页 > 新闻动态 > 超算&AI应用周报|ABACUS v3.6.0版本上线超算互联网,助力大原子模型建设
2024-04-07

超算&AI应用周报|ABACUS v3.6.0版本上线超算互联网,助力大原子模型建设

导读

周报内容均源自海内外主流媒体报道、高校官网等公开信息梳理、相关领域优质KOL原创深度,主要包括超算快讯、前沿应用、学术研究等。

本期超算&AI应用周报共4216字,预计阅读时间18分钟,您可以重点专注以下内容。

另外,文末有惊喜,我们为您准备了超算&AI应用知识库,可免费获得更多热门软件资源。


超算快讯:ABACUS v3.6.0版本、GROMACS国产异构加速版上线超算互联网

前沿应用:ChatGPT官宣免注册,OpenAI将取代谷歌搜索?谷歌更新Transformer架构;ChatGPT能帮你P图了;阿里7B多模态文档理解大模型

学术研究:浙江大学杜震洪团队提出 GNNWLR 模型;斯坦福抗生素设计AI模型 SyntheMol;普林斯顿首个「开源」AI程序员登场;AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA

640.png


一、超算快讯:


ABACUS v3.6.0版本上线超算互联网,助力大原子模型建设


原子算筹(ABACUS)是国产开源密度泛函理论软件。4月3日,ABACUS v3.6版本发布,提升了ABACUS在科学研究、科普教学、数据生产、工作流搭建等多个场景的使用体验,助力大原子模型建设。

ABACUS v3.6.0版本现已上线超算互联网,包括以下特点:

  • 升级的DFT+U功能模块支持更准确的过渡金属氧化物计算

  • 国产异构加速卡优化助力大原子模型数据生产

  • ABACUS-Python化进展助力科普教学

  • ABACUS赝势轨道库建设保障计算精度

  • Json格式化输出保护ABACUS和外部接口的稳定性


下载链接:

https://www.scnet.cn/ui/mall/detail/goods?type=software&common1=APP_SOFTWARE&id=1775441873730904066&resource=APP_SOFTWARE


超算互联网上线GROMACS国产异构加速版


GROMACS是一款开源的分子动力学模拟软件,广泛用于研究蛋白质、脂质、核酸以及其他生物分子的动态行为。

GROMACS v2023.2 加速版现已上线超算互联网,包括以下特点:

  • 并行计算优化:改进并行处理算法,以便更有效地利用多核CPU和GPU资源,减少计算时间。

  • GPU加速:集成GPU加速功能,利用图形处理单元的高并行性能来显著加快模拟过程。

  • 高性能计算(HPC)兼容性:优化软件以在超级计算机和集群环境中运行,包括对各种文件系统和调度系统的支持。

  • 算法改进:采用更高效的数值积分方法和更新算法,减少计算过程中的资源消耗。

  • 内存管理:优化内存使用,通过更智能的数据结构和缓存机制减少内存占用,提高数据处理速度。

  • 性能分析工具:集成性能分析工具,帮助用户识别和解决计算过程中的性能瓶颈。


下载链接:

https://www.scnet.cn/ui/mall/detail/goods?type=software&common1=APP_SOFTWARE&id=1776806893363470338&resource=APP_SOFTWARE


二、前沿应用:


ChatGPT官宣免注册,OpenAI将取代谷歌搜索?


OpenAI这份愚人节礼物,实在是太大了:4月1日起,ChatGPT不用注册,可以直接使用。


ChatGPT的无门槛使用标志着互联网进入了一个新的时代,即GenAI时代,ChatGPT可能成为新的互联网基础设施。


从此以后,互联网的样子,从这样:


640 (1).png


变成了这样:


640 (2).png


OpenAI表示,其使命是让更多人能够轻松使用ChatGPT等工具,享受AI带来的便利。他们正在逐步开放这项服务,让每个对AI感兴趣的人都能轻松体验。


ChatGPT诞生伊始,就不断有人发问:它会不会取代谷歌搜索引擎?比起谷歌,ChatGPT给出的答案无疑更智能,更高效。如果非要挑一个缺点,就是目前开放的版本有知识截止日期,而谷歌没有。


不仅是OpenAI,AI搜索引擎Perplexity也向谷歌发起了挑战,已经在计划利用广告赚钱了……


这个成立一年的搜索引擎由来自Meta和OpenAI的AI研究人员创建,它既使用了OpenAI的GPT模型,也使用了其自有的AI模型。


目前,Perplexity已经拥有超过1000万的月活跃用户,付费模式是每月20美元的订阅。(新智元)


内容链接:

https://mp.weixin.qq.com/s/MNFCQDiQI3l1L6bOQ9DbHQ


谷歌更新Transformer架构,更节省计算资源!50%性能提升


MoE还没有弄清楚呢,MoD都已经来了!近日,谷歌更新了Transformer架构。最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计算模式。


它在输入序列中的特定位置动态分配FLOPs(运算次数或计算资源),优化不同层次的模型深度中的分配。


通过限制给定层的自注意力和MLP计算的token数量,迫使神经网络学会主要关注真正重要的信息。


结果显示,在等效计算量和训练时间上,MoD每次向前传播所需的计算量更小,而且后训练采样过程中步进速度提高50%。


研究团队还探讨了MoD和MoE结合的可能性——MoDE。结果表明二者结合能提供更好的性能和更快的推理速度。(量子位)


640 (3).png


论文地址:
https://arxiv.org/abs/2404.02258


只需简单说几个字,ChatGPT现在能帮你P图了


现在,不论是网页、iOS 还是安卓版的 ChatGPT,都可以用上 DALL-E 3 强大的编辑图像功能了。


在 AI 画图领域,Stable Diffusion,Midjourney 与 DALL-E 一直是最受欢迎的三大工具。其中 OpenAI 提出的 DALL-E 已经发展到了第三代,随着技术的进展,它已经可以实现添加元素、改变视角、调光修色等复杂操作。


人们只需告诉 ChatGPT 想要什么,剩下的事情交给 AI 来完成就行了。具体而言,DALL·E的编辑界面赋予了用户增加、剔除或变更图像中特定部分的能力。


例如,在以下案例中,通过标注一只鸟并输入“移除鸟类”的指令,便可以执行去除鸟类的操作:


640 (4).png


同样,用户可以对选中的对象进行特定属性的修改。比如在下面的示例中,小猫的面部区域被选中,并且输入了“将猫的表情改为开心”的指令:编辑完成之后,用户可以点击编辑器右上角的保存键,储存作品。

640 (5).png

640 (6).png


阿里7B多模态文档理解大模型拿下新SOTA


阿里mPLUG团队的mPLUG-DocOwl 1.5开源项目针对多模态文档理解的四大挑战——高分辨率图片文字识别、通用文档结构理解、指令遵循和外部知识引入,提出创新解决方案,并在多项基准测试中取得SOTA成绩,5个数据集上提升超过10个点,部分数据集上超过智谱17.3B的CogAgent,在DocVQA上达到82.2的效果。


640 (7).png


具体技术亮点如下:

  • 高分辨率图片文字识别:通过形状适应切图模块,将文档图片切割成适于低分辨率编码器处理的子图,避免文字模糊,有效利用现有通用视觉编码器资源,降低训练成本。

  • 通用文档结构理解:采用H-Reducer结构(卷积+全连接层),保持视觉特征位置关系,提高结构信息传递效率,利于LLM处理高分辨率文档。设计统一结构学习任务,针对不同图片类型制定特定解析规则,利用DocStruct4M训练集提升模型对多领域文档图片的结构解析和文字定位能力。

  • 指令遵循:整合多任务为指令问答形式,进行多任务联合训练,构建通用文档模型。引入DocReason25K详细解释数据集,通过微调提升模型在基准测试上的详细解释能力。

  • 外部知识引入:推出mPLUG-PaperOwl,构建M-Paper数据集,提供论文图表上下文作为外部知识,利用“要点”引导图表分析,展现初步论文图表分析能力,但存在领域局限性和知识来源单一性问题待解决。(量子位)


内容链接:

https://mp.weixin.qq.com/s/vtymW1k93ZLSOqj0iWwe6A



三、学术研究:


浙江大学杜震洪团队提出 GNNWLR 模型:提升成矿预测准确性


随着矿产勘查学科的不断发展,业内已经逐步形成以「成矿系统-勘查系统-预测评价系统」为指导的研究路线。尽管人工智能在矿产资源预测评价 (MPM) 系统中发挥着越来越重要的作用,但其应用仍存在一定的局限性,往往使得地质学家难以相信最终结果。


为了提升成矿预测模型的可解释性,以及成矿过程中因地质因素导致的空间非平稳性,浙江大学的研究团队提出了一种新的地理空间人工智能方法——地理神经网络加权逻辑回归 (geographically neural network-weighted logistic regression, GNNWLR)。

640 (8).png

GNNWLR模型6个特征层回归系数的空间分布


该模型集成了空间模式 (spatial patterns) 和神经网络,结合 Shapley 加性解释理论,不但能够大幅提升预测的准确性,并且能够在复杂的空间场景中提升矿物预测的可解释性。

研究亮点:

  • 提出了一种地理神经网络加权逻辑回归模型 GNNWLR

  • GNNWLR 在矿产资源预测评价方面优于其他先进模型

  • GNNWLR 克服了空间异质性和非线性影响

  • GNNWLR 提升了人工智能用于成矿机制的可解释性(HyperAI超神经)


论文链接:

https://www.sciencedirect.com/science/article/pii/
S1569843224001006?via%3Dihub


斯坦福抗生素设计AI模型 SyntheMol登Nature子刊


全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。


斯坦福大学和麦克马斯特大学(McMaster University)的研究人员发明了一种新的生成式 AI 模型 SyntheMol,可以设计数十亿种新的抗生素分子,这些分子价格低廉且易于在实验室中合成。

640 (9).png

SyntheMol 模型


SyntheMol 可以从近 300 亿个分子的化学空间中设计易于合成的新化合物。该模型可以设计新的抗生素来阻止鲍曼不动杆菌的传播。发现 6 个结构新颖的分子表现出对鲍曼不动杆菌的抗菌活性。


论文作者、斯坦福大学生物医学数据科学副教授 James Zou 说,「SyntheMol 不仅设计了有希望的候选药物的新颖分子,而且还生成了如何制造每种新分子的配方。」


相关研究以《Generative AI for designing and validating easily synthesizable and structurally novel antibiotics为题发布在《Nature Machine Intelligence上。(ScienceAI)


论文链接:

https://www.nature.com/articles/s42256-024-00809-7


普林斯顿首个「开源」AI程序员登场!爆改GPT-4,93秒修bug


4月2日,普林斯顿的CS/NLP硕士生John Yang在Github上开源了一款堪比Devin的利器——全新的智能体-计算机接口(ACI)——SWE-agent。不到一天,就在Github上斩获了1.3k星。


简单来说,SWE-agent能够让大语言模型(比如GPT-4)变身为软件工程AI智能体,并在真实的GitHub仓库里自己修bug。


在SWE-bench测试集上,SWE-agent成功解决了12.29%的问题,平均耗时只有93秒,而且重要的是,开源!

640 (10).png


此外,SWE-agent 通过与专用终端交互来工作,这使得它能够:

  • 打开、滚动和搜索文件

  • 使用自动语法检查编辑特定行

  • 编写并执行测试,这个定制的界面对于良好的性能至关重要

关于SWE-agent的技术报告,将在4月10日上线。(新智元)


内容链接:

https://mp.weixin.qq.com/s/Mr4yv6t3-k7K5H5or5aGNg


AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA


AI视频,已然成为多模态LLM发展的大趋势。然而,除了视频生成,让LLM对复杂视频进行理解,也至关重要。


最近,来自KAUST和哈佛大学的研究人员提出了MiniGPT4-Video——专为视频理解而设计的多模态大模型。


值得一提的是,MiniGPT4-Video能够同时处理时态视觉数据和文本数据,因此善于理解视频的复杂性。


比如,上传一个宝格丽的首饰宣传视频。


640.gif


MiniGPT4-Video能够为其配出标题,宣传语。


MiniGPT4-video不仅考虑了视觉内容,还纳入了文本对话,使该模型能够有效地回答涉及视觉和文本内容的查询。


实验结果显示,新方法在MSVD、MSRVTT、TGIF和TVQA基准上分别提高了4.22%、1.13%、20.82%和13.1%。


论文地址:
https://arxiv.org/pdf/2404.03413.pdf

640 (11).png


点击进入HPC&AI应用知识库