导读
周报内容均源自海内外主流媒体报道、高校官网等公开信息梳理、相关领域优质KOL原创深度,主要包括超算快讯、最佳实践、前沿应用、学术研究等。
本期超算&AI应用周报共4681字,预计阅读时间16分钟,您可以重点专注以下内容。
超算快讯:AlphaFold 3快捷体验入口上线超算互联网,提供蛋白质结构预测服务;DeepMD v3.0.0a0国产异构加速版、零一万物大模型Yi-1.5上线超算互联网
最佳实践:LLMs 大模型微调实战教程,手把手教你训练部署大模型
前沿应用:谷歌AI全家桶火力全开:Project Astra智斗GPT-4o,Veo视频生成挑战Sora;字节跳动豆包大模型家族震撼来袭;腾讯混元文生图,打造首个中文原生DiT开源模型
学术研究:阅读经典|影响IT走向的25篇顶刊论文合集上线(附原文、译文);ThemeStation框架,以微量样本打造风格统一的3D梦幻乐园;专注RNA序列分析,百度&上交大RNAErnie模型登Nature子刊
一、超算AI快讯:
AlphaFold 3快捷体验入口上线超算互联网,提供蛋白质结构预测服务
本周,超算互联网已上线AlphaFold 3快捷体验入口,限额供科研工作者进行非商业性研究,预测蛋白质如何与细胞中的其他分子相互作用。
AlphaFold 3 允许用户提交蛋白质序列,系统将返回该序列预测的三维结构。这一服务对于理解蛋白质功能、加速药物研发、解析生物机制等领域有着重要意义。
在超算互联网用户无需本地安装复杂软件或拥有高级计算资源,即可一键启用,利用AlphaFold的先进算法获得高质量的结构预测。此次体验入口服务名额有限,您可扫描下方二维码,或登录超算互联网搜索“AlphaFold ”抢先体验。
DeepMD v3.0.0a0国产异构加速版上线超算互联网
DeepMD是一款用于分子动力学模拟的软件,它基于深度学习技术,可以高效地预测分子系统的势能和物理性质。
DeePMD v3.0.0a0 引入了许多新特性和改进,包括:
多后端框架:v3版本允许用户在TensorFlow和PyTorch两个框架上训练和运行深度势能模型,提供了统一的训练和推理体验。用户可基于需求在不同后端间切换,支持模型的后端转换,并鼓励开发者贡献新的后端。
PyTorch后端与大原子模型(DPA-2):新增的PyTorch后端专为大原子模型和科学研究设计,特别是在DPA-2模型的支持上,该模型是一种能够高效模拟多种化学和材料体系的新架构,目前仅在PyTorch后端实现。
开发便利性提升:与TensorFlow的静态图相比,PyTorch后端采用动态图,全部用Python编写,使得模型扩展和调试更为便捷,适合科研探索和快速原型开发。
超算互联网已上线DeepMD v3.0.0a0国产异构加速版,使其在高性能并行和分布式计算方面表现出色,易于适应不同的深度学习势能模型描述符。
零一万物大模型Yi-1.5上线超算互联网,支持一键试用
5月13日,超算互联网上线来自中国大模型公司零一万物带来了Yi 大模型家族新成员Yi-1.5模型,包括6B、9B、34B 三个版本,采用 Apache 2.0 许可证。
Yi-1.5系列模型在结构上与Yi系列模型保持一致,是Yi系列模型的增量预训练版本,Base模型使用500B Tokens的高质量语料库进行的增量预训练,Chat模型是在Base模型上使用300万指令数据微调得来。
与Yi系列模型相比,Yi-1.5系列模型在编码、数学、推理、指令遵循、语言理解、常识推理和阅读理解等多方面展现了更为出色的能力。
Yi-1.5系列模型在超算互联网已经可以一键部署体验,开发者可扫描下方二维码,或登录超算互联网搜索“Yi-1.5”一键试用。
二、最佳实践
LLMs 系列大模型微调实战教程,手把手教你训练部署大模型
超算互联网推出算例精选、最佳实践系列专题“超链接”,通过利用国家超算互联网的HPC软件、AI模型等工具链接科研工作者、AI开发者,分享科研成果与超算应用实践。
本篇为“超链接”系列专题的第一篇最佳实践文章,您将获得LLMs 大模型本地部署与高效微调入门指南,轻松在超算互联网打造自己的大模型。
如果您有创新研究成果、高效计算方法、成功案例分析或者关于超算应用的独到见解想要分享,欢迎投稿或联系报道,让我们共同推动国家超算互联网的生态发展。
本文以超算互联网上的Llama-3-8B-Instruct大模型为例进行本地部署和微调训练,将手把手介绍Llama 3本地部署流程与Llama 3高效微调流程。
该训练教程适合于常见LLMs系列模型,如Llama2、Llama3、ChatGLM、Qwen等。即使你是训练大模型的新手,通过本教程,也可以快速在超算互联网训练自己的大模型。
详细的“LLMs系列大模型本地部署与高效微调入门教程”可扫描下方二维码查看。如果实战教程对大家有帮助,欢迎关注超算互联网,也欢迎加入我们的技术交流群,分享您的最佳实践。
三、前沿应用:
谷歌AI全家桶火力全开:Project Astra智斗GPT-4o,Veo视频生成挑战Sora
在5月15日凌晨的Google I/O开发者大会上,谷歌展示了其在人工智能领域的多项重大进展,几乎每分钟都围绕AI展开。
本次开发者大会要点内容包括:
Gemini模型革新:谷歌首席执行官桑达尔·皮查伊宣布,Gemini技术将深入搜索、图片、生产力工具和安卓系统等各个领域。Gemini 1.5 Pro和Gemini 1.5 Flash的发布,分别增强了性能和提升了速度效率,Gemini Nano也开始支持图片输入,预示着手机用户将能享受到多模态交互体验。
Project Astra和Veo发布:作为对OpenAI的GPT-4o和Sora的直接回应,谷歌推出了Project Astra和Veo,展示了其在生成式AI领域的最新成果。Veo是一款视频生成模型,能够根据文本提示生成连贯、逼真的视频内容,支持多模态输入,包括延时拍摄、航拍等电影级指令。
多模态和长文本能力:谷歌强调了大模型在多模态交互和处理长文本方面的进步,使得搜索引擎和Google Workspace等生产力工具变得更智能。用户可以向Gemini提出复杂问题并获得综合答案,甚至能帮助制定计划、总结邮件和分析会议记录。
Imagen 3模型:在文本到图像生成方面,谷歌发布了Imagen 3,优化了细节生成、光照处理和对长prompt的理解能力,解决了图像中文字模糊的问题,并提供了多个优化版本以适应不同任务需求。
第六代TPU芯片Trillium:谷歌推出了迄今为止性能最强、能效最高的TPU芯片Trillium,专为处理最先进AI工作负载设计,支持Gemini 1.5 Flash、Imagen 3等新模型的高效训练和部署。(机器之心)
内容链接:https://www.jiqizhixin.com/articles/2024-05-15
字节跳动豆包大模型家族震撼来袭,掀起大模型‘厘’世代风暴
5月15日,字节旗下的火山引擎第一次正式亮相了豆包大模型家族,一口气直接祭出了9个成员。其中核心是豆包通用模型,分为大杯(豆包通用模型pro)和小杯(豆包通用模型lite)两个版本,分别满足不同的使用需求。
其主要亮点包括:
模型性能:豆包通用模型分为Pro和Lite两个版本,Pro版支持大窗口尺寸和精调,Lite版则更注重响应速度。128K窗口尺寸虽非业内最大,但已足够满足日常需求,且经过精调,模型能准确应对超长文本任务。
语音技术:豆包大模型家族涵盖了语音合成、声音复刻、语音识别等技术,效果接近真人,能表达复杂情感;声音复刻技术能在短时间内完成高质量的声音复制;语音识别模型在复杂环境下表现优异,错误率显著降低。
角色扮演模型:提供个性化的智能交互体验。对文生图等能力上也做了升级;这个功能可以在对话窗口直接输入prompt,也可以在智能体广场中选择自己喜欢的类型。
差异化插件与服务:提供联网、内容、RAG知识库插件,增强模型的个性化和行业适应性,满足企业对模型的独特需求。(量子位)
内容链接:https://www.qbitai.com/2024/05/142438.html
腾讯混元文生图,打造首个中文原生DiT开源模型
5月14日,腾讯宣布其混元文生图大模型完成全面升级并实行开源,其采用与Sora相同的DiT架构(Diffusion With Transformer),不仅适用于文生图生成,也可作为多模态视觉内容如视频生成的基础。
模型要点内容包括:
业内首发中文原生DiT架构:这是首个中文原生的DiT(Diffusion with Transformer)架构文生图开源模型,参数量达到15亿,支持中英文双语输入和理解。
Hunyuan-DiT架构:采用与Sora相同的Hunyuan-DiT架构,不仅适用于文生图生成,还能作为视频等多模态视觉内容生成的基础。
性能优越:模型在文本图像一致性、排除AI伪影、主题清晰度及审美等方面表现优异,超越开源的Stable Diffusion模型,整体能力达到国际领先水平。
技术创新:模型基于Transformer架构的扩散模型(DiT),相较于过去的U-Net架构,提供了更好的扩展性和生成效率。结合双语CLIP和多语言T5编码器,支持多轮对话,根据上下文优化图像生成,最长支持256字符的长文本输入。
中文原生特色:作为首个中文原生的DiT模型,混元文生图在处理古诗词、俚语、传统建筑、中华美食等中国元素方面表现出色,填补了中文文生图领域的空白。
安全与效率:模型开源使得开发者无需从零开始训练,直接用于推理,节省大量资源。(机器之心)
内容链接:https://www.jiqizhixin.com/articles/2024-05-15-6
四、学术研究:
阅读经典|影响IT走向的25篇顶刊论文合集上线(附原文、译文)
在众多的科技浪潮中,IT顶刊论文无疑是对计算机世界产生深远影响的里程碑。近日,超算互联网梳理上线了“影响IT的25篇顶刊论文”合集,其中包含了Google的GFS、Bigtable、MapReduce三大论文,以及引领NLP模型架构的变革的“Attention Is All You Need”等经典之作。
这些论文涵盖了分布式存储、数据库设计、机器学习算法等多个领域,如Amazon的高可用性键值存储系统Dynamo、Facebook的代码生成工具Thrift以及Twitter的时间戳和事件排序服务。这些论文不仅展示了IT各个领域的研究成果,也为工程师和技术人员提供了宝贵的实践经验。
为方便大家阅读下载这些论文,超算互联网上架了25篇顶刊论文原文,编译了论文核心要点、中文译文。感兴趣的技术人员可扫描下方二维码或登录超算互联网搜索“影响IT走向的25篇重要论文”在线查阅。
ThemeStation框架,以微量样本打造风格统一的3D梦幻乐园
近日,香港城市大学、上海人工智能实验室和南洋理工大学S-Lab开发了一种创新框架ThemeStation,能够仅凭少量甚至单个3D样本,生成主题统一、质量高的3D模型系列,适用于构建3D主题乐园等应用场景。
ThemeStation亮点包括:
两阶段生成框架:它采用了一个两阶段的生成策略,模仿实际3D建模流程,包括:
第一阶段:主题驱动的概念图像生成。通过微调预训练的文本到图像(T2I)扩散模型,利用3D样例的多视角渲染图像生成主题一致的概念草图。此阶段旨在提取主题信息,避免过拟合,并产生多样化的概念设计。
第二阶段:参考信息驱动的3D资产建模。基于第一阶段得到的概念图和原始3D样例,先用图像到3D技术生成基础模型,再利用双重分数蒸馏(DSD)损失函数进行优化。DSD结合了概念先验(来自概念图)和参考先验(来自3D样例),通过差异化处理不同噪声水平下的先验信息,确保主题一致性和细节丰富性。
双重分数蒸馏(DSD):这是ThemeStation的关键技术创新,能够处理在3D生成中常见的两种互相冲突的先验信息,即概念层面的创意布局与细节层面的精确匹配。通过智能分配不同先验在去噪过程中的权重,有效解决了信息冲突,提升了生成模型的质量。
扩散先验扩展:ThemeStation是首次尝试将扩散先验应用于3D到3D内容生成的挑战性任务中,标志着在3D内容生成领域的前沿探索。
目前该研究成果已被SIGGRAPH 2024会议接收,且相关方法已开源。论文链接:https://arxiv.org/abs/2403.15383
专注RNA序列分析,百度&上交大RNAErnie模型登Nature子刊
5月13日,百度大数据实验室和上海交通大学合作研发了名为RNAErnie的预训练模型,该模型专注于RNA序列分析,基于Transformer架构并融入了知识集成增强表示框架。RNAErnie通过在一个包含约2300万条精心筛选的RNA序列的广泛语料库上进行预训练,展现出对RNA序列的强大理解和分析能力。
图示:模型概述
研究团队通过实验评估,证明了RNAErnie在监督和无监督学习任务上的卓越性能,相较于基线模型,其分类准确率提高1.8%,交互预测准确率提升2.2%,结构预测的F1得分增加3.3%。模型的设计考虑了RNA的类型多样性,通过在预训练阶段加入粗粒度RNA类型标记,促进了模型在各类下游RNA分析任务中的适应性。
图示:RNAErnie 捕获多级本体模式。
RNAErnie的灵活性允许通过调整输出和反馈信号来适应新任务,为RNA研究提供了一个灵活强大的工具。尽管存在处理长序列的限制及对RNA三维结构分析能力的不足,但RNAErnie仍然是RNA研究领域的重大进步。
目前该研究以「Multi-purpose RNA language modelling with motif-aware pretraining and type-guided fine-tuning」为题,于 2024 年 5 月 13 日发布在《Nature Machine Intelligence》。
论文链接:https://www.nature.com/articles/s42256-024-00836-4
点击链接https://bvjoh3z2qoz.feishu.cn/docx/O1Cndurj0oFVUhx1bS9cjySinLf,进入HPC&AI应用知识库
相关新闻
-
2025-04-18
超算&AI应用周报Vol.53 | 智谱6款GLM模型、Skywork-OR1、InternVL3、HiDream-I1上线
-
2025-04-18
机器化学家:算力=智力=研究力
-
2025-04-17
最佳实践Vol.35 | Wan2.1-ComfyUI实操:玩转AI视频,让文字、图片一键动起来
-
2025-04-17
科研更“晋”一步 - 国家超算互联网生态沙龙在太原顺利开展
-
2025-04-16
智谱GLM开源模型系列上线,32B性能比肩DeepSeek-R1