新闻动态

首页 > 新闻动态 > 超算&AI应用周报 | AlphaFold 3快捷体验入口、影响IT走向的顶刊论文集、Llama3微调实战教程上线

2024-05-17

超算&AI应用周报 | AlphaFold 3快捷体验入口、影响IT走向的顶刊论文集、Llama3微调实战教程上线

导读

周报内容均源自海内外主流媒体报道、高校官网等公开信息梳理、相关领域优质KOL原创深度，主要包括超算快讯、最佳实践、前沿应用、学术研究等。

本期超算&AI应用周报共4681字，预计阅读时间16分钟，您可以重点专注以下内容。

超算快讯：AlphaFold 3快捷体验入口上线超算互联网，提供蛋白质结构预测服务；DeepMD v3.0.0a0国产异构加速版、零一万物大模型Yi-1.5上线超算互联网
最佳实践：LLMs 大模型微调实战教程，手把手教你训练部署大模型
前沿应用：谷歌AI全家桶火力全开：Project Astra智斗GPT-4o，Veo视频生成挑战Sora；字节跳动豆包大模型家族震撼来袭；腾讯混元文生图，打造首个中文原生DiT开源模型
学术研究：阅读经典|影响IT走向的25篇顶刊论文合集上线（附原文、译文）；ThemeStation框架，以微量样本打造风格统一的3D梦幻乐园；专注RNA序列分析，百度&上交大RNAErnie模型登Nature子刊

一、超算AI快讯：

AlphaFold 3快捷体验入口上线超算互联网，提供蛋白质结构预测服务

本周，超算互联网已上线AlphaFold 3快捷体验入口，限额供科研工作者进行非商业性研究，预测蛋白质如何与细胞中的其他分子相互作用。

AlphaFold 3 允许用户提交蛋白质序列，系统将返回该序列预测的三维结构。这一服务对于理解蛋白质功能、加速药物研发、解析生物机制等领域有着重要意义。

在超算互联网用户无需本地安装复杂软件或拥有高级计算资源，即可一键启用，利用AlphaFold的先进算法获得高质量的结构预测。此次体验入口服务名额有限，您可扫描下方二维码，或登录超算互联网搜索“AlphaFold ”抢先体验。

DeepMD v3.0.0a0国产异构加速版上线超算互联网

DeepMD是一款用于分子动力学模拟的软件，它基于深度学习技术，可以高效地预测分子系统的势能和物理性质。

DeePMD v3.0.0a0 引入了许多新特性和改进，包括：

多后端框架：v3版本允许用户在TensorFlow和PyTorch两个框架上训练和运行深度势能模型，提供了统一的训练和推理体验。用户可基于需求在不同后端间切换，支持模型的后端转换，并鼓励开发者贡献新的后端。
PyTorch后端与大原子模型（DPA-2）：新增的PyTorch后端专为大原子模型和科学研究设计，特别是在DPA-2模型的支持上，该模型是一种能够高效模拟多种化学和材料体系的新架构，目前仅在PyTorch后端实现。
开发便利性提升：与TensorFlow的静态图相比，PyTorch后端采用动态图，全部用Python编写，使得模型扩展和调试更为便捷，适合科研探索和快速原型开发。

超算互联网已上线DeepMD v3.0.0a0国产异构加速版，使其在高性能并行和分布式计算方面表现出色，易于适应不同的深度学习势能模型描述符。

零一万物大模型Yi-1.5上线超算互联网，支持一键试用

5月13日，超算互联网上线来自中国大模型公司零一万物带来了Yi 大模型家族新成员Yi-1.5模型，包括6B、9B、34B 三个版本，采用 Apache 2.0 许可证。

Yi-1.5系列模型在结构上与Yi系列模型保持一致，是Yi系列模型的增量预训练版本，Base模型使用500B Tokens的高质量语料库进行的增量预训练，Chat模型是在Base模型上使用300万指令数据微调得来。

与Yi系列模型相比，Yi-1.5系列模型在编码、数学、推理、指令遵循、语言理解、常识推理和阅读理解等多方面展现了更为出色的能力。

Yi-1.5系列模型在超算互联网已经可以一键部署体验，开发者可扫描下方二维码，或登录超算互联网搜索“Yi-1.5”一键试用。

二、最佳实践

LLMs 系列大模型微调实战教程，手把手教你训练部署大模型

超算互联网推出算例精选、最佳实践系列专题“超链接”，通过利用国家超算互联网的HPC软件、AI模型等工具链接科研工作者、AI开发者，分享科研成果与超算应用实践。

本篇为“超链接”系列专题的第一篇最佳实践文章，您将获得LLMs 大模型本地部署与高效微调入门指南，轻松在超算互联网打造自己的大模型。

如果您有创新研究成果、高效计算方法、成功案例分析或者关于超算应用的独到见解想要分享，欢迎投稿或联系报道，让我们共同推动国家超算互联网的生态发展。

本文以超算互联网上的Llama-3-8B-Instruct大模型为例进行本地部署和微调训练，将手把手介绍Llama 3本地部署流程与Llama 3高效微调流程。

该训练教程适合于常见LLMs系列模型，如Llama2、Llama3、ChatGLM、Qwen等。即使你是训练大模型的新手，通过本教程，也可以快速在超算互联网训练自己的大模型。

详细的“LLMs系列大模型本地部署与高效微调入门教程”可扫描下方二维码查看。如果实战教程对大家有帮助，欢迎关注超算互联网，也欢迎加入我们的技术交流群，分享您的最佳实践。

三、前沿应用：

谷歌AI全家桶火力全开：Project Astra智斗GPT-4o，Veo视频生成挑战Sora

在5月15日凌晨的Google I/O开发者大会上，谷歌展示了其在人工智能领域的多项重大进展，几乎每分钟都围绕AI展开。

本次开发者大会要点内容包括：

Gemini模型革新：谷歌首席执行官桑达尔·皮查伊宣布，Gemini技术将深入搜索、图片、生产力工具和安卓系统等各个领域。Gemini 1.5 Pro和Gemini 1.5 Flash的发布，分别增强了性能和提升了速度效率，Gemini Nano也开始支持图片输入，预示着手机用户将能享受到多模态交互体验。

Project Astra和Veo发布：作为对OpenAI的GPT-4o和Sora的直接回应，谷歌推出了Project Astra和Veo，展示了其在生成式AI领域的最新成果。Veo是一款视频生成模型，能够根据文本提示生成连贯、逼真的视频内容，支持多模态输入，包括延时拍摄、航拍等电影级指令。

多模态和长文本能力：谷歌强调了大模型在多模态交互和处理长文本方面的进步，使得搜索引擎和Google Workspace等生产力工具变得更智能。用户可以向Gemini提出复杂问题并获得综合答案，甚至能帮助制定计划、总结邮件和分析会议记录。
Imagen 3模型：在文本到图像生成方面，谷歌发布了Imagen 3，优化了细节生成、光照处理和对长prompt的理解能力，解决了图像中文字模糊的问题，并提供了多个优化版本以适应不同任务需求。

第六代TPU芯片Trillium：谷歌推出了迄今为止性能最强、能效最高的TPU芯片Trillium，专为处理最先进AI工作负载设计，支持Gemini 1.5 Flash、Imagen 3等新模型的高效训练和部署。（机器之心）

内容链接：https://www.jiqizhixin.com/articles/2024-05-15

字节跳动豆包大模型家族震撼来袭，掀起大模型‘厘’世代风暴

5月15日，字节旗下的火山引擎第一次正式亮相了豆包大模型家族，一口气直接祭出了9个成员。其中核心是豆包通用模型，分为大杯（豆包通用模型pro）和小杯（豆包通用模型lite）两个版本，分别满足不同的使用需求。

其主要亮点包括：

模型性能：豆包通用模型分为Pro和Lite两个版本，Pro版支持大窗口尺寸和精调，Lite版则更注重响应速度。128K窗口尺寸虽非业内最大，但已足够满足日常需求，且经过精调，模型能准确应对超长文本任务。
语音技术：豆包大模型家族涵盖了语音合成、声音复刻、语音识别等技术，效果接近真人，能表达复杂情感；声音复刻技术能在短时间内完成高质量的声音复制；语音识别模型在复杂环境下表现优异，错误率显著降低。
角色扮演模型：提供个性化的智能交互体验。对文生图等能力上也做了升级；这个功能可以在对话窗口直接输入prompt，也可以在智能体广场中选择自己喜欢的类型。
差异化插件与服务：提供联网、内容、RAG知识库插件，增强模型的个性化和行业适应性，满足企业对模型的独特需求。（量子位）

内容链接：https://www.qbitai.com/2024/05/142438.html

腾讯混元文生图，打造首个中文原生DiT开源模型

5月14日，腾讯宣布其混元文生图大模型完成全面升级并实行开源，其采用与Sora相同的DiT架构（Diffusion With Transformer），不仅适用于文生图生成，也可作为多模态视觉内容如视频生成的基础。

模型要点内容包括：

业内首发中文原生DiT架构：这是首个中文原生的DiT（Diffusion with Transformer）架构文生图开源模型，参数量达到15亿，支持中英文双语输入和理解。
Hunyuan-DiT架构：采用与Sora相同的Hunyuan-DiT架构，不仅适用于文生图生成，还能作为视频等多模态视觉内容生成的基础。
性能优越：模型在文本图像一致性、排除AI伪影、主题清晰度及审美等方面表现优异，超越开源的Stable Diffusion模型，整体能力达到国际领先水平。
技术创新：模型基于Transformer架构的扩散模型（DiT），相较于过去的U-Net架构，提供了更好的扩展性和生成效率。结合双语CLIP和多语言T5编码器，支持多轮对话，根据上下文优化图像生成，最长支持256字符的长文本输入。
中文原生特色：作为首个中文原生的DiT模型，混元文生图在处理古诗词、俚语、传统建筑、中华美食等中国元素方面表现出色，填补了中文文生图领域的空白。
安全与效率：模型开源使得开发者无需从零开始训练，直接用于推理，节省大量资源。（机器之心）

内容链接：https://www.jiqizhixin.com/articles/2024-05-15-6

四、学术研究：

阅读经典|影响IT走向的25篇顶刊论文合集上线（附原文、译文）

在众多的科技浪潮中，IT顶刊论文无疑是对计算机世界产生深远影响的里程碑。近日，超算互联网梳理上线了“影响IT的25篇顶刊论文”合集，其中包含了Google的GFS、Bigtable、MapReduce三大论文，以及引领NLP模型架构的变革的“Attention Is All You Need”等经典之作。

这些论文涵盖了分布式存储、数据库设计、机器学习算法等多个领域，如Amazon的高可用性键值存储系统Dynamo、Facebook的代码生成工具Thrift以及Twitter的时间戳和事件排序服务。这些论文不仅展示了IT各个领域的研究成果，也为工程师和技术人员提供了宝贵的实践经验。

为方便大家阅读下载这些论文，超算互联网上架了25篇顶刊论文原文，编译了论文核心要点、中文译文。感兴趣的技术人员可扫描下方二维码或登录超算互联网搜索“影响IT走向的25篇重要论文”在线查阅。

ThemeStation框架，以微量样本打造风格统一的3D梦幻乐园

近日，香港城市大学、上海人工智能实验室和南洋理工大学S-Lab开发了一种创新框架ThemeStation，能够仅凭少量甚至单个3D样本，生成主题统一、质量高的3D模型系列，适用于构建3D主题乐园等应用场景。

ThemeStation亮点包括：

两阶段生成框架：它采用了一个两阶段的生成策略，模仿实际3D建模流程，包括：
第一阶段：主题驱动的概念图像生成。通过微调预训练的文本到图像(T2I)扩散模型，利用3D样例的多视角渲染图像生成主题一致的概念草图。此阶段旨在提取主题信息，避免过拟合，并产生多样化的概念设计。
第二阶段：参考信息驱动的3D资产建模。基于第一阶段得到的概念图和原始3D样例，先用图像到3D技术生成基础模型，再利用双重分数蒸馏(DSD)损失函数进行优化。DSD结合了概念先验（来自概念图）和参考先验（来自3D样例），通过差异化处理不同噪声水平下的先验信息，确保主题一致性和细节丰富性。
双重分数蒸馏(DSD)：这是ThemeStation的关键技术创新，能够处理在3D生成中常见的两种互相冲突的先验信息，即概念层面的创意布局与细节层面的精确匹配。通过智能分配不同先验在去噪过程中的权重，有效解决了信息冲突，提升了生成模型的质量。
扩散先验扩展：ThemeStation是首次尝试将扩散先验应用于3D到3D内容生成的挑战性任务中，标志着在3D内容生成领域的前沿探索。

目前该研究成果已被SIGGRAPH 2024会议接收，且相关方法已开源。论文链接：https://arxiv.org/abs/2403.15383

专注RNA序列分析，百度&上交大RNAErnie模型登Nature子刊

5月13日，百度大数据实验室和上海交通大学合作研发了名为RNAErnie的预训练模型，该模型专注于RNA序列分析，基于Transformer架构并融入了知识集成增强表示框架。RNAErnie通过在一个包含约2300万条精心筛选的RNA序列的广泛语料库上进行预训练，展现出对RNA序列的强大理解和分析能力。

图示：模型概述

研究团队通过实验评估，证明了RNAErnie在监督和无监督学习任务上的卓越性能，相较于基线模型，其分类准确率提高1.8%，交互预测准确率提升2.2%，结构预测的F1得分增加3.3%。模型的设计考虑了RNA的类型多样性，通过在预训练阶段加入粗粒度RNA类型标记，促进了模型在各类下游RNA分析任务中的适应性。

图示：RNAErnie 捕获多级本体模式。

RNAErnie的灵活性允许通过调整输出和反馈信号来适应新任务，为RNA研究提供了一个灵活强大的工具。尽管存在处理长序列的限制及对RNA三维结构分析能力的不足，但RNAErnie仍然是RNA研究领域的重大进步。

目前该研究以「Multi-purpose RNA language modelling with motif-aware pretraining and type-guided fine-tuning」为题，于 2024 年 5 月 13 日发布在《Nature Machine Intelligence》。

论文链接：https://www.nature.com/articles/s42256-024-00836-4

尾巴.jpg

点击链接https://bvjoh3z2qoz.feishu.cn/docx/O1Cndurj0oFVUhx1bS9cjySinLf，进入HPC&AI应用知识库

微信扫一扫，了解更多服务资讯

Hello！我是AI助手

微信扫一扫，了解更多服务资讯

新闻动态

超算&AI应用周报 | AlphaFold 3快捷体验入口、影响IT走向的顶刊论文集、Llama3微调实战教程上线

相关新闻

超算&AI应用周报Vol.53 | 智谱6款GLM模型、Skywork-OR1、InternVL3、HiDream-I1上线

机器化学家：算力=智力=研究力

最佳实践Vol.35 | Wan2.1-ComfyUI实操：玩转AI视频，让文字、图片一键动起来

科研更“晋”一步 - 国家超算互联网生态沙龙在太原顺利开展

智谱GLM开源模型系列上线，32B性能比肩DeepSeek-R1