阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

日报&周刊合集 | 生产力东西与职业运用大全 | 点赞重视评论托付啦!

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

阿里云X森马 | AIGC T 恤规划大赛,函数核算玩转 Stable Diffusion

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

竞赛官网:developer.aliyun.com/adc/series/…

阿里云携手服装品牌森马,推出了本次 AIGC T 恤规划大赛。开发者、规划师、AI绘画爱好者,都能够运用阿里云函数核算快速布置 Stable Diffusion,以「宇宙周游」为主题,进行AI创造并投递著作。

参与即有机会获得 Airpods、阿里云X森马联名T恤、森马定制旅行箱、森马无门槛代金券等丰盛奖励,一切著作均有机会被森马选中并购买版权成为下一季服装图画主题。

需求留意的是,大赛自8月21日开启著作搜集,到9月21日截止上传,并在9月28日发布获奖信息。留意时刻哦~

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

Meta推出开源模型「SeamlessM4T」,能翻译和转录近百种言语

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

8月22日,Meta 宣告推出人工智能多模态模型「SeamlessM4T」,能够直接翻译35种言语的语音和100种言语的文本。SeamlessM4T 的翻译功能很强壮,能够完结语音到文本、语音到语音、文本到语音、文本到文本的翻译,并能够自动识别语音,是 Meta 推出通用翻译器的重要一步。

SeamlessM4T 在翻译基准上的表现要优于 OpenAI 的 Whisper,尽管二者的翻译质量现在都逊色于人类,但距离正在随着模型的优化而不断缩小。

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

Demo:seamless.metademolab.com/demo

秉持其一贯的开源战略,Meta 在开源协议CC BY-NC 4.0下公开发布了 SeamlessM4T,开发人员能够在这个模型的根底上进行开发。同时,Meta 还发布了 SeamlessAlign 的数据集,其博客说到这也是迄今为止最大的开放多模态翻译数据集,覆盖发掘的语音和文本对齐总计达 270,000 小时 ⋙ Meta Blog | GitHub 模型代码下载

巨量引擎推出AI智能成片东西,商家5分钟生成十余条带货短视频

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

上星期,巨量引擎宣告推出AI混剪东西「智能成片」,免费开放给抖音商家运用,能够协助商家轻松制造跑量的带货短视频。

不用写脚本、找素材、找伴奏,只需有产品空镜视频 (至少3条),就能制造爆款带货短视频啦!5分钟即可快速成片,供给10+条跑量效果好的短视频,而且商家0本钱运用、批量成片,大幅节省开支~

以下两个路径均可运用「智能成片」东西:巨量千川PC首页 → 东西 → 三方东西 → 智能成片、星图即合 → 智能成片 ⋙ 巨量千川 | 星图即合

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

一份高质量的 LLM 深度阅览清单,十分有用的资源攻略

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

这篇文章汇集了关于大言语模型 (LLM) 的高质量、有用性强的学习资源合集,内容触及LLM的方方面面,包含理论根底、要害论文、模型操练、实践运用、性能评价等。

这份资源注重有用性和长时间参考价值,防止夸大的营销噱头,旨在真正协助读者把握LLM中心知识和技能,是一篇高质量的LLM学习资源攻略。

以下是清单中各项内容的标题 (已翻译),感兴趣的能够阅览原文:

背景

  • 大型言语模型综述

  • 自留意力和转换器网络

  • 什么是嵌入?

  • 简述词嵌入在机器学习中的运用 (YouTube视频)

  • 了解大型言语模型的奇思妙想

根底论文

  • Attention is all you Need

  • 神经言语模型的扩展规律

  • BERT

  • 言语模型是无监督的多使命学习者

  • 操练言语模型遵循指示

  • 言语模型是少样本学习者

操练自己的模型

  • 为什么要保管自己的言语模型?

  • 怎么操练自己的言语模型

  • 操练核算优化的大型言语模型

  • Opt-175B日志

算法

  • GZIP 分类器的长处

  • Meta 推荐体系:运用和扩展 Word2Vec

  • GPT 现状 (YouTube视频)

  • ChatGPT在做什么以及为什么有效

  • LlamaCPP怎么可能?

  • 关于 prompt engineering

  • 从零开始构建 Transformer

布置

  • 构建面向生产环境的言语模型运用

  • 大型言语模型的挑战和运用

  • 运用言语模型构建产品时无人谈及的一切困难

  • 扩展Kubernetes以运转ChatGPT

  • 每个言语模型开发者都应知道的数字

评价

  • 可解说的机器学习

  • 评价ChatGPT

  • ChatGPT:万能但不通晓

用户体会

  • 除聊天外的生成式界面 (YouTube视频)

  • 为什么聊天机器人不是未来 ⋙ 阅览原文

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

面向新手的 Stable Diffusion 入门攻略,八面玲珑的快速上手宝典

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

这是一个面向 Stable Diffusion 新手的入门攻略系列,一共包含4篇文章,意图是让没有任何经历的读者快速上手这项强壮的AI创造东西。

榜首篇文章环绕 Stable Diffusion 根底知识打开,介绍了其运用办法与各种用法,以及关于提示词、参数和图画修正的内容。以下是文章大纲,感兴趣能够阅览原文:

什么是Stable Diffusion?

怎么运用Stable Diffusion AI?

Stable Diffusion的优势是什么?

Stable Diffusion AI是免费的吗?

试用Stable Diffusion在线演示

Stable Diffusion能做什么?

  • 从文本生成图画

  • 从其他图画生成图画

  • 照片修改

  • 制造视频

怎么运用Stable Diffusion AI?

  • 在线生成器

  • 高档GUI

怎么构建一个好的提示?

构建良好提示的规矩

  • 具体和具体

  • 运用强壮的要害词

那些参数是什么,我应该改变它们吗?

我应该生成多少张图片?

常见的修正图画缺点办法

  • 人脸修正

  • 用修正修正小瑕疵

什么是自定义模型?

  • 我应该运用哪个模型?

  • 怎么操练一个新的模型? ⋙ 榜首篇

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

第二篇文章供给了构建高质量 Stable Diffusion 提示的有用技巧,对新手学习提示词汇和操练构建提示十分有协助。此外,作者主张读者能够经过学习优异的现成提示来快速上手,并在实践中逐步把握提示构建技巧。

入门资源

一个好提示的结构

  • 主题

  • 前言

  • 增加其他要素

构建优质提示的技巧

一些有用的要害词

  • 前言

  • 风格

  • 艺术家

  • 网站

  • 分辨率

  • 光照

  • 附加细节

  • 色彩

总结 ⋙ 第二篇

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

第三篇文章针对 Stable Diffusion 的图画修正功能inpainting 打开,经过具体的分步示例向初学者展现怎么运用inpainting修正图画缺点,并给出了一些有用的inpainting技巧。读完这篇攻略对inpainting的原理和用法会有较为体系的了解。

图画模型和图形用户界面

基本填充设置

  • 运用填充模型(可选)

  • 创建填充遮罩

  • 填充设置:提示词、图画大小、人脸康复、遮罩内容、降噪强度、批量大小

  • 填充成果

  • 再进行一次填充

增加新对象

填充参数解说

  • 降噪强度

  • CFG 份额

  • 遮罩内容

填充技巧 ⋙ 第三篇

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

第四篇包括了 Stable Diffusion 模型方方面面的信息,例如原始模型和微调模型的差异、几种常用的模型微调办法、通用模型、针对特定风格进行微调的模型、模型融合的办法等等。

微调模型

  • 什么是微调?

  • 为什么要制造微调模型?

  • 怎么制造微调模型?

模型

  • Stable Diffusion v1.4

  • Stable Diffusion v1.5

  • F222

  • Anything V3

  • Open Journey

  • 模型比较

  • 最佳模型:DreamShaper、Deliberate v2、Realistic Vision v2、ChilloutMix、Protogen v2.2 (Anime)、GhostMix、Waifu-diffusion、Inkpunk Diffusion

  • 寻觅更多模型

v2模型

SDXL模型

怎么安装和运用模型

兼并两个模型

  • 兼并模型实例

模型变体

  • Pruned, Full, EMA-only模型

  • fp16/fp32模型

  • Safetensor模型

其他类型模型

总结 ⋙ 第四篇

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

与 Eleuther.ai 工程师对谈,揭秘 LLM 操练中的数学奥妙

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

EleutherAI是一家非营利的人工智能研讨组织,致力于开源大规模言语模型的操练和布置。

4月的时候,EleutherAI 发布了一篇名为「Transformer Math 101」的专业文章,总结了工程师们在大言语模型操练中的实践经历,这也应该是领域内适当稀缺且高档的经历总结,对从事相关研讨和工程实践的人具有重要的参考价值。

全体上说,文章总结出了一系列核算 Transformer 模型操练需求的要害公式,并进行了具体的数学推导和阐明,包含核算量、内存需求等:

  1. 导语 (Introduction):文章的编写初衷是让 Transformer 言语模型中的一些根底数学公式更广为人知

  2. 核算需求 (Compute Requirements):推导核算 Transformer 模型操练需求核算量的基本公式C≈T=6PD,并具体解说了每个变量的意义

  3. 参数与数据集权衡 (Parameter vs Dataset Tradeoffs):评论在操练过程中参数量和数据集量的权衡取舍,提出了「chinchilla scaling」的概念;主张确认可接受的推理本钱,然后在此根底上操练尽可能大的模型和尽可能多的文本数据

  4. 核算本钱的有用经历总结 (Engineering Takeaways for Compute Costs):总结Transformer核算本钱的一些有用经历,如常见的GPU核算能力数据,进步数据并行度时的吞吐量扩展状况等,这些经历对核算资源的合理配置十分有协助

  5. 内存需求 (Memory Requirements):推导Transformer在操练和推理两个阶段的各组成部分所需内存的核算公式,包含模型参数、优化器状态、激活值、梯度等;还评论了减小内存开支的各种办法,如混合精度操练、激活值重核算等

  6. 分布式操练 (Distributed Training):评论了降低单个GPU内存压力,扩展能够操练的模型规模的分布式操练办法;要点讲解了分片优化器和三维并行化技能,前者能够削减优化器的内存开支,后者经过在数据、张量和流水线三个维度上进行并行来降低内存需求

  7. 结论 (Conclusion):总结表达了共享这些经历的意图,希望能对读者有所协助,欢迎反馈定见 ⋙ Transformer Math 101

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

上述文章的作者之一 @Quentin Anthony 受邀参与了一期播客对谈,共享大模型操练中的要害数学知识,内容十分专业且可贵。

需求留意的是,一般这种经历性知识只能在 Google、Meta等大公司中获得。以下是播客时刻轴,感兴趣能够前往收听 (或阅览文字版):

  • 00:00 Quentin在Eleuther.ai的背景和作业

  • 03:14 编写Transformers Math 101文章的动机

  • 05:58 核算核算需求的要害方程(tau x T = 6 x P x D)

  • 10:00 理论吞吐量和实践吞吐量的差异

  • 12:42 运用方程估量GPT-3操练的核算需求

  • 14:08 希望每个A100 GPU达到115+teraFLOPS作为基准

  • 15:10 Nvidia和AMD GPU在操练方面的折衷

  • 18:50 模型精度(FP32、FP16、BF16等)对内存的影响

  • 22:00 即使内存无限,模型量化的好处

  • 23:44 推理期间的KV缓存内存开支

  • 26:08怎么核算优化器内存运用量

  • 32:03 操练总内存的组成部分(模型、优化器、梯度、激活函数)

  • 33:47 激活值重核算以削减内存开支

  • 38:25 如ZeRO等分片优化器在GPU之间分配

  • 40:23 ZeRO中的涣散集合等通讯操作

  • 41:33 先进的3D并行技能(数据、张量、流水线)

  • 43:55 组合3D并行和分片优化器

  • 45:43 异构集群分发时的挑战

  • 47:58 闪电轮 ⋙ 播客&文字

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

斯坦福 CS224n | 自然言语处理与深度学习课程

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

web.stanford.edu/class/cs224…

斯坦福大学「CS224n: Natural Language Processing with Deep Learning」课程,聚焦自然言语处理与深度学习,首要介绍运用深度学习进行自然言语处理的前沿研讨。经过课程的学习,学生能够体系地学习规划、实现和了解根据神经网络的自然言语处理模型。

  • 词向量

  • 词向量,词窗口分类,言语模型

  • 反向传达与神经网络

  • 依存关系解析

  • 循环神经网络与言语模型

  • seq2seq,机器翻译,子词模型

  • 自留意力机制与Transformers

  • 预操练

  • 自然言语生成

  • Hugging Face Transformers教程课

  • 提示,来自人类反馈的强化学习

  • 问题回答

  • 卷积网络,树递归神经网络与成分解析

  • NLP 与言语学间的洞悉

  • 代码生成

  • 操练大言语模型

  • 多模态深度学习

  • 共指消解

  • 剖析和解说性根底

  • Latex 教程

  • 模型解说性和修改

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

中英字幕视频:www.bilibili.com/video/BV1Yo…

完好学习笔记:www.showmeai.tech/tutorials/3…

课程现在进行到了 Winter 2023 期次,课程页面更新了最新版的 Slides 和 Notes,不过并没有释放出新版课程视频。

ShowMeAI 对课程前史版别的视频进行了搬运和翻译,详见上方B站链接。本大众号回复课程代码「CS224n」能够获取 ShowMeAI 整理好的完好课程材料 (当然也是前史版别)。假如对课程感兴趣,强烈推荐上面这份 ShowMeAI 的学习笔记,中文版带你丝滑学完全程~

斯坦福 CS224U | 自然言语了解课程

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

web.stanford.edu/class/cs224…

斯坦福大学「CS224U: Natural Language Understanding」是一门NLP相关的课程,以了解文本的意义为中心,对自然言语处理和深度学习进行了介绍。

课程将包括言语模型、文本分类、情感剖析、命名实体识别、问答等主题,协助把握怎么表明和剖析言语结构,怎么操练模型进行NLP使命,以及怎么评价性能。

课程最新版别是 Spring 2023, 而且公开了课件、Notesbook和相关拓宽材料,感兴趣能够前往主页获取:

  1. Contextual representations

  2. Multi-domain sentiment analysis

  3. Retrieval-augmented in-context learning

  4. Compositional generalization

  5. Benchmarking and adversarial training and testing

  6. Model introspection

  7. Methods and metrics

感谢奉献一手资讯、材料与运用体会的 ShowMeAI 社区同学们!

阿里云X森马 AIGC T恤设计大赛;SD新手入门完全指南;揭秘LLM训练中的数学;LLM高质量阅读清单 | ShowMeAI日报

◉ 点击 日报&周刊合集,订阅论题 #ShowMeAI日报,一览AI领域发展前沿,捉住最新发展机会!

◉ 点击 生产力东西与职业运用大全,一起在信息浪潮里扑腾起来吧!