日报&周刊合集 | 生产力东西与职业运用大全 | 点赞重视评论托付啦!
阿里云X森马 | AIGC T 恤规划大赛,函数核算玩转 Stable Diffusion
竞赛官网:developer.aliyun.com/adc/series/…
阿里云携手服装品牌森马,推出了本次 AIGC T 恤规划大赛。开发者、规划师、AI绘画爱好者,都能够运用阿里云函数核算快速布置 Stable Diffusion,以「宇宙周游」为主题,进行AI创造并投递著作。
参与即有机会获得 Airpods、阿里云X森马联名T恤、森马定制旅行箱、森马无门槛代金券等丰盛奖励,一切著作均有机会被森马选中并购买版权成为下一季服装图画主题。
需求留意的是,大赛自8月21日开启著作搜集,到9月21日截止上传,并在9月28日发布获奖信息。留意时刻哦~
Meta推出开源模型「SeamlessM4T」,能翻译和转录近百种言语
8月22日,Meta 宣告推出人工智能多模态模型「SeamlessM4T」,能够直接翻译35种言语的语音和100种言语的文本。SeamlessM4T 的翻译功能很强壮,能够完结语音到文本、语音到语音、文本到语音、文本到文本的翻译,并能够自动识别语音,是 Meta 推出通用翻译器的重要一步。
SeamlessM4T 在翻译基准上的表现要优于 OpenAI 的 Whisper,尽管二者的翻译质量现在都逊色于人类,但距离正在随着模型的优化而不断缩小。
Demo:seamless.metademolab.com/demo
秉持其一贯的开源战略,Meta 在开源协议CC BY-NC 4.0下公开发布了 SeamlessM4T,开发人员能够在这个模型的根底上进行开发。同时,Meta 还发布了 SeamlessAlign 的数据集,其博客说到这也是迄今为止最大的开放多模态翻译数据集,覆盖发掘的语音和文本对齐总计达 270,000 小时 ⋙ Meta Blog | GitHub 模型代码下载
巨量引擎推出AI智能成片东西,商家5分钟生成十余条带货短视频
上星期,巨量引擎宣告推出AI混剪东西「智能成片」,免费开放给抖音商家运用,能够协助商家轻松制造跑量的带货短视频。
不用写脚本、找素材、找伴奏,只需有产品空镜视频 (至少3条),就能制造爆款带货短视频啦!5分钟即可快速成片,供给10+条跑量效果好的短视频,而且商家0本钱运用、批量成片,大幅节省开支~
以下两个路径均可运用「智能成片」东西:巨量千川PC首页 → 东西 → 三方东西 → 智能成片、星图即合 → 智能成片 ⋙ 巨量千川 | 星图即合
一份高质量的 LLM 深度阅览清单,十分有用的资源攻略
这篇文章汇集了关于大言语模型 (LLM) 的高质量、有用性强的学习资源合集,内容触及LLM的方方面面,包含理论根底、要害论文、模型操练、实践运用、性能评价等。
这份资源注重有用性和长时间参考价值,防止夸大的营销噱头,旨在真正协助读者把握LLM中心知识和技能,是一篇高质量的LLM学习资源攻略。
以下是清单中各项内容的标题 (已翻译),感兴趣的能够阅览原文:
背景
大型言语模型综述
自留意力和转换器网络
什么是嵌入?
简述词嵌入在机器学习中的运用 (YouTube视频)
了解大型言语模型的奇思妙想
根底论文
Attention is all you Need
神经言语模型的扩展规律
BERT
言语模型是无监督的多使命学习者
操练言语模型遵循指示
言语模型是少样本学习者
操练自己的模型
为什么要保管自己的言语模型?
怎么操练自己的言语模型
操练核算优化的大型言语模型
Opt-175B日志
算法
GZIP 分类器的长处
Meta 推荐体系:运用和扩展 Word2Vec
GPT 现状 (YouTube视频)
ChatGPT在做什么以及为什么有效
LlamaCPP怎么可能?
关于 prompt engineering
从零开始构建 Transformer
布置
构建面向生产环境的言语模型运用
大型言语模型的挑战和运用
运用言语模型构建产品时无人谈及的一切困难
扩展Kubernetes以运转ChatGPT
每个言语模型开发者都应知道的数字
评价
可解说的机器学习
评价ChatGPT
ChatGPT:万能但不通晓
用户体会
除聊天外的生成式界面 (YouTube视频)
为什么聊天机器人不是未来 ⋙ 阅览原文
面向新手的 Stable Diffusion 入门攻略,八面玲珑的快速上手宝典
这是一个面向 Stable Diffusion 新手的入门攻略系列,一共包含4篇文章,意图是让没有任何经历的读者快速上手这项强壮的AI创造东西。
榜首篇文章环绕 Stable Diffusion 根底知识打开,介绍了其运用办法与各种用法,以及关于提示词、参数和图画修正的内容。以下是文章大纲,感兴趣能够阅览原文:
什么是Stable Diffusion?
怎么运用Stable Diffusion AI?
Stable Diffusion的优势是什么?
Stable Diffusion AI是免费的吗?
试用Stable Diffusion在线演示
Stable Diffusion能做什么?
从文本生成图画
从其他图画生成图画
照片修改
制造视频
怎么运用Stable Diffusion AI?
在线生成器
高档GUI
怎么构建一个好的提示?
构建良好提示的规矩
具体和具体
运用强壮的要害词
那些参数是什么,我应该改变它们吗?
我应该生成多少张图片?
常见的修正图画缺点办法
人脸修正
用修正修正小瑕疵
什么是自定义模型?
我应该运用哪个模型?
怎么操练一个新的模型? ⋙ 榜首篇
第二篇文章供给了构建高质量 Stable Diffusion 提示的有用技巧,对新手学习提示词汇和操练构建提示十分有协助。此外,作者主张读者能够经过学习优异的现成提示来快速上手,并在实践中逐步把握提示构建技巧。
入门资源
一个好提示的结构
主题
前言
增加其他要素
构建优质提示的技巧
一些有用的要害词
前言
风格
艺术家
网站
分辨率
光照
附加细节
色彩
总结 ⋙ 第二篇
第三篇文章针对 Stable Diffusion 的图画修正功能inpainting 打开,经过具体的分步示例向初学者展现怎么运用inpainting修正图画缺点,并给出了一些有用的inpainting技巧。读完这篇攻略对inpainting的原理和用法会有较为体系的了解。
图画模型和图形用户界面
基本填充设置
运用填充模型(可选)
创建填充遮罩
填充设置:提示词、图画大小、人脸康复、遮罩内容、降噪强度、批量大小
填充成果
再进行一次填充
增加新对象
填充参数解说
降噪强度
CFG 份额
遮罩内容
填充技巧 ⋙ 第三篇
第四篇包括了 Stable Diffusion 模型方方面面的信息,例如原始模型和微调模型的差异、几种常用的模型微调办法、通用模型、针对特定风格进行微调的模型、模型融合的办法等等。
微调模型
什么是微调?
为什么要制造微调模型?
怎么制造微调模型?
模型
Stable Diffusion v1.4
Stable Diffusion v1.5
F222
Anything V3
Open Journey
模型比较
最佳模型:DreamShaper、Deliberate v2、Realistic Vision v2、ChilloutMix、Protogen v2.2 (Anime)、GhostMix、Waifu-diffusion、Inkpunk Diffusion
寻觅更多模型
v2模型
SDXL模型
怎么安装和运用模型
兼并两个模型
- 兼并模型实例
模型变体
Pruned, Full, EMA-only模型
fp16/fp32模型
Safetensor模型
其他类型模型
总结 ⋙ 第四篇
与 Eleuther.ai 工程师对谈,揭秘 LLM 操练中的数学奥妙
EleutherAI是一家非营利的人工智能研讨组织,致力于开源大规模言语模型的操练和布置。
4月的时候,EleutherAI 发布了一篇名为「Transformer Math 101」的专业文章,总结了工程师们在大言语模型操练中的实践经历,这也应该是领域内适当稀缺且高档的经历总结,对从事相关研讨和工程实践的人具有重要的参考价值。
全体上说,文章总结出了一系列核算 Transformer 模型操练需求的要害公式,并进行了具体的数学推导和阐明,包含核算量、内存需求等:
导语 (Introduction):文章的编写初衷是让 Transformer 言语模型中的一些根底数学公式更广为人知
核算需求 (Compute Requirements):推导核算 Transformer 模型操练需求核算量的基本公式C≈T=6PD,并具体解说了每个变量的意义
参数与数据集权衡 (Parameter vs Dataset Tradeoffs):评论在操练过程中参数量和数据集量的权衡取舍,提出了「chinchilla scaling」的概念;主张确认可接受的推理本钱,然后在此根底上操练尽可能大的模型和尽可能多的文本数据
核算本钱的有用经历总结 (Engineering Takeaways for Compute Costs):总结Transformer核算本钱的一些有用经历,如常见的GPU核算能力数据,进步数据并行度时的吞吐量扩展状况等,这些经历对核算资源的合理配置十分有协助
内存需求 (Memory Requirements):推导Transformer在操练和推理两个阶段的各组成部分所需内存的核算公式,包含模型参数、优化器状态、激活值、梯度等;还评论了减小内存开支的各种办法,如混合精度操练、激活值重核算等
分布式操练 (Distributed Training):评论了降低单个GPU内存压力,扩展能够操练的模型规模的分布式操练办法;要点讲解了分片优化器和三维并行化技能,前者能够削减优化器的内存开支,后者经过在数据、张量和流水线三个维度上进行并行来降低内存需求
结论 (Conclusion):总结表达了共享这些经历的意图,希望能对读者有所协助,欢迎反馈定见 ⋙ Transformer Math 101
上述文章的作者之一 @Quentin Anthony 受邀参与了一期播客对谈,共享大模型操练中的要害数学知识,内容十分专业且可贵。
需求留意的是,一般这种经历性知识只能在 Google、Meta等大公司中获得。以下是播客时刻轴,感兴趣能够前往收听 (或阅览文字版):
00:00 Quentin在Eleuther.ai的背景和作业
03:14 编写Transformers Math 101文章的动机
05:58 核算核算需求的要害方程(tau x T = 6 x P x D)
10:00 理论吞吐量和实践吞吐量的差异
12:42 运用方程估量GPT-3操练的核算需求
14:08 希望每个A100 GPU达到115+teraFLOPS作为基准
15:10 Nvidia和AMD GPU在操练方面的折衷
18:50 模型精度(FP32、FP16、BF16等)对内存的影响
22:00 即使内存无限,模型量化的好处
23:44 推理期间的KV缓存内存开支
26:08怎么核算优化器内存运用量
32:03 操练总内存的组成部分(模型、优化器、梯度、激活函数)
33:47 激活值重核算以削减内存开支
38:25 如ZeRO等分片优化器在GPU之间分配
40:23 ZeRO中的涣散集合等通讯操作
41:33 先进的3D并行技能(数据、张量、流水线)
43:55 组合3D并行和分片优化器
45:43 异构集群分发时的挑战
47:58 闪电轮 ⋙ 播客&文字
斯坦福 CS224n | 自然言语处理与深度学习课程
web.stanford.edu/class/cs224…
斯坦福大学「CS224n: Natural Language Processing with Deep Learning」课程,聚焦自然言语处理与深度学习,首要介绍运用深度学习进行自然言语处理的前沿研讨。经过课程的学习,学生能够体系地学习规划、实现和了解根据神经网络的自然言语处理模型。
词向量
词向量,词窗口分类,言语模型
反向传达与神经网络
依存关系解析
循环神经网络与言语模型
seq2seq,机器翻译,子词模型
自留意力机制与Transformers
预操练
自然言语生成
Hugging Face Transformers教程课
提示,来自人类反馈的强化学习
问题回答
卷积网络,树递归神经网络与成分解析
NLP 与言语学间的洞悉
代码生成
操练大言语模型
多模态深度学习
共指消解
剖析和解说性根底
Latex 教程
模型解说性和修改
中英字幕视频:www.bilibili.com/video/BV1Yo…
完好学习笔记:www.showmeai.tech/tutorials/3…
课程现在进行到了 Winter 2023 期次,课程页面更新了最新版的 Slides 和 Notes,不过并没有释放出新版课程视频。
ShowMeAI 对课程前史版别的视频进行了搬运和翻译,详见上方B站链接。本大众号回复课程代码「CS224n」能够获取 ShowMeAI 整理好的完好课程材料 (当然也是前史版别)。假如对课程感兴趣,强烈推荐上面这份 ShowMeAI 的学习笔记,中文版带你丝滑学完全程~
斯坦福 CS224U | 自然言语了解课程
web.stanford.edu/class/cs224…
斯坦福大学「CS224U: Natural Language Understanding」是一门NLP相关的课程,以了解文本的意义为中心,对自然言语处理和深度学习进行了介绍。
课程将包括言语模型、文本分类、情感剖析、命名实体识别、问答等主题,协助把握怎么表明和剖析言语结构,怎么操练模型进行NLP使命,以及怎么评价性能。
课程最新版别是 Spring 2023, 而且公开了课件、Notesbook和相关拓宽材料,感兴趣能够前往主页获取:
Contextual representations
Multi-domain sentiment analysis
Retrieval-augmented in-context learning
Compositional generalization
Benchmarking and adversarial training and testing
Model introspection
Methods and metrics
感谢奉献一手资讯、材料与运用体会的 ShowMeAI 社区同学们!
◉ 点击 日报&周刊合集,订阅论题 #ShowMeAI日报,一览AI领域发展前沿,捉住最新发展机会!
◉ 点击 生产力东西与职业运用大全,一起在信息浪潮里扑腾起来吧!