日报&周刊合集 | 生产力东西与职业运用大全 | 点赞重视评论拜托啦!
一则AI工程师招募信息:新范畴需求新技能
Vision Flow (意图出现) 是一家依据 AGI 原生技能的创业公司,是全球探究AGI原生运用的第一波船队。创建初期获得李想、曾鸣、Yeahmobi等闻名安排投资。最近,其创始人 @刘夜 在交际媒体中发布了一则招聘信息,不管是否应聘都能够看一下JD,了解新岗位的技能需求。
岗位:算法工程师、高档后端开发工程师
工作地址:北京朝阳区望京
薪资:面谈
发送简历至:zhaopin@visionflow.ai
邮件主题格式为:立刻+应聘岗位+姓名 ⋙ 立刻@刘夜 | Vision Flow 官网
雷军:小米大模型技能主力打破方向是「轻量化,本地布置」
8月14日晚,小米创始人、董事长雷军的第四次年度讲演「> 成长> 」在国家会议中心举办。在3小时的讲演和年度新品发布中,雷军同享了曩昔30多年经历的几回关键成长和感悟,并宣布小米科技战略晋级:深耕底层技能、长期持续投入,软硬深度交融,AI全面赋能。
同时,小米活跃布局人工智能,全面推进大模型研发和落地,挑选「轻量化,本地布置」作为小米大模型技能主力打破方向,并在现场正式宣布手机端侧大模型开始跑通,部分场景效果比美云端。此外,小爱同学也晋级AI大模型,并开启邀请测验 ⋙ 阅览全文
科大讯飞发布「讯飞星火认知大模型V2.0」
xinghuo.xfyun.cn/
8月15日,科大讯飞举办了主题为「解放生产力,开释想象力」的发布会,宣布星火认知大模型晋级为 V2.0 版本,重磅发布了代码才能、多模态才能,同享了其在教育、办公等范畴商业落地进展,并将同步发布星火语伴2.0、星火教师帮手、AI学习机的「AI创意画板」/「AI编程」等新功用。
依据发布会的介绍和实时演示,讯飞星火V2.0已具备代码生成、代码补齐、代码纠错、代码解说、单元测验生成等才能,多模态才能已完结图画描绘、图画了解、图画推理、识图创造、文图生成、虚拟人组成等功用,并在生态内聚集4109支开发者团队,创建了7862款星火帮手 ⋙ 了解概况
首个生成式AI监管文件,今日(8月15日)起实施
8月15日起,《生成式人工智能服务管理暂行办法》(以下称《办法》) 开始实施,这也是我国首个针对生成式人工智能工业的标准性方针。
《办法》界定了生成式人工智能技能的基本概念,规矩了生成式人工智能服务供给者的准则要求,为生成式人工智能的健康开展指明了方向:
坚持开展和安全偏重,对生成式人工智能服务实施包容审慎和分类分级监管
明确适用对象和范围:适用于向境内公众供给AIGC服务,对大量垂直范畴如科研、工业运用等场景扫除适用范围
以鼓励工业创新和开展为重,明确生成式人工智能技能开展途径和重点方向
搭建人工智能全生命周期监管体系,对数据、算法等事务适度“松绑” ⋙ 微信阅览全文 | 专家解读
一份AI开发者的东西清单,60+东西帮你效率UPUP!
最近逛 GitHub 发现了一份十分棒的东西清单,汇总了面向开发人员的 60+ AI东西。将东西的名称、链接和简介等信息分类如下,十分值得保藏~
集成开发环境 IDEs
Cursor(www.cursor.so/): 具有谈天、修改、生成和调试功用的IDE。从VSCodium分叉,因此界面类似于VS Code。运用OpenAI。
Mutable(mutable.ai/): 依据Web的IDE,与谈天机器人和GitHub集成。
帮手 Assistants
Replit Ghostwriter Chat(replit.com/site/ghostw…): 内置于 Replit 的帮手,具有谈天、主动调试和主动补全功用。运用 OpenAI 进行谈天,并运用 replit-code-v1-3b(OS)进行主动补全。
GitHub Copilot X(github.com/features/pr…): 带有谈天、拉取恳求文本生成和单元测验生成功用的 VS Code 扩展。
Refact AI(refact.ai/): 开源帮手,具有谈天、补全、重构和针对代码库的细调功用。适用于 VS Code 和 JetBrains 的扩展。
Codeium(codeium.com/): 带有主动补全、自然言语查找和谈天功用的帮手。适用于包含 VS Code、JetBrains、Neovim、Vim、Emacs、Eclipse、PyCharm 和 Xcode 在内的 21 个修改器。企业版包含针对代码库的细调功用。
Continue(continue.dev/): 带有谈天、重构和代码生成功用的 VS Code 扩展。可修改多个文件并代表您运行指令。
Blackbox(www.useblackbox.io/): 带有主动补全和谈天功用的 VS Code 扩展,包含指向在线编码参考的链接。
Source Graph Cody(about.sourcegraph.com/cody): 带有谈天、重构和单元测验生成功用的帮手。适用于 VS Code 和 IntelliJ 的扩展。
Quack AI(www.quack-ai.com/): 用于遵从项目编码标准的 VS Code 扩展。等候列表。
talk-codebase(github.com/rsaryev/tal…): 具有库房上下文的指令行谈天机器人。支持 OpenAI,以及经过 GPT4All 本地运行的LLM。
Magnet(www.magnet.run/): 依据 Web 的谈天机器人,以库房和问题为上下文。
Adrenaline(useadrenaline.com/): 运用人工智能和 AST 来答复关于代码库的问题的依据 Web 的谈天机器人。
Tabby(tabbyml.github.io/tabby/): 开源的、自保管的代码补全帮手。适用于 VS Code 和 Vim 的扩展。
Tabnine(www.tabnine.com/): 开源的、自保管的代码补全帮手。适用于包含 VS Code、IntelliJ、Neovim、Eclipse 和 PyCharm 在内的 15 个修改器。
CodeSquire(codesquire.ai/): 为 Google Colab、BigQuery 和 JupyterLab 添加主动补全功用的 Chrome 扩展。
CodeMate(www.codemate.ai/): 用于调试和优化代码的 VS Code 扩展。
Shell帮手 Shell assistants
AskCommand(www.askcommand.cppexpert.online/): 运用人工智能主动从文本生成 Unix 指令的依据 Web 的东西。
Butterfish(butterfi.sh/): 在您的 shell 中嵌入 ChatGPT 以供给方便访问的指令行东西。包含简略的自主才能。
智能体 Agents
Smol Developer(github.com/smol-ai/dev…): 经过CLI署理依据提示生成存储库。运用OpenAI和Anthropic。
Aider(github.com/paul-gauthi…): 经过CLI帮手和署理生成更改和提交到存储库。运用OpenAI。
Mentat(www.mentat.codes/): 经过CLI帮手和署理对存储库进行更改。
GPT Engineer(github.com/AntonOsika/…): 经过CLI署理依据提示生成存储库,并发问澄清问题。
GPT Migrate(github.com/0xpayne/gpt…): 经过CLI署理将全栈运用程序从一种言语或框架转换为另一种。运用GPT-4 32k上下文。
GitWit(gitwit.dev/): 用于向Git存储库的全栈运用程序添加功用的依据Web的署理。
DemoGPT(github.com/melih-unsal…): 具有Llama 2的强壮力气的主动生成AI运用程序生成器
DevOpsGPT(github.com/kuafuai/Dev…): DevOpsGPT依据AI的软件开发主动化处理方案
Second.dev(www.second.dev/): 用于向全栈运用程序添加功用的途径。
Factory(www.factory.ai/): 用于代码生成的署理。等待中。
运用生成器 App generators
Pico(picoapps.xyz/): 具有即时布置的端到端微运用生成器
Literally anything(literallyanything.io/ ) : HTML和JavaScript Web运用生成器。
代码片段生成器 Snippet generators
CodePal(codepal.ai/ ) : 一个用于快速生成或重构代码的Web东西。
AI Code Convert(aicodeconvert.com/ ) : 一个用于在编程言语之间转换代码的Web东西。
AI Code Playground(aicodeplayground.com/ ) : 用于重构和改善代码的Web东西。
文档 Documentation
Trelent(trelent.net/): 一个用于生成文档字符串的VS Code扩展。运用专有模型。
Docify(docify.ai4code.io/): 一个用于生成文档字符串的VS Code扩展。
Mintlify Writer(writer.mintlify.com/): 一个用于生成文档字符串的VS Code扩展。
持续集成机器人 Continuous integration bots
BitBuilder(www.bitbuilder.ai/): 一个用于从问题生成拉取恳求的GitHub集成。
Sweep(sweep.dev/): 另一个用于从问题生成拉取恳求的GitHub集成。
Code Review GPT(github.com/mattzcarey/…): 用于审查PR的开源东西。能够作为GitHub动作、Gitlab CLI或本地东西运用。
Nova(www.trynova.ai/): 一个用于为新的PR添加摘要和测验等操作的CI机器人。
CodeRabbit(coderabbit.ai/): 可定制的CI东西,用于为PR添加摘要和代码建议。
Code generation: 代码生成
- Magic(magic.dev/): 该公司许诺推出两款产品,一个帮手和一个依据代码练习的底层根底模型LTM-1。等候名单。
智能体途径 Agent platforms
E2B(www.e2b.dev/): 用于保管依据LLM的署理的开源云途径。支持Smol Developer。
Morph Rift(github.com/morph-labs/…): 开源的VS Code扩展,答应合并代码生成署理的输出。
SuperAGI(superagi.com/): 用于保管依据LLM的署理的开源途径,包含SuperCoder。
OpenAI插件 OpenAI plugins
ChatWithGit(gitsearch.sdan.io/): 答应ChatGPT查找GitHub并回来相关存储库的链接。
Code ChatGPT Plugin(github.com/kesor/chatg…): ChatGPT插件的开源示例,从文件目录中提取上下文。
查找 Search
Bloop(bloop.ai/): 用于存储库的自然言语查找。
Buildt(www.buildt.ai/): 用于存储库的自然言语查找。
测验 Testing
OctoMind(octomind.dev/): 主动维护和生成的依据浏览器的端到端测验,集成到Github Actions,Azure DevOps等。
Traceloop(traceloop.com/): 利用开放遥测跟踪数据和生成的人工智能来进步体系可靠性。
Carbonate(carbonate.dev/): 运用自然言语进行端到端测验。与现有的测验套件集成(目前支持Jest,PHPUnit和Python的unittest)。
Meticulous.ai(www.meticulous.ai/): 主动生成、主动维护的端到端测验: 跟着运用程序的开展,测验套件也随之演化。
DiffBlue(www.diffblue.com/): 为Java主动生成单元测验 ⋙ GitHub
运用AI东西「bloop」读懂「Webpilot」插件源码,再高效教会我
Webpilot 是一个浏览器插件,答应用户对网页内容进行自然言语发问,并主动生成答复。
bloop是一个面向软件开发者的AIGC东西,能够答复关于代码库的问题,中心技能是 embeddings——将代码块映射为向量,然后检索向量之间关联度最强的内容来答复问题。可是 bloop 不了解代码之间的依靠关系,在发问时需求供给满意上下文,才能得到精确答复。
作者在这篇文章中展示了怎么运用 bloop 东西来剖析 Webpilot 的源码:经过逐渐深化的技能思路,先用 bloop 对项目做全体的概述,然后再针对关键功用细节持续发问,逐渐让 bloop 解说代码的详细逻辑。中心流程如下:
首要需求在 bloop 中绑定 Webpilot 的代码库房,让 bloop 对代码进行向量化表明
然后能够就项目全体提出一个概述性问题,如”简略介绍下这个项目”;这能够让 bloop 对项目有一个大致的了解
在得到项目简介后,能够问询一些关键功用的完结,如”与网页进行自由方式对话”是怎么完结的;bloop会指出相关的代码方位
依据 bloop 供给的代码方位,能够持续问询该代码的详细作用和逻辑;bloop 会测验解说代码意义
有了解了一个功用点后,能够持续问其他功用的完结代码在哪,偏重复上述进程逐渐深化
当对全部关键逻辑都进行了解析后,就能够比较体系地了解该项意图代码完结了
在发问时,需求供给满意详细的上下文信息,而不要只问一些过于归纳的问题
假如bloop的答复不对或不全,需求批改发问方式供给更多上下文线索 ⋙ 思否@卡颂
为什么开发者应该多重视海外市场?
最近AI社区里「独立开发者」「大模型开发者」论题的重视度很高,也频频提到「出海」这个论题。这篇文章能够算是「开发者出海」相关内容的科普文,读完就大概能了解为什么我们都在重视这个方向。
不存在满意的空间给个人/小团队做独立产品存活。剖析了Slack在美国成功上市,但在国内却难以存活。原因是BAT等巨头互相竞赛,都想占领流量入口,不愿意有其它独立产品出现。国内生态封闭制约,不利于小团队参加竞赛。
需求验证或许叫「试错」本钱高。剖析了国内要上线产品需求经过繁琐的审批、存案等程序,验证需求的门槛很高。而海外上线产品门槛低,能够快速试错验证需求。国内完结公司注册等流程也耗费大量精力和时间。
推行途径少 && 门槛高。剖析了国外有更多免费推行途径如 ProductHunt 等,用户反应真挚;国内推行途径少,用户不友好。付费推行国内门槛高,但海外能够低本钱推行。
商业化挑选少。剖析了国内用户习气免费产品,不愿付费,盈利难。海外用户付费志愿强,小产品处理痛点也能获付出。付费用户更看重产品,免费用户难以满意 ⋙ @强生
斯坦福CS324「大言语模型 (LLM)」,好品质专题好课
言语模型的规划在快速增长,这不仅带来了全新的模型才能,对社会开展也发生了重大影响,并且也带来了可靠性不高、社会成见、发生语气攻击、生成虚假信息等许多风险。
CS324 – Large Language Models 是斯坦福 Winter 2022 的新课程,体系讲解了大言语模型的原理和开发,并深化探讨了上方的论题。经过这门课程的学习,学生能够对大型言语模型有全面的了解,掌握技能细节,并能对言语模型进行批判性考虑。
Introduction
AI界说:让机器具有与人类相似的智能功用
言语具有创造力、组合性和沟通性等特点
NLP开展历程:规矩办法、统计办法、神经办法
神经网络兴起:核算才能提高,大规划标注数据
词向量捕获语义信息,seq2seq模型完结端到端学习
根底模型:可微、可优化的大规划预练习模型,适用于下流使命
GPT-3示范根底模型的潜力:经过提示完结各种下流使命
Capabilities
言语模型使命:猜测文本的联合概率或下一个词
GPT-3在Penn Treebank言语建模使命上优于SOTA
GPT-3在LAMBADA长距离依靠言语建模使命上也优于SOTA
GPT-3在HellaSwag常识推理使命上接近SOTA
在问答使命上,GPT-3零样本表现欠安,少样本效果更好
GPT-3零样本机器翻译质量不高,少样本可到达SOTA
GPT-3可用于简略算术问题,但不“了解”数学
GPT-3可生成几乎无法区分的新闻文章
GPT-3可习惯新词运用和纠正语法错误等新使命
Harms I
界说AI:智能因子、署理的集合
AI安全关键问题:价值观对齐、 interruptibility、透明度
价值观对齐:使AI行为符合人类价值观
可中断性:人类可随时中止/修改AI体系
透明度:人类可了解AI决策进程
狭义AI:专心特定使命,更易操控
强AI方针:具有人类水平跨范畴智能
详细做法:强化学习、标准、监督
Harms II
功能差异:不同人群的精确率存在差异
社会成见:生成文本带有刻板成见
引起伤害:生成攻击性内容
造假信息:生成误导性内容
内容审核:平衡言论自由和安全
缓解危害:数据处理、模型规划、布置监管
Data
数据获取:Common Crawl、交际媒体
数据处理:去重、分词、清洗
数据标注:Mechanical Turk、竞赛
弱监督:无标注数据的监督信号
自监督:从数据中主动构建监督信号
数据质量:掩盖范围、样本巨细、注释质量
数据误差:历史数据中的社会成见
隐私:个人灵敏信息走漏
版权:未经授权运用受版权保护数据
Security
模型逆向:从模型输出推断练习数据
成员推断:判别样本是否在练习数据中
数据提取:从模型内提取练习数据
毒化攻击:注入对模型发生不利影响的数据
诈骗攻击:对测验样本做细小变化来诈骗模型
后门攻击:使模型对特定触发输入发生错误输出
对抗防御:鲁棒性练习、差分隐私等办法
Legality
版权法:规矩数据运用权利义务
合理运用:答应未经授权有限运用版权作品
隐私法:规矩个人信息运用权利义务
其他法律:标准AI体系运用和布置
道德标准:职业和安排自律守则
Modeling
分词:将文本切分为词单元
编码器:生成文本表明,适用于分类
解码器:次序生成文本,适用于生成
编解码器:编码输入并解码输出
注意力:软查询表,完结大局依靠
Transformer:编码器解码器统一架构
方位编码:表明词在序列中的方位
Training
言语模型丢失:最大化联合概率或穿插熵
预练习方针:遮蔽言语模型、下一句猜测等
优化算法:SGD、Adam、mixed precision
学习率:warmup和降低学习率
正则化:dropout、weight decay
初始化:操控参数标准,添加模型可练习性
Parallelism
数据并行:数据划分到不同核算节点
模型并行:模型划分到不同核算节点
流水线并行:不同模块串行核算
参数服务器:跨节点同享参数
分布式练习:协同高效地完结预练习
Scaling laws
模型规划:跟着参数量添加,功能提高
数据规划:跟着练习数据增多,功能提高
核算规划:跟着FLOPs添加,功能提高
递减收益:扩展规划带来的收益递减
外推猜测:预估未来功能提高趋势
建模规划法则:数学公式描绘规划与功能关系
Selective architectures
混合专家:依据输入激活部分专家
稀少混合专家:每个样本只运用少数专家
Switch Transformer:每个样本只运用一个专家 ⋙ 学习课程
感谢奉献一手资讯、资料与运用体会的 ShowMeAI 社区同学们!
◉ 点击 日报&周刊合集,订阅论题 #ShowMeAI日报,一览AI范畴开展前沿,抓住最新开展机会!
◉ 点击 生产力东西与职业运用大全,一同在信息浪潮里扑腾起来吧!