就在上星期,微软继推出 new bing 之后,在 AIGC 领域再爆重磅炸弹:推出比 ChatGPT 愈加万能的 AI —— AI–Kosmos-1
Kosmos,该词源于希腊语 kosmos,意思是:宇宙、调和、表明一个有序且调和的体系,与别的一个单词 chaos (混乱)相对。
怎么读?
本瓜:科哦日摸斯~~
ChatGPT 只能是纯文本对话,而这个 Kosmos-1 可以处理文本、音频、图画和视频等内容!!
ChatGPT 是【大型言语模型】(LLM) ,Kosmos-1 是【多形式大型言语模型】(MLLM)
来看看它的表现,一图胜千言:
CRAZY,在原先文本对话的基础上,再加图片的了解、音频的了解等,确实更进一步。
它原理怎么?
咱们用魔法打败魔法,让兄弟产品 new bing 来作解说:
原理还是有点复杂,首要的观点:
KOSMOS-1 骨干根据 Transformer 的因果言语模型,整合了言语、视觉、言语等模态的输入,关于连续信号模态(例如图画和音频),将输入表明为离散编码。
KOSMOS-1 借助了 PyTorch 结构,这个结构是一个深度学习的优化张量库,可使用 GPU 和 CPU 进行核算。
PyTorch 供给了灵敏的动态核算图、自动求导功用、分布式练习和部署等特性,咱们可以用它来构建各种神经网络模型,如卷积神经网络、循环神经网络、变分自编码器等。。。
Kosmos-1 在哪体验?
现在它还只是一个研究项目,未商用。最新进展在:
-
Microsoft Introduces Kosmos-1: A Multimodal Large Language Model That Can Perceive General Modalities, Follow Instructions, And Perform In-Context Learning – MarkTechPost
-
Microsoft Introduces Kosmos-1: A Multimodal Large Language Model That Can Perceive General Modalities, Follow Instructions, And Perform In-Context Learning – MarkTechPost
别的不说,微软这波确实走在了前头,首先它们以最快的速度引进 GPT 3.5 到自家 Edge 浏览器中,推出 new bing ,狂拉一波浏览器的使用率,之前这个基本被 Google 吞占了。
然后,又推出 Kosmos-1,将 AI 与图片剖析、音频剖析结合,可看出其野心。
前两天在 YOUTUBE 上看到一个博主说:微软正准备将 GPT 整合到自己的各类工具中,比如文档写作 office、onenote 等等,这必将带来又一波波爆炸式的产品增加。
凭借 AIGC,微软这波或能弯道超车,在 AI 应用上,超越谷歌、甲骨文等公司。
微软这波又赢了~~
OK,以上便是本篇共享,希望各位工友喜欢~ 欢迎点赞、保藏、评论
我是安东尼 100 万人气前端技能博主 INFP 写作品格坚持 1000 日更文 ✍ 重视我,安东尼陪你一起度过漫长编程年月
加我微信 ATAR53,拉你入群,定时抽奖、粉丝福利多多。只学习结交、不推文卖课~
本文正在参加「金石计划」