新智元报导
修正:修正部
【新智元导读】官宣2个月后,李志飞带着大模型「序列山公」来了。不排队,直接用,超长测评报告出炉!(往后翻,「言之画」有个小彩蛋)
ChatGPT国内赛,又有一位玩家交卷了。
本年2月,国内赛正式宣战,各方实力轮流出场。当时,出门问问创始人、CEO李志飞便是高调入局的创业者之一。
才过了两个多月,就有成果了。
4月20日,出门问问的自研大模型「序列山公」正式上台。依据这个大模型,出门问问也推出了面向创造者的一站式CoPilot的AIGC产品矩阵。
具体包含以下四款产品:AI写作渠道「美妙文」、AI绘画渠道「言之画」、AI配音渠道「魔音工坊」、数字人视频与直播渠道「美妙元」。
划要点:四款产品敞开注册,悉数直接可用!
美妙文
据了解,出门问问的四支AIGC产品均于发布会当天即敞开体会,其间「魔音工坊」的声响克隆功用将于后天正式上线。
这还等什么,赶紧冲一波先。
体会地址:write.mobvoi.com
翻开主页,右上角就写着大大的:登录/注册。
咱们只需用手机号注册一个账号,就可以开端体会了,和其他需求约请才能进行内测的产品完全不同。
并且,局面送的这个额度,看起来还挺有诚心。
依据官方的介绍,AI写作助理「美妙文」覆盖了职场办公、商场营销、新媒体和构思写作四大内容创造场景。并且敞开了8大AI修正功用,分别为风格转化、要点提取、校正纠错、续写、改写、扩写、缩写、翻译。
趁便一提,咱们可以在「美妙文」中利用下面这个框,直接调用「序列山公」的言语、常识、逻辑、数学、推理以及解决问题的规划才能。轻松完成连续对话等功用,甚至还能让它给一段文字进行配图。
适当于,新媒体案牍这一块儿,写稿、视频、小红书、知乎「美妙文」全包了。
AI,帮我打个工
测试开端,先来让它给「新智元」账号写一个简介。
在提示框中输入账号称号,方针用户,具体描述特点,以及要害信息。
输出的第一段中规中矩,包含了提示的几个点。
让人意想不到的是,在接下来的内容生成中,不只点出咱们供给前沿科技资讯,还供给互动渠道。
嗯,你是懂「新智元」的。
再让「美妙文」给「SpaceX星舰首飞爆破」起个标题吧。
给出一段具体内容:
经历过推延风云后,埃隆马斯克旗下太空探究技能公司SpaceX的新一代运载火箭星舰总算焚烧发射,但在空中爆破,首次轨道级试飞以失败告终。马斯克随后发文回应,先是恭喜了SpaceX团队的尽力,并表明为几个月后再次发射学到了许多。
「美妙文」要言不烦,给出了标题「SpaceX星舰试飞失败,马斯克:学到了许多!」。
挑选风格转化中的「自由幽默」后,它开端将马斯克亲热地称为「马院士」。
并且,它还会从文中提取要点,挨个起标题。
生成配图,有那味了
最近走火的淄博烧烤,现已成为全民级网红打卡地。
淄博烧烤最招引人的,便是其独特的「吃法」小串+小饼+小葱,还诞生了小饼烤炉加蘸料,灵魂烧烤三件套。
不如用「美妙文」写一个小红书种草案牍。
不只用了各种表情包,并且短短几行字,剖析的八面玲珑,最后还附上了标签#,有那味儿了。
虽然三段式的写作方法多少有些出戏,但让AI依据这个内容生成的配图,仍是十分冷艳的。
不得不说,这冒着油的两串烤肉,还真有些让人垂涎欲滴。
而让「美妙文」生成一段自我介绍后,咱们也让它给自己配了一张相片。
可以可以,毫无违和感,十分技能男(狗头)。本来在这个模型心里,自己长这样。
开个脑洞:车展+冰淇淋
最近,「车展冰淇淋」这个话题,可是适当的火。
不如就让「美妙文」以「在车展上卖冰淇淋」为题,给咱们讲一段脱口秀吧。
你甭说,它还挺有构思。为了招引有钱人,它提议推出「法拉利红」「保时捷黄」「兰博基尼绿」口味的冰淇淋。
而为了招引车迷,它觉得可以在冰淇淋上放一些车轮、门把手。
嗯,它在做一种很新的冰淇淋。
别的,「美妙文」还能为咱们供给短视频灵感。
那就请它给咱们供给一下「龙傲天誓死守护刘波」这个短视频的构思吧。
没想到,「美妙文」走的是鸡汤风格,「真正的勇气不是不害怕,而是在害怕的时分,仍然能保护自己所爱的人。」
小编承认:可恶,被这个AI感动到了。
做数学、写代码,怎么样?
现在,但凡是个大言语模型的评测,咱们都会出道「鸡兔同笼」试上一试。而各路研制团队看到这个架势,估量也纷繁连夜给模型单独做了加强练习。
为了避免「鸡兔同笼」这四个字可能会触发的躲藏机制,咱们特别在测试中换成了「萝卜白菜」:
小明和妈妈去商场然后买菜,已知白菜5元1斤,萝卜8元1斤,一共买了10斤白菜和萝卜,花了62元,那么白菜和萝卜各买了多少斤?
不错,第一次就成功地解出了答案。
考虑到模型的随机性,咱们又进行了几次测试。
但成果却是,有时分能做对,有时分做不对,效果比较一般。
此外,「美妙文」其实是可以轻松拿捏一些简略代码的。但可能是文档设置的问题,将生成的代码增加进去之后,格式就没有了……
比如,让它写一段核算阶乘Python代码。很明显,这个缩进是不对的。
现在,咱们让「美妙文」修正一下。
很好,AI不只判断出了代码本身并没有问题,并且也成功地对缩进进行了修正。
但增加进文档之后,就一秒破功了……
主打的便是一个写作助理
不过,从官方的介绍来看,「美妙文」现在要点关注的仍是文字修正场景。
「美妙文」可以在用户撰写年终总结、客服话术、剧本、广告案牍等内容时,为其源源不断地供给灵感和构思方向。
在这一点上,依据刚刚的体会,通常在多尝试几次之后,根本都会有比较满意的成果。
至于数学、代码这类理工科的问题,模型现在还有所欠缺,但听说团队现已在改进了。
言之画
接下来是另一个现已敞开体会的项目——AI画画。
体会地址:paint.mobvoi.com
相同,注册即可取得5次体会机会。
为了凑够评测用的次数,修正部的小伙伴使出洪荒之力,拉着全公司的同事每人注册了一个。
生成一张图需求耗费10点
在使用时,「言之画」供给了8种图像的风格,但也可以不选。
不过,模型的类型是必选的,比如二次元、通用、相片等。
首先,来个简略的:一杯橙汁。
「言之画」生成的这张图可以打个及格分了,光与影的变幻,玻璃杯的影子,根本上不违和。
现在,换一个复杂的:「马斯克在苏联工厂狂热地作业,他的生活蒸蒸日上。」
相信许多人都发现了,在用AI作画工具的时分,自己忽然变成了「语死早」。而「言之画」的智能文本生成功用,便是来拯救咱们的。
只需微调一下「言之画」生成的内容,咱们就可以得到愈加完善的提示:
依据这个prompt,「言之画」生成了这张图。并且没想到的是,马院士的手部竟然被处理得适当不错。
人物写实模型
不过,这些粗糙的提示显然仍是不行冷艳,不如咱们求助一下别人的专业「咒语」吧:
female ornate princess, with white long flowing hair, bright beautiful eyes, trending on artstation, flowers of hope by Jean-Honor Fragonard, Peter mohrbacher, hyper detailed, insane details, stunning, intricate, elite, art nouveau, ornate, liquid wax, elegant, luxury, Greg Rutkowski, ink style, sticker, vector-art beautiful character design, double exposure shot, luminous design, award winning, masterpiece, amoled black background
首先用「通用模型」试一下。
优雅的公主披着白色的长发,大而明亮的眼睛注视着远方,可以说是适当富丽了。
再换「写实模型」看看,姿色天然,简直倾国倾城。
听说,现已有prompt高手用「言之画」生成下面这些神图了。(左右滑动检查悉数)
小程序上线啦!
除了传统的网页版文生图外,这两天「言之画」小程序版也来了!不只能定制各种风格的AI头像,还能一键生成动漫视频。
带着所剩无几的体会次数,小编决断地挑选了可以给相片换风格的「魔法神似」。
(看图就好,不必介意其间一个小编的真实性别
)
小编1号:
光影
风潮
小编2号:
仙风
小编3号:
光影
魔音工坊
除了「美妙文」、「言之画」,出门问问还有最老练的两个产品:一个是业界Top级的AI配音渠道,千万级粉丝大V们都在用的「魔音工坊」,另一个则是AI数字兼顾「美妙元」,可以做数字人视频和直播。
在「序列山公」大模型加持下,「魔音工坊」(海外版DupDub)是全球首款搭载了大模型AI写作功用的配音渠道,覆盖了AI写作、AI配音和剪辑等多个场景。
在这里,你可以挑选上千种AI音色,超2000种声响风格、40国言语和11种方言。轻松完成影视说明、有声书、在线教育、新闻播报等集案牍与配音于一体的内容创造。
体会地址:moyin.com
此外,「魔音工坊」支撑对选定声响进行包含安静、哀痛、开心在内的7种心情的调理,对包含女中年、男孩等在内的10种人物进行搬迁。
一起还敞开了韵律调理、部分变速、多人配音等AI声响个性化修正功用,让用户可以像用word修正文档相同修正声响。
除了挑选声响、修正声响,「魔音工坊」还将推出「捏声响」功用,这样你就可以自由挑选性别、年龄、言语、风格和心情等声响特征,从0到1创造自己喜爱的声响了。
美妙元
配音有了,给它一个完美的外表吧。AI数字形象创造及直播渠道「美妙元」恰恰可以做到这一点。
现在,「美妙元」现有超100款数字人、超1000款3D数字财物、超1000种声响。
体会地址:weta365.com
凭借多模态生成技能,「美妙元」现在共支撑图片建模(2D数字人)、视频建模(2.5D数字人)、3D建模 (3D数字人)三种不同方式的数字人生成。
其形象克隆功用,仅需一段5分钟的真人视频材料,就可以1:1复刻用户的形象神态,为用户打造声响一致、动作天然的数字人兼顾。
为啥叫序列山公?
比起GPT-3的1750亿参数,「序列山公」的参数量约为几百亿个,是一个多模态大言语模型。
之所以命名为「序列山公」,是因为它的灵感,来自于「无限山公」定理。
这是数学家埃米尔波雷尔在20国际初提出的著名思维试验。
依据该定理,假如一群山公随机地敲打一台打字机,终究必定会发生莎士比亚的全套作品。这个定理依据概率论和组合数学,阐释了概率的统一性。
而出门问问自研大模型的构建原理,就与「无限山公」类似。
海量文本序列经过自主算法的不断练习,经由大规模算力消化了解,便练成了「序列山公」。
现在,这个大模型现已具有了必定的天然言语了解、常识、逻辑以及推理等才能。
All In AGI:「出门问问」大模型之路
可以说,在「序列山公」大模型加持下,出门问问专为创造者打造的CoPilot才能确实让人眼前一亮。
那么,这家人工智能公司,凭什么可以在国内大模型创业赛道上抢跑?
依据揭露材料,出门问问的创始人李志飞,曾在美国约翰霍普金斯大学攻读博士学位,一向研讨天然言语处理和机器翻译。毕业后,入职谷歌,主导开发了谷歌手机版离线翻译等一系列产品。
2012年,前谷歌AI科学家李志飞离职后回国,他招集来自斯坦福、马里兰、 MIT,以及清华、北大等海内外著名高校的工程师,组建了称为「美国名校收集器」的出门问问,从0到1构筑起语音识别、语义了解、对话管理、笔直查找等核心技能,并始终保持国际一流水平。
2015年,李志飞在寻求AI语音的商业化途径时,挑选了智能硬件赛道,发布了一系列明星级的智能手表。
接下来的2-3年里,出门问问发布了几款不同的智能硬件产品。这一过程中,这家公司沉积下一套完好的语音交互技能栈和软硬结合的才能。
2020年,出门问问开端布局生成式AI,GPT-3横空出世,点着了李志飞对AGI的热心。随后,他组建了十几个人团队,并于2021年发布了大模型UCLAI。
一起,还推出了第一款AIGC商业化产品——AI配音渠道「魔音工坊」,这一渠道在全球获超百万量级付费用户,正式开启了出门问问AIGC商业化的序幕。
紧接着,出门问问继续在AIGC底层模块化技能进行开发和布局,包含文生语音、文生图片、图生视频等做了许多技能研制。
在2022年,这家公司就现已完成了AIGC产品矩阵的全面商业化落地。
ChatGPT爆火后,再次让李志飞热血沸腾。他两次飞往美国硅谷,和OpenAI、谷歌、DeepMind等各大厂的工程师沟通取经。
经过内部多次迭代,直到今日,出门问问发布了让众人冷艳的「序列山公」大模型。
「序列山公」以言语为核心的才能体系包含「常识、对话、数学、逻辑、推理、规划」六个维度,可以一起支撑文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
除了面向创造者的AIGC产品和面向C端用户的魔法小问,在B端方面,「序列山公」将敞开生态,去赋能更多的职业,让更多企业打造专属的大模型,自己专属的CoPilot。
经过向用户供给API服务,大模型「序列山公」不只能供给通用才能支撑服务和数字人形象定制服务,还将敞开自身人物才能,继续迭代数据接口。企业用户还能经过上传文档的方法,对职业专有内容进行练习,然后完成定制化语音交互。
敞开渠道地址:openapi.mobvoi.com
据了解,出门问问现在现已与第一批十大职业的内测探究伙伴达成了合作,包含汽车、教育、律所、金融、医疗、旅行等范畴。
从创立至今,出门问问始终是国内言语技能的开拓者,是一家真真切切做技能的公司。以往,它的AI才能经过可穿戴式的硬件方式进行落地。未来,它将以CoPilot的方式赋能企业和个人。
可以说,咱们所看到的「序列山公」大模型的才能与出门问问自身十多年的AI技能积累一脉相承,从语音助手到智能助理,是其在AI范畴十年磨一剑厚积薄发的成果。
正如李志飞所称,「序列山公」仍是一个每天都在不断进步的baby。
经过不断学习,相信未来,「序列山公」大模型会带给咱们更多的惊喜。
参考材料:
write.mobvoi.com/
paint.mobvoi.com/