2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!
一年前的今天,榜首版天工大模型正式对外发布上线,一年来咱们不断迭代模型,迭代使用产品,模型和使用都越做越好,以此回报广阔用户的支持。
「天工3.0」具有4000亿参数,逾越了3140亿参数的Grok-1,是全球最大的开源MoE大模型。 「天工3.0」在语义了解、逻辑推理、通用性、泛化性、不确定性知识、学习才能等范畴具有打破性的功用提升,数学/推理/代码/文创才能提升逾越30%。
(天工3.0模型参数逾越Grok-1,成全球最大开源MoE专家混合大模型)
强壮的模型技能实力赋予「天工3.0」超强的功用体现。在MMBench等多项威望多模态测评成果中,「天工3.0」逾越GPT-4V,全球抢先 。
(天工3.0多模态功用逾越GPT-4V,全球抢先)
同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今天面向全社会敞开公测。「天工SkyMusic」是我国首个音乐SOTA模型,更是我国的自研大模型技能榜首次在AIGC范畴领跑全球。
(天工SkyMusic归纳功用逾越Suno V3,获得音乐大模型SOTA,领跑全球)
天工SkyMusic:我国首个音乐AIGC SOTA模型
此前,大模型已经在文本、图画等多个技能范畴获得打破,带来工业全面变革。但是,在AI音乐生成范畴,全球迟迟等不到一款产品,开启「音乐ChatGPT时刻」。
这是因为一直以来,AI音乐职业大量研讨都集中在符号音乐生成技能路线上,并且大多只能完结无人声背景音乐(Background Music,BGM) 的生成,音乐的质量、效果、审美都远远达不到可用水平,工业迟迟未能迸发。
(「天工SkyMusic」自研AI音乐大模型技能架构)
与职业主流途径不同,「天工SkyMusic」采用自研大模型音乐音频生成技能路线。这一路线直接经过大模型技能完结乐器、人声、旋律、音量、音符的一体化端到端音乐生成,技能难度极大,全球只有包括昆仑万维在内的极少数顶尖玩家参与。
在与海外顶尖的AI音乐大模型Suno V3的横向测评中,「天工SkyMusic」在人声&BGM音质、人声天然度、发音可懂度等范畴明显抢先对手,并以6.65分的归纳得分逾越Suno V3, 成为全球AI音乐SOTA模型。
此外,「天工SkyMusic」还具有首创的参考音乐生成与方言歌曲生成才能。
参考音乐生成:用户可上传自有参考音乐,或挑选「天工SkyMusic」资料库中现有的参考音乐,然后生成风格、唱腔相似的歌曲,进一步下降音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。
方言歌曲生成:「天工SkyMusic」生成的音乐不仅在人声天然度、发声可懂度等范畴体现优秀,更可以支持粤语、成都话、北京话等众多方言,让用户可以更自由地完结音乐表达,传达方言文明。
「天工SkyMusic」是我国首个揭露可用的AI音乐生成模型,更是我国自研大模型技能榜首次在AIGC范畴领跑全球。
当时,在文本大模型范畴,OpenAI招引了全球的注意力;但是在AI查找、AI音乐生成等细分范畴,我国玩家们正在奋勇前行,不断经过自研技能获得细分范畴顶尖的SOTA体现,一起建设我国大模型工业,打造自主可控的大模型工业生态。
天工3.0:4000亿参数,全球最大开源MoE大模型
在上一代「天工2.0」MoE大模型的抢先基础上,「天工3.0」完结了全面的功用晋级,采用了4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、功用最强的开源MoE模型。
「天工3.0」的逻辑推理才能、语义了解才能、应对杂乱需求才能、内容创造才能全面晋级,并新增了多轮查找与归纳东西调用、图表制作、研讨形式、增强形式、改图扩图等多项AI才能,为用户带来全新AI体会。
多轮查找与归纳东西调用: 「天工3.0」针对模型独立规划、调用、组合外部东西及整合信息的才能进行了专项练习,使其可以独立生成并调用代码,完结包括工业研讨、产品横评、信息分析、图片生成、图表制作等多种杂乱用户需求。
同时,「天工3.0」可以经过强壮的语义了解才能将用户使命拆解成细分环节,实时判别是否需求联网或调用东西,进行单轮或多轮的联网查找、东西调用,完结包括多轮查找、热点信息分析、图片生成等杂乱用户需求。
(Query:查询最新我国历史电影票房排行,图表展现)
图表制作: 「天工3.0」全面提高了逻辑推理才能与用户天然语言Query的了解才能,使其可以更精准地判别用户需求,独立生成并调用代码,结合文本需求实时进行内容分析及图表构建,为用户带来更直观、高效的对比成果。
(Query:北京、上海、重庆哪个好玩?)
多轮查找、归纳东西调用、图表制作 等都是「天工3.0」所独有的大模型归纳才能,其从底层打通了「天工3.0」的AI查找、AI对话、AI代码生成、AI图片识别、AI图画生成等底层才能,经过语义识别才能直接触发,为用户带来更加快捷、高效的AI体会,成为真正的AI生产力东西。
此外,「天工3.0」中还增加了研讨形式、增强形式、改图扩图等多项AI才能。
研讨形式: 在研讨形式中,「天工3.0」可以围绕用户的某个简单指令进行相关问题的延伸,主动生成研讨大纲、图谱、实践总结、思维导图,协助用户快速明晰地掌握核心内容,完结用户杂乱的研讨需求。
(Query:康乾盛世年代)
增强形式: 在增强形式中,「天工3.0」可以针对用户的杂乱Query进行拆解、细化、并进行追问、信息了解与补全,使其在天然语义了解方面功用更强,面临不确定性知识时体现更好,可以更精准、高效地满意用户需求。
(Query:2024年春节档电影;「天工3.0」了解并追问用户需求)
改图扩图 : 「天工3.0」多模态功用获得全面打破,逾越GPT-4V,归纳排名全球榜首。在强壮的技能底座支持下,「天工3.0」的AI绘图才能新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功用。
(「天工3.0」的AI改图、修图、扩图等功用)
关于昆仑万维
自去年4月17日「天工」大模型正式推出以来,昆仑万维已围绕「天工」系列大模型建起AI大模型、AI查找、AI音乐、AI视频、AI社交、AI游戏等AI事务矩阵,是国内模型技能与工程才能最强、布局最全面的人工智能科技企业之一。
这一年里,除了对「天工」系列基座大模型进行不断晋级迭代,昆仑万维还推出了国内榜首款AI查找引擎「天工AI查找」、开源了百亿级大语言模型「天工Skywork-13B」、推出国内抢先的AI Agent开发平台「天工SkyAgents」等一系列前沿大模型产品。
当时,「天工」系列大模型已集成了AI音乐、AI查找、AI写作、AI长文本阅览、AI画图、AI语音合成、AI漫画创造、AI图片识别、AI代码写作、AI表格生成等多项才能,并将在未来加入AI视频功用 ,对标“超级使用”,成为人工智能年代的“超级大模型”(Super Model) 。在“完结通用人工智能,让每个人更好地塑造和表达自我”的公司使命驱动下,昆仑万维将一直致力于AI技能与产品的创新开拓,不断提高AI产品的用户体会,与用户、研讨人员、开发者们携手,共创国产大模型的未来。