前史回顾
上一次阿里发布通义千问,犹在昨天,结果,阿里又发布了一件AI神器,该神器实用性极强,据说背面仍然采用阿里的通义千问大模型。
不了解的能够看下我的前史文章 阿里的通义千问,震动到我了
最近一直在收拾AIGC方面的东西共享给咱们,当然编程也不会落下,欢迎重视,让咱们在AI的道路上越走越远
他来了,讯飞星火迈着强健的脚步向咱们走来了
免费建立个人stable-diffusion绘画(非本地、干货教程)
阿里给“打工”朋友送上“节日礼物”
六一儿童节当天,阿里就给一切“打工”的大朋友送上了一份“节日礼物”
6月1日上午,阿里云发布了面向音视频内容的AI新品“通义听悟”,并正式公测
【通义听悟】 推荐给你~ tingwu.aliyun.com/u/14xZ00303… 工作学习AI帮手,依托大模型,为每一个人供给全新的音视频体会。点击链接当即注册,公测期免费体会。
通义千问、通义听悟 这哥俩现在所在环境不同,定位不同,功用不同 但依靠大模型是相同的
这是阿里通义大模型最新的使用进展,也是国内首个敞开公测的大模型使用产品。
依据阿里云智能CTO周靖人介绍,“通义听悟”是依托通义千问大模型和音视频AI模型的AI帮手,可进行实时语音辨认,完成对话的实时记载、多语言翻译、发言总结、提取PPT、内容规整等。
对咱们打工人有什么用
会议神器
当领导在上面纸上谈兵的时候,你的会议纪要可谓是紊乱无章,这会儿通义听悟就上线了,你只需要录音
或者咱们本地上传
支持区分多人对话,然后开始转写
值得一提的是, “听悟”能够依据AI转写,提取这场说话内容的关键词,给出全文摘要。
视频总结神器
不同于传统的实时会议速记转写,现在面向C端供给视频转写服务的使用尚在少数。而现在的通义听悟,则从纯粹的音频转写,延伸到了音视频领域,交融了十多项AI新功用。
“通义听悟”我个人认为最大的实用功用是:能够设置插件,无论看视频、看直播,还是开会,点开听悟插件,就能完成音视频的实时转录和翻译。
其实看到这儿,能够感受到,这不仅仅说对打工人的福利,也是对于学生党的福利,比方咱们上课,课后复盘总结
最后再提一点阿里的生态,他们将数据存储和阿里云盘打通 这点是值得表扬的,在阿里云盘中,用户能够一键转写云盘中的文件,在云盘内在线播放视频时,能够实时生成字幕。
还能帮咱们什么
通义听悟未来还有更多根据大模型的功用上线。比方,对视频中呈现的PPT,AI能够根据通义千问大模型做到一键提取,而用户也能向AI帮手针对多个音视频内容进行提问、让听悟概括特定段落等等。
值得注意的是,听悟目前针对一些细分场景中供给了不同的部署形态,如浏览器插件。在Chrome安装听悟插件后,听悟在无字幕视频中就能够实时生成双语悬浮字幕。二转写结果可下载为字幕文件,便利新媒体从业者视频后期制作
通义千问Chrome插件示意图,近期该功用将上线,能够继续重视 我后续给咱们做详细介绍,不过咱们能够先感受下
钉钉的在线会议模块“钉闪记”,同样集成了听悟。在会议完毕后,钉闪记所能够输出的也不再是纯粹的速记,而是包含要点摘要的完整文档,能够有效地提升公司内部工作效率。甚至,在开会时,AI能够代为记载会议、收拾要点。
未来一段时间还将在夸克APP、阿里云盘等端口供给服务
总结
这一番体会下来整体的作用还是能够的
从通义听悟中能够看出,国内大模型厂商除了在底层大模型建立上快马加鞭外,AI使用也已经成为他们有必要捉住的机会——AI音视频转写、内容理解等功用,背面意味着通用能力,厂商们能够掩盖包含开会、上课、训练、面试、直播、看视频、听播客等音视频场景,嵌入到不同的使用软件当中。
今天的共享就到这儿,咱们的AI绘画系列正在渐渐建立,对AI有兴趣的能够重视大众号(微信大众号搜索 1点东西) ,咱们会继续输出AIGC类好玩的工具和想法,立志让每个人都能感受AI,利用AI找寻更多可能性