OpenAI确实不擅长起姓名。Code Interpreter (代码解说器)乍听上去像是跟编程有关的东西,但是实践上完全不是。它能利用Python代码批量处理几千张图片,因而得名。你能够讲要处理的图片紧缩为一个512M以内的文件,然后直接上传到ChatGPT。
有了Code Interpreter,你不再需求学习其他软件来批量处理图片了。你能够像跟朋友对话相同描绘你的需求,然后让它裁剪掉不必要的布景、将静态图片转换为动感的 GIF、增加水印以维护版权,甚至辨认人脸并含糊以维护隐私。
让咱们用实践事例看看它的强大之处吧。
删去图画主题周围空白布景
当咱们需求把图片展示在网页上或许PPT中,为了坚持风格的一致,或许提高图片的加载速度,会想要删掉图画主体部分周围的空白布景。
咱们只需求把要处理的图片紧缩成一个包,上传到Code Interpreter,然后再写一个Prompt就能够搞定。
例如,我把以下三张需求处理的图片紧缩一下。
然后上传到Code Interpreter,再提交这样一个Prompt就能够啦:
请删去紧缩包中图片主体周围的空白空间或剩余空间。
然后咱们看下Code Interpreter的处理进程:
理解了。 我将处理ZIP 文件中的图画,删去图画主体周围任何不必要的空白。
首先,我将从 ZIP 文件中提取图画并将其加载到内存中。 然后,我将继续进行图画处理步骤。 开端吧。
我现已处理了 6 张图画,并删去了每张图画周围不必要的空白。 现在,我将把这些图画紧缩回 ZIP 文件并供给下载链接。
处理后的图画已成功紧缩为 ZIP 文件。
您能够从以下链接下载包含已处理图画的 ZIP 文件:
下载处理后的图画
点击ChatGPT供给的下载链接就能够下载处理好的图片啦。这是删去了剩余白色布景后的三张图片:
图片转GIF动画
GIF要比静态的图片更具有视觉吸引力,与视频比较具有体积更小的优势,你能够用Code Interpreter把图片转换成GIF提高交际媒体的参加度。
咱们只需求把要处理的图片紧缩成一个包,上传到Code Interpreter,然后再写一个Prompt就能够搞定。
请将zip包中的图片转换为GIF。 图画应按称号顺序排列。 生成的 GIF 应具有循环动画,而且每帧之间有 500 毫秒的帧推迟。
这是我用来生成GIF的三张图片:
来看下ChatGPT的处理进程:
我现已成功将图画转换为 GIF,帧推迟为 500 毫秒。 这是您要求的 GIF:
下载GIF
这是终究生成的GIF:
除了直接转GIF,还能够增加其他作用,比方淡入淡出。
图片加水印
水印是宣告图片所有权的一般做法。摄影师、艺术家和内容创作者经常增加水印,以确保他们的著作得到认可并避免其他人宣称其为自己的著作。用Code Interpreter增加水印也很简单:
该紧缩包有多个图画以及我的logo。 logo的文件名是“logo”。 请你将logo作为水印增加到每个图画中。 水印应位于距图画右下角 10 个像素的方位;坚持原始宽高比;巨细为相对于图画宽度或高度的 5%;通明度 50% ;布景要通明。 最后,请供给处理后图画的下载链接。
以下是我要处理的图片:
来看看ChatGPT的处理进程:
终究两张图片的右下角都增加了水印。你也能够经过修改Prompt来调整水印的巨细,方位和通明度。你当然能够上传更多图片,不过目前能够上传到Code Interpreter的最大文件巨细为512M。
除了加水印以外,还能够批量给图片增加文字,增加其他图片等。
人脸辨认
在有些场合,出于维护隐私或个人身份的目的,咱们需求在人脸上打马赛克。这个操作在Code Interpreter里边还是只需求一句话就搞定。
先看下原先的两张美人肖像:
然后把下面这个Prompt交给代码解说器:
该紧缩包有多张图画。 请辨认每张图画中呈现的面孔。 辨认出脸部后,我需求您创立马赛克以掩盖每个图画中的脸部。 最后,为我供给处理后图画的下载链接。
终究翻开的两张图片作用如下:
除了打马赛克以外,还能够把辨认的脸部做含糊处理,用其他图画掩盖住或许把所有辨认出的人脸保存为另一个图画。
图画降噪
在弱光下拍照的相片都会很考验照相机的功能,虽然现在的相机的感光才能越来越强,但在某些弱光拍照条件下,相片不免会有噪点。例如下面这张相片里的黄色区域存在亮度不均匀的小糙点。图画降噪技能能够削减这些噪点,提高画质。
把这张相片上传到代码解说器之后,输入以下Prompt:
去除图画中的噪声,一起保存其纹理和细节。 完成后,请分享处理后图画的下载链接。
ChatGPT输出了处理进程:
为了去除图画中的噪声,咱们能够运用多种办法。 最常见的办法之一是运用去噪滤波器,例如非部分均值去噪算法。 该算法的工作原理是比较图画中的所有像素,而不是仅比较部分邻域中的像素,因而它能够在去除噪声的一起保存细节。
让咱们继续这个办法,然后你能够查看结果是否令人满意。 假如没有,咱们能够测验其他办法。
图画现已过处理,噪声已削减。 您能够从以下链接下载去噪后的图画:
下载去噪图画
请查看图画并让我知道降噪作用是否令人满意。 假如没有,咱们能够测验不同的办法或许调整当时办法的参数。
假如对终究的图片作用不满意,还能够给ChatGPT提修改意见。我这儿只演示了一张图片,你能够把要处理的多张图片紧缩上传,不要超过512M就好了。
根底图画处理
Code Interpreter还能够履行根底的图画批量操作,如缩放,裁剪,旋转,含糊,锐化等。
图画缩放
图画缩放便是改动图画的巨细。 能够经过指定新的宽度和高度或按一个份额缩放。在缩放进程中,图画的像素值会调整以习惯新的尺度,一起保存视觉内容和宽高比 。
Prompt举例:
- 将此图画缩放为 800 像素的宽度,一起坚持其纵横比。
- 请将给定图画按原始尺度缩小 50%。
- 我期望你将图画扩大 2.5 倍。
- 你能将这张图片的巨细调整为 600 像素的高度并坚持其原始纵横比吗?
- 我需求将此图画缩放至 1920×1080 像素的分辨率。
图画裁剪
图画裁剪是从图画中挑选并提取特定的感兴趣区域 (ROI),一起丢掉其余部分。裁剪是经过指定所需 ROI 的坐标或尺度来实现的。所选区域能够经过其左上角和右下角坐标或其起点的宽度和高度来界说。裁剪时,指定 ROI 内的像素将被保存,图画的其余部分将被丢掉。
Prompt举例:
- 从点 (100,100) 开端裁剪图画,宽度为 500 像素,高度为 300 像素。
- 请从图画中提取由坐标(300,200)到(800,600)界说的感兴趣区域。
- 你能从图画中心剪出一个边长 400 像素的正方形吗?
- 裁剪这张相片,使其聚集于从左上角 (0,0) 到右下角 (600,400) 的矩形界说的区域。
- 我想在中间隔离主体,以中心周围 200 像素为半径裁剪图画。
图画旋转
图画旋转便是环绕给定中心点将图画旋转指定视点。旋转能够是顺时针或逆时针。在旋转进程中,图画的像素值会重新排列以习惯新的方向,一起保存内容。旋转中心能够由图画中的特定点或图画的中心来界说。
Prompt举例:
- 将图画顺时针旋转 90 度。
- 请将给定图画逆时针旋转 45 度。
- 你能把图片绕中心旋转180度吗?
- 将此图画绕点 (300,300) 顺时针旋转 30 度。
- 我需求该图画即沿水平轴旋转 180 度。
图画含糊
图画含糊是一种用于削减噪声并平滑图画细节的技能。含糊是经过平均或操纵每个像素周围邻域中的像素值来实现的。能够指定常见的含糊技能包括高斯含糊(运用高斯分布运用加权平均值)和中值含糊(将每个像素替换为其邻域的中值)。
Prompt举例:
- 对图画运用半径为 5 像素的高斯含糊。
- 运用具有 3×3 内核的中值滤波器含糊此图画。
- 你能运用高斯办法对西格玛为 2.0 的图画运用含糊作用吗?
- 请在水平方向对图画运用运动含糊,内核巨细为 20。
- 我想柔化这张相片中的细节,你能够运用含糊滤镜吗?
我的总结
现在Code Interpreter处理图画的功能还是挺有限,它内置的处理图画的Python库并不是悉数,只是选了其间的一部分。但随着它内置更多的Python库,功能一定会更强大。
假如本文对您有帮助,辛苦点个赞哦