原文:44.83%!ChatGPT的艺术风格辨认是这个水平
在ChatGPT“与图对话”初体验文中,我们对ChatGPT的艺术鉴赏才干做了开始的测验,其结论是“艺术风格辨认:一半一半”,详细来讲:
关于风格激烈的画风(比方立体主义、现实主义等)辨认率高;关于风格不那么激烈或许比较细分的门户(比方风俗画,被误认为是洛可可),辨认率低。
因此在艺术鉴赏方面,ChatGPT还需要进一步提高。
有读者留言表示对这部分比较感兴趣,希望能了解更多信息;我自己对ChatGPT的艺术鉴别挺好奇,它到底能多大程度上理解不同的艺术门户和风格,所以有了进一步的探究:我想定量测验一下ChatGPT对不同艺术风格的辨认率。
方法与进程
正好前不久看到一篇十分有意思的文章:
Exploring Art History with Midjourney Prompts
nftartwithlauren.com/exploring-a…
顾名思义,用Midjourney提示词探究艺术史:作者让ChatGPT罗列出了59种(文中最终有图片呈现的风格是58种)不同时期流行的艺术风格,然后让Midjourney(现在最流行的文字生成图片的AI之一)以一个芭蕾舞者为主题生成不同风格的图片,然后完结一次对艺术史的视觉探究。
我觉得这是一次十分有构思的艺术教育历程,能够十分直观地感触各式各样艺术风格的流变,从古埃及到现在:
在这个作业的基础上,我将Midjourney画的不同风格的画给ChatGPT看,让它辨认是哪一种艺术风格,将其辨认成果与Midjourney提示词种设定的风格做对比,然后得到一个ChatGPT艺术风格辨认才干的定量描述。相当于让Midjourney扮演考官,给ChatGPT出题,做对打勾 ✅,做错打叉 ❌,最终评个分,看看及格不及格。
下面是我与ChatGPT的对话:
其Prompt为:
I will give you some pictures of a beautiful girl each time, and the pictures are in different art styles listed following. Which kind of art style does each uploaded picture of the beautiful girl belong to? Give the answer in the format: Picture {#NO} -> {#STYLE}. The STYLE should be exactly one of the listed kinds of art style I give to you. If you can not tell which one, the STYLE should be ‘unknown’. The listed art styles are (separated by ;): Egyptian Art;Greek Art;Roman Art;Byzantine Art;Romanesque Art;Gothic Art;Early Christian Art;Islamic Art;Carolingian Art;Ottonian Art;Pre-Romanesque Art;Insular Art;Minoan Art;Hiberno-Saxon Art;Mycenaean Art;Viking Art;Celtic Art;Coptic Art;Macedonian Art;Persian Art;Etruscan Art;Chinese Art;Japanese Art (Heian period);Indian Art (Gupta period);Pre-Columbian Art;Rococo;Neoclassicism;Romanticism;Genre Painting;Portraiture;Hudson River School;Realism;Pre-Raphaelite Brotherhood;Impressionism;Post-Impressionism;Symbolism;Art Nouveau;Orientalism;Landscape Painting;Fauvism;Cubism;Expressionism;Academic Art;Dada;Surrealism;Abstract Expressionism;Pop Art;Op Art;Minimalism;Conceptual Art;Stukism;Photorealism;Street Art;Digital Art;New Media Art;Hyperrealism;Post-Internet Art;Insta-Art/Social Media Art
中文翻译:
每次我会给你一些美人的图片,这些图片采用下列的不同艺术风格。每张上传的美人图片别离归于哪种艺术风格?请以这种格式回答:图片 {#编号} -> {#风格}。风格应该是我给你列出的艺术风格中的一个。如果你无法判断,风格应为“未知”。
列出的艺术风格如下(以分号分隔):
埃及艺术;希腊艺术;罗马艺术;拜占庭艺术;罗曼式艺术;哥特式艺术;早期基督教艺术;伊斯兰艺术;查理曼艺术;奥托尼安艺术;前罗曼式艺术;岛屿艺术;米诺安艺术;希伯尼亚-撒克逊艺术;迈锡尼艺术;维京艺术;凯尔特艺术;科普特艺术;马其顿艺术;波斯艺术;伊特鲁里亚艺术;中国艺术;日本艺术(平安年代);印度艺术(古普塔年代);前哥伦布艺术;洛可可;新古典主义;浪漫主义;题材画;肖像画;哈德逊河派;现实主义;前拉斐尔兄弟会;印象派;后印象派;象征主义;新艺术;东方主义;风景画;野兽派;立体主义;表现主义;学院派艺术;达达派;超现实主义;抽象表现主义;波普艺术;Op艺术;极简主义;观念艺术;斯图基斯姆;摄影艺术;街头艺术;数字艺术;新媒体艺术;超现实主义;后互联网艺术;Insta-Art/社交媒体艺术。
在此之前,我先和它进行了如下对话:
这样做的目的是承认ChatGPT知道这些艺术风格详细是什么。
整个进程总结如下:
** **
成果与剖析
因为ChatGPT每次对话现在最多上传4张图片,58张不同风格的图片要阅历15轮对话才干辨认完结:
最终将成果汇总到下面的“艺术风格辨认.excel”文件中:
然后再借助ChatGPT的“Advanced Data Analysis”(原Code Interpreter)功能(彻底变懒了,Excel公式都不乐意敲),让剖分出辨认率:
44.83% !58种艺术风格,ChatGPT能正确辨认的只有26种,挨近开头所述“一半一半”的印象。
进一步剖析得到容易被其他风格误辨认的五种风格:
- 浪漫主义 (Romanticism) – 3次
- 印象派 (Impressionism) – 3次
- 数字艺术 (Digital Art) – 2次
- 米诺安艺术 (Minoan Art) – 2次
- 立体主义 (Cubism) – 2次
其分布图
ChatGPT剖析的误辨认或许原因包含:
-
练习数据的问题:如果练习数据中某些风格的样本数量很少或不均衡,那么模型在辨认这些风格时或许会出现问题。
-
模型复杂度:简单的模型或许无法捕捉到各种艺术风格之间的纤细差异。
-
特征选择:用于练习模型的特征或许不是最佳的,或许需要考虑更多或不同的特征。
-
艺术风格的模糊性:某些艺术风格或许在某些方面与其他风格十分类似,这或许导致模型在辨认时犯错。
我细心看了一下辨认过错的成果,的确能够得到一些印证:
- 不同艺术风格的类似性。比方科普特艺术和古埃及艺术,本身就有继承性:
还比方印象派 vs 后印象主义,我是看不出有什么太大的不同:
还有这个让人抓狂的“超写实主义” vs “照相写实主义”,你能分辨?
- ChatGPT便是不认识这种艺术风格。比方Dada艺术,尽管我试了十分多次,它都会被辨认成立体主义,这两者之间的风格差异还是十分大的。
还比方伊斯兰艺术,总是会被误辨认成印度艺术(古普塔时期)这种显着不同的艺术:
这或许是练习数据的问题,也有或许是模型复杂度的问题,前者或许性更大。
总结
44.83% !
这是ChatGPT现在对58种艺术风格辨认的准确性。这个数字或许并不准确,能够多跑几次取平均值,不过大致应该便是这个水平。
ChatGPT对艺术风格的辨认肯定是超过一般人,但离高水平的艺术史家,还有一段长长的微调的路要走。
【完】
【往期相关】
ChatGPT“与图对话”初体验
ChatGPT发布语音和图画才干严重更新:关键解读、使用想象与原文翻译