“OpenAI: AI技术的前景是非常广阔的,将在各个领域带来巨大的变革和进步。”
1997年5月,IBM开发的“深蓝”击败国际象棋大师卡斯帕罗夫,震惊世界,这或许是很多人第一次在非虚构的作品里听闻“人工智能”的大名。2016年3月,Google研发的“alphago”以4:1的比分击败世界围棋冠军李世石,引爆互联网,网民们或期待或担忧地幻想着未来人工智能将以何种方式改变人们的生活。当时大部分人绝对想不到的是仅仅6年之后人工智能就以不可阻挡的姿态出现在大家的学习生活中。

2022年10月3日,NovelAI推出图像生成服务。其基于文本描述(prompt)生成图像的功能使得绘画对于我这样毫无艺术细胞的人来说也不再是梦想,随后本地部署版stable-diffusion的流行更是使得AI绘画的入门门槛大大降低。大量AI生成的图像被上传至pixiv以至于其不得不专门为AI生成图片单独推出了tag和过滤器开关,方便反感AI作图的人将其批量过滤。不过AI生成tag的添加目前还是依靠上传者自觉,pixiv等创作网站似乎还没有引入算法对图片进行检测,基本可以肯定的是会有上传者不加tag上传AI创作的图片。

这背后的核心问题是仅靠人眼已经不足以高准确率的分辨出AI绘画和人类创作的作品,在sd刚刚爆火也就是2022年11月的时候很多qq群里流传有一份20题的问卷,每题四个选项三幅画是人类画师创作而一幅为AI生成,要求正确选出ai的作品。据我收集到的信息来看答对超过10题的屈指可数,大部分人的得分甚至集中在4-6题,正确率已经跟随机选择相当了,虽然正确率低有AI绘画当时还没有那么广为人知的因素在,但相比于现在当时的AI技术本身也有很大的局限性。我相信即便几个月过去更多人了解、接触到了AI绘画,只要精心编排题目正确率仍不会有显著的提高。

基于这种情况很多人都惊呼“画师要失业了”,甚至很多“画师”自己都站出来抵制AI绘画,宣称“禁止将自己的作品交由AI训练”,更有甚者直接称呼AI绘画使用者为AI小鬼甚至抨击“AI技术是对画师的一种剥削”。

我在前文说“人工智能以不可阻挡的姿态出现在大家的学习生活中”,毫无疑问,AI绘画只是这个大浪潮中的冰山一角,但目前来说我们似乎很难听见画师外的其他职业声讨“AI在抢占自己的饭碗”。我关注的一名公众号作者直截了当的提出“我不担心ChatGPT抢我饭碗,因为人工智能永远无法复制人性的根本原因,不在于他能否深度模仿人类的思维,而在于它不能代替人进行(是非)判断”。ChatGPT并非是能力不足,高校和科研期刊已经因其的出现而感到惶恐不安,大量概括、总结性的工作已经被开始尝试交由ChatGPT完成。但是真的会有写手或科研工作者因它的出现而失去工作吗?我想在当下ChatGPT能力的面前是不可能有的。

写手做的工作是批判性的,不可能仅仅是将发生的事情转述给读者,面对诸如俄乌战争、美国银行倒闭等等这样的新闻时,写手更多的工作是分析其原因、预测可能的解决方式和其带来的后果,这其中包含有大量的是非取舍、价值观判断,这些问题在中文互联网环境内都存在诸多不同的声音,其反映出的正是写手之间价值观、思维方式的差异。现阶段的AI完全无法胜任这样的工作,人类也不可能让AI有能力、有权力做如此深度的价值取舍。而科研工作者做的则是创造性的工作,他们的任务是将0变成1,是从无到有,即便现阶段的AI确实在一些框架化的情景(围棋、象棋等)里有自我迭代、无中生有的能力,但面对科研这样复杂到绝大部分人类都无法涉足的领域,目前的计算机所能做的基本还仅限于仿真模拟、数值计算等打下手的工作。可以认为如果AI真的会让一个职业消失,只能证明这个职业本身创造的价值就极少。

我们不妨再放眼看看别的技术,VOCALOID从诞生至今也有约20个年头了,基于这项技术诞生了著名的初音未来、洛天依、乐正绫、星尘等一众虚拟歌姬,虽然该技术并非基于人工智能算法,但在今天很多虚拟歌姬演唱的作品也到了以假乱真的地步,同AI绘画一样大众已经不那么容易能分辨出一首歌的演唱者是虚拟歌姬还是真人歌手,所以一并放在这里进行讨论了。你何尝听过有歌手对虚拟歌姬的出现表示担忧甚至认为其未来会代替真人歌手呢?我曾在网上看过这么一句话“虚拟歌姬不仅有感情地唱歌没有人唱的好听,她们无感情的演唱也做的不如真人”,这句话或许有夸张的成分在,但虚拟歌姬演唱与人的差距也可见一斑。虚拟歌姬的发展方向从来不是代替真人歌手,初音未来、洛天依等虚拟歌姬已经成功走出了一条与真人歌手平行的道路,她们甚至在专业场馆举办过演唱会,座无虚席。可以说虚拟歌姬的出现不仅没有代替歌手甚至催生出了虚拟歌姬调音师等一批新职业,凭借其更大众的音乐入门门槛、能演唱人类无法到的音高和技巧等特点贡献出了《千本樱》、《普通DISCO》、《病名为爱》等一众热门歌曲,饱受众多二次元爱好者的喜爱。

绘画、写作、演唱同样作为凝结着人类情感与智慧的艺术形式,当他们同样面对着新兴技术的冲击时为何呈现了截然不同的反应?很多人将AI绘画的出现之于画师类比做珍妮机的出现之于纺织工人,这个例子的时代有些太过遥远,我们不妨想想我们身边因为科技进步而消失或者大规模削减的职业。一个很典型的例子是停车场收费员,我幼时进出停车场都还是人工收费,现如今大商圈、旅游景区大部分都已经是扫二维码在线付费,图像识别、在线支付等技术的发展使得记车牌、收费都不再需要人工操作了,人工收费员的数量也因此大大减少。再举另一个不那么直观但却很有价值的例子,在中国大陆地区,群体性的罢工抗议是极为罕见的,但大家应该没少听说出租车司机罢工的事件,在当时他们所反抗的对象一是收费居高不下的出租车公司,二则是快速抢占市场的网约车。当年网约车行业还属于各家公司争相压价吸引客流的时代,网约车低廉的价格使得出租车损失了大量客流。可即便到了滴滴快的完成合并、网约车不再恶意压价的今天,年轻人的主流出行选择依然是网约车。除去出租车价格高、环境差、不方便等客观因素,其恶意绕路、不打表、拒载等恶劣行径令多少人对出租车深恶痛绝,很多人甚至直言“不到万不得已绝不打出租车”。真正让出租车行业落到今天这个田地的不仅仅是伴随智能手机普及出现的网约车软件,更是他们自己曾自恃为垄断行业而不断作恶的咎由自取。

有些人打出反对AI绘画的理由是“现在的AI是弱人工智能,大量人工智能创作的低创作品会打击绘画行业,甚至让愿意走上绘画道路的人越来越少”,综合前文来看,这样的论调显然是站不住脚的,虚拟歌姬演唱的歌曲会让愿意学唱歌的人越来越少吗,ChatGPT会让记者、作家越来越少吗?我想答案是显而易见的,我们人类不会因为计算器可以算数就不学习数学,不会因为计算机可以记录信息就放弃学习历史。绘画作为一种艺术形式发展已有上千年,从《最后的晚餐》到《自由引导人民》,从《洛神赋图》到《清明上河图》,绘画同文字一道承载着历史,承载着思考,承载着人类思想的深邃,担心AI会影响人类绘画未来的恐怕也只是杞人忧天罢了。

说到底,被AI搅动的人心惶惶的“绘画圈”和当初罢工抗议的出租车司机群体何尝不是相似的呢?真正令他们感到担忧的并不是某些人所标榜的“绘画的艺术”,而是他们自己的饭碗真正面临着被AI所代替的危险。这里似乎又有前文所谈的“绘画作为一种艺术形式短时间甚至可预见的未来都不会被AI所取代”相矛盾了,讲清楚这个问题前我们还是需要谈谈AI绘画具体发展到了什么样的地步。

去年10月初NovelAI及本地部署版本sd刚刚爆火之时,无论是官网还是本地版本都在使用NovalAI训练的模型库,此时的AI绘画还基本仅限于二次元人物、风景画,三次元人物、动物和一些简单物件。虽说相比于以前的AI绘画确实已经有了质的飞跃,但仍然有很明显的局限性,比如手和腿部结构处理的很差、对于像车、船、楼房这样的人造物体表现力很差、需要大量指令控制才能出质量比较好的图片等等。10月底,开始出现embedding模型训练技术,该技术允许用户利用算法从一组图片中训练出一个人物集或画风集,虽然以我的观察来看该技术尤其是在个人电脑上进行训练效果并不甚理想,但其带来了通过训练解决NovalAI模型库内容陈旧、无法满足各方多种需求等问题的积极意义。11月开始,dreambooth训练流行起来,该训练方式的效果显著强于以前的训练方式,不过相应的对GPU的要求也更高,虽然此时大部分用户因为技术和设备的原因还难以摸到训练的门槛,但直接使用他人训练好的模型包已经可以显著改善出图质量。今年1月底,基于dreambooth的lora训练技术问世,该技术配置要求和技术门槛均远低于此前的dreambooth训练,其真正做到了将训练下沉到绝大部分用户身上。自此潘多拉魔盒彻底打开,很多有关AI绘画的争议其实更像是关于AI绘画训练的争议,此部分在下文详细聊聊,在此就不赘述了。2月中旬,controlnet插件问世,其实现了线稿上色,生成线稿,基于人物骨架绘画等诸多功能,AI画手差、人体结构差、不听指令等诸多问题一夜之间得到了显著改善。

可以说,技术进步的速度是远超普通人所想象的,短短五个月,AI绘画的诸多问题就得到了极大程度的改善,甚至像discord推出的midjourney采用公开素材训练的模型库,其产出内容已经达到了可以直接商用的级别。当然,正如大家常谈的“科技是一把双刃剑”,其实现技术飞跃的同时也在引发越来越多的争议。

争议的内容也是多方面的,还是不能一概而论,要拆开了聊聊。第一轮争议主要是发生在去年10月也就是我前文说的AI绘画刚刚爆火的时候,这一波主要抗议者是底层画师,这里说底层指的不是技术而是他们的谋利手段基本仅限于在米画师、闲鱼等平台接私人的商单。彼时的AI虽然还没有十分精进的技术,但已经赢在速度快和产量大。绘画毕竟还是一项精细的工作,底层画师画商稿少则一两周,多则以月计,古语云“慢工出细活”,如果说时间能换来好的质量的话,那我相信消费者还是可以接受的。但据我所知,长久以来绘圈拖稿、无法满足甲方要求、坐地起价、有矛盾就挂甲方等操作屡见不鲜,可以说由于绘画不同于唱歌和写作,其有较高的技术门槛,而某些画师正是利用其自身相对于甲方的技术优势攫取不正当的利益。你交了定稿的钱就像关上了出租车的门,之后能不能顺利、物有所值的抵达目的地就全靠对面的良心了。

虽说与AI沟通的效率比不上与人沟通,但AI反馈的效率却实在是高了太多,相比于约稿至少十天半个月的长时间等待,AI在学习完指令的使用方法后几十秒的出图速度确实是称心快意,对于大多数的私人需求而言,AI的效率已经可以在一定程度上弥补其与人类画手质量的差距,更何况AI绝不会心怀鬼胎,你投入的精力和算力,AI都会还给你物有所值的产出。此时面对AI的底层画师们确实就像那个比方中面对珍妮机的纺织工人一样,你若没有实打实的“编织云锦”的手艺,织布的工作被机器代替终究只是时间问题。

也正是如此,这轮恐慌并非只在底层画师间蔓延,许多人担心今天底层画师面临的挑战将是未来自己所会面对的,此轮声讨如此声势浩大原因也正在于很多人陷入了丢失工作的恐慌中,古语云“断人财路如杀人父母”,有些人的情绪我是可以理解的。但我认为大部分人不必盲目和底层画师情感共鸣,大部分人完全没有了解过画师约稿和约稿平台,诚如上文所言,底层画师遭到冲击的很大原因并不是如今的AI能够叫板人类画手了,而是能让他们中部分人趾高气昂地攫取利益的技术壁垒不复存在了。

随后的争议主要爆发在dreambooth训练发布尤其是lora出现之后,此前大家所用的基本是由NovelAI、midjourney等网站训练好的模型包,其出于避免法律争端或争议的考量,会使用足够多的图片作为训练集或直接避免使用受版权保护的图片。训练出的模型和AI算法产出的图片不包含有任何与素材图片本身有关的信息,在训练素材足够多的情况下即便其中确实存在一些有争议的图片也难以分辨了。当然,由于AI算法是新兴产物,相关领域目前还缺乏完善的法律监管,相关方面此后法律会如何规定、如何鉴别我们不得而知。

但lora训练技术出现后,事情变得更加复杂了起来,lora一来可以训练更少的图片,二来对硬件的要求也更低了,大量的个体用户开始使用训练技术。相较于企业,用户毫无疑问没有那么多顾忌,一时间二次元游戏角色、p站画师作品集甚至三次元女明星的模型层出不穷,lora的针对性远强于以前大锅炉式的模型训练,因此画师们更容易发现哪些模型在使用自己的画作为素材,有些模型上传者甚至直接把那些标注了“禁止AI训练”的画师的名字放在模型名里。

如此无视画师要求的行径很难不引发冲突,前些日子,pixiv的一些画师和其拥趸在civitai网站举办了相应模型,不过截止到目前除了作者自愿下架的模型外平台并没有将争议的模型下架。本人并不是法学生,以欧美为首的海洋法系有关版权的内容略显晦涩难懂,我们先参考我国法律中的规定。《中华人民共和国著作权法》第四节第二十四条规定:“在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益:(一)为个人学习、研究或者欣赏,使用他人已经发表的作品;……”,C站等模型站作为非盈利性质的平台,依照我国法律规定从任何角度来说发布标明了作者姓名或者名称、作品名称的模型集并不侵犯原作者的著作权。相应的,个人使用AI绘画程序和模型包绘制的图片不商用也是不违反法律的。

​在这种论证下有人就提出“法律是最低标准,我们应当以道德准则要求自己,以法律作标准是卑劣的”,我们暂且不论这种说法本身是否合理,使用训练的模型集进行创作真的构成违反道德标准的抄袭吗?当然其中的悖论在于我们很难认定什么是“违反道德”的抄袭,绘圈部分人和很多爱好者通常鉴定抄袭的标准无外乎是肉眼法和叠图法。肉眼法通俗来说就是单凭借主观判断两幅作品是否高度相似,但此方法一来没有可依据的客观标准,二来作曲行业无数次靠耳朵认定抄袭被扒谱打脸的例子告诉我们,这种主观判断不但极不准确而且其无端引发的争议往往造成无法挽回的恶劣后果。当然AI倒也不能完全适用同样的道理,稍后详谈。叠图法则是更科学也更接近于司法实践的方法,当叠图重合度超过一定限度时便可认为是抄袭甚至是法院能够判定的“侵权行为”。

很显然,叠图法对于AI生成的作品是难以奏效的,现如今深度学习算法并非某些人想的那样提取素材图片的要素、剪贴拼接,哪怕使用专门训练的lora模型并刻意模仿素材作品,也是不太可能有高比例重叠的,更不论AI使用者可以刻意避免生成的作品与原素材撞车。

无法以客观科学的方式为依据施加他们对AI的怒火,部分人便把注意力转向了“画风抄袭”、“粗劣的模仿”,“几个小时窃取了画师数十年努力”等说辞上。令人难以理解的是,难道学习更快也是一种原罪吗?一个画师学习了15年有一定的成就,而另一个画师学习10年就有相当的技术,难道说学习能力更强、进步更快的画师就要遭受质疑吗,AI作为算法其与人类学习能力的差距确实远超人与人之间的差距,但学习能力的差距是以什么样的逻辑成为一种被集火抨击的问题的呢,更何况算法也不是石头里蹦出来的,其背后也蕴含着众多算法工程师和科研工作者多少年的努力啊。

AI训练的过程中确实使用了画师的作品,但最终生成的模型集只是AI学习的结果并不包含任何与原素材有关的信息,打个比方来说“我”学习某画师风格多年最后画出了一幅重合度为0但风格高度相似的图片显然不会被认定为抄袭。同样这里不过是把主体从人换成了AI、学习时间大大缩短了罢了,AI通过文生图得到的作品与原素材可以说没有物理上的关系,只是画风的高度相似。“画风抄袭”等说辞私以为只是强词夺理的造了一个概念罢了,画风或者换言之画法、风格类似在艺术届并不是少有的事情,普通人难以分辨出印象主义、超现实主义等流派的画是否源自于同一个作者,更不论传统的绘画方式中国水墨画、日本浮世绘等本身就是高度相似的。其他艺术形式诸如演唱、书法等,翻唱、摹本甚至需要主动模仿原作,现存的《兰亭集序》等很多书法作品并非真迹而是摹本,但我们并不会因此就否定其艺术价值。绘画风格无法归属于个人版权,不可能有任何画师完全独立于外界习得自己的画风,人类也需要学习他人画风从而发展自己的画风甚至直接传承,怎么当主体变成AI时就拉出“画风抄袭”的荒谬大旗反对呢?

至此,比较大的争议基本讨论完了,至于“人类模仿画风会发展出自己的风格所以可以而AI只能单纯模仿所以是抄袭”等说法我觉得已经不值一驳了,且不论AI并不是一直自我迭代、演算,其生成的作品还包含有使用者的意志和创意,AI高速自我迭代的产出已经让象棋、围棋等诸多领域折服了,为何有些人就言之凿凿的认为AI无法做“创新”呢?说到底绘画是色彩排列组合,AI确实无法实现“路径”的创新,但其完全有可能带来内容的创新。

不过说到底,我并不反感有道德、有能力的画师声讨AI绘画技术和一些使用者,毕竟客观来说AI绘画的出现确实带来了一些问题和冲突,但那些能力不足、赚黑心钱的画师和不了解绘圈盲目共情画师攻击AI技术的人你们还是适可而止吧,靠道德卑劣赚取了多少甲方的钱如今又站在道德高地攻击技术,着实有些令人作呕。

当然我并不反感的另一个理由是技术不会因为几个人、某个群体的反对而停下发展的脚步,就在我写下这段文字的前几天,GPT-4的发布又在互联网内引发了轩然大波,AI短短几个月的进步速度着实是令人咋舌。微软已经宣布将人工智能接入办公软件,百度文心一言对话模型在前几日公布,越来越多的企业和网民已经意识到AI技术将引发新的浪潮甚至实现新一轮的生产力解放。

无论你排斥或是接纳,AI带来的变化和生产力都摆在那里,有研究估计ChatGPT可能影响80%的工作岗位。当然这个影响并不一定是逼你下岗等负面影响,举个身边的例子,虚拟主播圈不仅有很多观众用AI训练翻唱了主播能力不够、语言不通而没有尝试过的歌曲,更有主播主动与AI训练员合作推出了质量上佳的作品,我也注意到绘画圈同样有人尝试人与AI分工合作创作作品,AI可以提高效率、获得更多创意,而人则可以完善AI尚无法完善的精细工作,我相信对于很多职业而言,未来与AI合作将成为大趋势。

顺应时代或是成为旧时代的残党,每个人都有选择的权力,而你会做出什么样的选择呢?