他因抗议而辞去了GenAI的职位现在他想为艺术家创造更公正的系统

他为了推动公正,辞掉了GenAI的职位,现在他希望为艺术家们创造更为公平的系统

埃德·牛顿雷克斯(Ed Newton-Rex)已经达到了一个临界点。作为Stability AI的音频副总裁,这位36岁的青年是计算创造力革命的先锋。但关于该运动的战略,日益引起了人们的不安。

Stability正在成为生成AI领域中新兴的巨头。这家总部位于伦敦的初创公司拥有Stability Diffusion,全球最流行的图像生成器之一。最近,该公司还推出了音乐生成器Stable Audio,这是牛顿雷克斯自己开发的工具。但这两个系统正采取不同的路径。

Stable Audio是基于授权音乐进行训练的。该模型被提供了来自库存音乐库AudioSparx的80万多个文件的数据集。所有受版权保护的材料均获得了许可。

而Stable Diffusion则走了一条不同的道路。该系统是在未经创作者同意的情况下从互联网上抓取了数十亿张图片进行训练的。其中许多是受版权保护的材料。所有这些图片都在未经付款的情况下被采集。

这些图片使该模型的训练效果非常好。Diffusion的输出使Stability在去年的1.01亿美元融资轮中估值达到了10亿美元。但该系统引起了包括牛顿雷克斯在内的艺术家们的反对。

GenAI的伦理困境

牛顿雷克斯是一名钢琴家、作曲家,同时也是GenAI的先驱者,他对这种未经许可的抓取行为持不同意见。

“我一直非常希望确保这些工具是在训练数据的创作者的同意下构建起来的,”他在硅谷的家中通过视频电话告诉TNW。

Stability远非采用这种方法的唯一公司。图像生成器MidJourney和Dall-E,以及OpenAI的ChatGPT文本生成器和CoPilot程序员都采用了同样的方法。视觉艺术品、文学作品、音乐,甚至源代码现在都在未经同意的情况下不断被重新创作。

为此,创作者和版权持有者们发起了众多诉讼。他们对自己的作品被采集、修改和盗用而没有得到许可或报酬感到愤怒。他们还担心自己的生计岌岌可危。

“AI行业有兴趣让人们认为只有大公司才能做到这一点。”

艺术家们说生成AI在窃取他们的作品。而这些系统背后的公司则持不同观点。在最近向美国版权办公室提交的一份文件中,Stability辩称这种训练是“合理使用”,因为结果是“变革性的”和“社会有益的”。因此,公司声称没有侵犯版权。实践可以继续进行,而无需获得许可或支付任何费用。这是GenAI中已经普遍存在的主张,但牛顿雷克斯对此提出了异议。

“它真的揭示了整个行业现在的状况——这不是我感到满意的地方,”他说。

牛顿雷克斯认为这是一种剥削行为。上周,他因此抗议而从Stability辞职。

这次离职并不意味着牛顿雷克斯放弃了生成AI。相反,他计划继续在该领域工作,但采用更公平的模式。这并不是GenAI巨头所描绘的不可能任务,事实上,一系列公司已经做到了。

有替代方案可行

牛顿雷克斯在计算创造力领域有着悠久的历史。在剑桥大学学习音乐后,他创办了Jukedeck,一家先锋人工智能作曲家。该应用程序使用机器学习按需创作原创音乐。2019年,它被TikTok的所有者Bytedance收购。

牛顿雷克斯随后在TikTok担任产品总监,在Music Collaboration应用Voicey担任首席产品官,该应用被Snap收购,在去年加入了Stability AI。他负责领导该初创公司的音频工作。

“我希望构建一个在音乐生成领域展示实际授权数据的产品,一个得到版权持有者的认可的产品,”他说。

那個目標使他與許多行業領袖看法不同。GenAI正逐漸進入主流,許多公司急於儘快發送新系統。從網絡上抓取內容是一個有吸引力的捷徑。

這也有明確的效果。當時,對於授權的數據集是否足夠大來訓練最先進的模型仍然存在疑慮。也對數據的質量提出了疑問。但這兩個假設現在都被證明是錯誤的。

“我們所謂的訓練數據實際上是人類創造性的輸出。”

Stable Audio提供了對立證據的一種來源。該系統的基本模型是通過與版權持有者合作使用授權音樂來訓練的。產生的輸出贏得了掌聲。上個月,《時代》將Stable Audio列為2023年的“最佳發明”之一。

“有一段時間它是音樂生成的最先進技術——而它是用我們授權的音樂來訓練的,”牛頓-雷克斯說。 “對我來說,這表明這是可行的。”

的確,現在有越來越多的公司證明這是可行的。其中一家是Adobe,他們最近推出了一個名為Firefly的生成式機器學習模型。該系統是通過使用創意共享、維基媒體和Flickr Commons的圖片以及Adobe Stock和公共領域中的3億張圖片和視頻進行訓練的。

由於這些數據是獲得許可的,因此可以安全地商業使用。Adobe還強調,使用其作品的創作者將有資格獲得報酬。

Adobe Firefly生成的圖片的拼貼
這個圖片拼貼是由Adobe Firefly生成的,它是用授權圖片作為訓練數據的。圖片來源:Adobe

另一種替代模型來自Getty Images。該公司在9月推出了Generative AI by Getty Images,該模型僅通過該平台的大量圖庫進行訓練。該公司的CEO Craig Peters表示,這個工具滿足“商業需求,同時尊重創作者的知識產權。”

Nvidia也與版權持有者合作開發了GenAI。這家科技巨頭的Picasso服務是通過使用從Getty Images、Shutterstock和Adobe獲得許可的圖片進行訓練的。Nvidia表示他們計劃支付版權費。

這些方法不適用於所有人。作為擁有大量內容庫的大型企業,這些公司背後的資源是少數企業無法匹配的。然而,初創公司正在證明,授權也可以在有限的預算內完成。

為人們服務的GenAI

Bria AI提供了一個例子。該公司開發了一種新的商業開源模型,用於高質量圖像生成。所有的訓練都是在與領先的股票照片機構和藝術家合作的授權數據集上進行的。一種分成模型為創作者和權利持有者提供了報酬。

這是牛頓-雷克斯在Stable Audio所使用的方法的一個相似方法——但這不是唯一的方法。

公司還可以為藝術家提供預付款,創建給權利持有者持有股權的合資企業,或使用具有創意共享許可的內容,該許可可以自由重複使用而無需明確許可。GenAI公司可能對這些努力不屑一顧,但他們有別的動機。

“讓人們認為只有大玩家才能做到這一點,這符合AI行業的利益,但這並不是真正的。”牛頓-雷克斯說。

“你可能需要有點創意。你肯定要進行一些談判,並願意花時間。但最終,我們所謂的訓練數據——實際上是人類的創造性輸出——是一種對技術公司來說的資源。他們需要像獲取其他資源一樣努力。”

如果他們願意這樣做,GenAI可以與人類藝術家和諧共存。並且希望我們所有人都能享受到兩者所帶來的創造力。