AI 如何重新定義創作工具和媒材?
▎編按:
TRUMP發幣有人得意有人失意,拋開Fomo情緒,Meme只是入口,AI才是鏈上之春的未來,把握最關鍵的趨勢,世界盡在我手。
今天為大家分享一篇來自加密VC@baincapcrypto的《Neural Media》 ,作者@natalie思考了生成式人工智慧和加密貨幣對創意生產的影響,希望能夠幫助大家在尋找下一個機會之際得到一些啟發。
?主要亮點
1️⃣ 生成式人工智慧正在引發創意生產領域的深刻變革,其影響可與網路時代媒體分發成本降至零的「Napster時刻」相提並論:
• 這次變革的核心在於創作生產成本降至零,直接衝擊人類創造力的核心。
• 在新範式下,人類應從關注最終輸出轉向關注系統和過程,即在程式設計層面教導神經網路思考。
2️⃣ 透過編程,我們可以創造獨特的“軟體大腦”,產生獨特的思想和作品。應用場景包括:
• 基於Agent 的媒體: 模型模擬人類伴侶,透過文字對話互動,可執行金融交易等操作。
• 即時遊戲引擎: 模型模擬遊戲引擎,依照使用者動作產生遊戲幀,實現即時渲染。
• 多元宇宙生成器: 模型產生無限變化版本,擴展使用者原始的想法,探索可能性空間。
3️⃣ 未來面臨的趨勢可能是:
• 創作工具化: 提示(Prompting)正嵌入更多介面,激發終端使用者創造力。大多數prompt 將抽象化為控件,但創造性的願景、精確度、品味和技能將更重要。
• 媒體商業模式演進: 從企業媒體到使用者生成媒體,再到機器生成媒體。未來消費媒體商業模式將圍繞Agent 生成媒體建立(創新場景包括聊天機器人如Character.ai、介面生成如WebSim、用戶生產貨幣如Pump.fun等等)
• 智慧財產權挑戰: 機器學習使程式能夠「學習」人類創造者的美感風格,創作生產與美學模仿成本降為零,智慧財產權的價值和意義需重新檢視。
4️⃣ 加密貨幣能夠發揮的角色包括:
• 鏈上市場與Agent 生成媒體產生交會(如最近的DeFAI);
• 作為智慧財產權激勵層;
• 媒體貨幣化與存取控制,例如Minting 成為新的商業模式;NFT可以做個人程式和使用者生成軟體的基礎設施;
• 作為人機社交之間的經濟協調層,探索社區運作和Agent 互動的新典範。
總而言之,這是一篇閱讀起來可能比較困難但值得思考的文章,AI 使人類的創造力將更多地體現在系統和過程的設計上,加密貨幣則為這一變革提供了新的經濟和社會協調機制。在下一個媒體時代,兩者結合能夠創造什麼樣的新機會新趨勢,讓我們拭目以待。
►正文
▎「所有媒體都是人類某種能力的延伸—心理或生理。」~馬歇爾‧麥克魯漢
在2024年的大部分時間裡,我花了相當多的時間試圖理解我們現在稱之為「生成式人工智慧」的事物及其對我個人和整個社會的影響。我深深被人工智慧作為創作工具的可能性所吸引,並在工作流程中大量使用這些新產品,尤其是在創意寫作和音樂創作方面。
然而,作為一名關註消費媒體和麵向用戶應用程式的加密投資者,人工智慧對我來說越來越像是一個盲點。當我們談論網路時代最成功的消費媒體企業時,我們並不會從科技孤島的角度來討論它們,因為它們不是這樣建構的,就像Facebook的成功離不開科技創新,但我們不會把Facebook純粹地視為一個“行動應用”或“人工智慧應用”,相反,我們認識到,正是許多不同創新的匯聚使得像Facebook這樣的應用成為可能。
在這種背景下,本文旨在整合和完善我在過去一年中探索人工智慧的個人發現和見解。我分享這些內容,希望能引起共鳴或對他人有所幫助(尤其是我的加密愛好者同仁)。
Part.1、又一個“Napster時刻”
如今,圍繞人工智慧生成媒體的討論主要集中在: (1)模型訓練和資料抓取的倫理問題,(2)「人工智慧藝術」是否是真正的藝術,以及(3)深度偽造的反烏托邦前景。這些討論都非常有趣且值得一聽,然而,我認為它們在某些重要方面都是只見樹木不見森林。
我發現,理解生成式人工智慧興起,最有用框架是將其視為智慧財產權正在經歷另一個「Napster時刻」 (Napster 是第一個被廣泛應用的點對點音樂共享服務,它極大幅度地影響了人們,特別是對於大學生使用網路的方式),但這次是生產時刻,而非分發時刻。
網路的興起以及隨後媒體分發成本降至零的過程是一個「從無到有」的時刻。這一轉變的突然性在紀錄片《音樂如何獲得自由》中得到了精彩的體現,該片講述了一名CD工廠工人和一群青少年黑客如何在一夜之間將整個音樂產業推向崩潰的故事。
在Napster的出現以及更廣泛的數位檔案共享興起之前,整個企業媒體、工業綜合體(以及藝術家的生計)都依賴媒體分發昂貴、高摩擦且集中的技術現實。在推出後的短短幾年內,大型唱片公司從創紀錄的銷售量轉變為乞求聯邦政府透過法律幹預來拯救他們。該行業面臨一個極其艱難的現實:支撐其業務的經濟體系已經發生了根本性且不可逆轉的變化,購買音樂的時代已經結束。
今天,我認為生成式人工智慧為我們帶來了一個更難以接受的現實,創造生產成本降至零的影響在許多方面更難以應對,因為它直接觸及了許多人認為使我們成為人類的核心:我們的創造力。這種存在性的恐懼並不能改變以下事實:媒體生成(特別是「風格遷移」或美學模仿)都是免費的,包括現在我們關心的所有媒體類型(文字、圖像、視訊、音訊、軟體)— —這是另一個「從無到有」的時刻。
然而,今天與2000年代初最重要的區別在於,在Napster與媒體公司之間的鬥爭中,政府站在了公司一邊,最終將文件共享定為「盜版」行為。 (這就是為什麼我們經常將企業媒體/智慧財產權稱為「法定媒體」)。這一決定,以及史蒂夫·喬布斯推出iPod以推廣後來成為iTunes的產品,最終發展為“串流媒體”,使得該行業免於徹底崩潰。不幸的是,我認為那些指望政府會在此介入並採取行動的創作者,充其量只是在自我安慰,最糟糕的是在自欺欺人。
我認為我們可能會發現,智慧財產權制度主要是為了保護公司及其法定媒體,沒有人會來拯救我們。傳統媒體公司上次已經吸取了慘痛的教訓,因此他們主動與人工智慧公司進行了授權交易,並且在一定程度上得到了補償。新媒體公司也正在利用其平台上共享的用戶生成內容模型來訓練,即使他們聲稱沒有這麼做。然而,獨立創意人士在很大程度上被拋在後面。
Part.2、計算:我們這個時代的媒介
很容易理解為什麼許多創作者認為生成式人工智慧削弱了他們的能力,我認為這種擔憂在很大程度上是合理的。然而,我也認為有一個機會可以思考,計算正在以一種新的方式發展,這不僅要求我們將其視為一種交流媒介,還呼籲我們將其視為創作媒介。
對於那些創造過電玩遊戲或生成藝術的人來說,「計算作為創作媒介」這個概念並不新鮮。然而在今天,許多人仍未真正意識到這一點。軟體是第一個數位原生的媒體類別,大多數人主要從「服務」、「實用性」和「優化」的視角來理解它,而不一定從創作表達的角度來理解。現在,生成式人工智慧正以一種非常直接的方式推動這一觀點,它將幾乎所有其他媒介的生產成本降到了零。這似乎引發了一個存在性問題:“那麼,人類的創造力在哪裡?手工技藝的價值又在哪裡?”
我的答案可能並不令人意外:「它體現在可編程的層面上。」 在進一步探討我的意思之前,我們需要先了解幾個重要的技術概念。
▎ 2.1 神經網路101(適合初學者)
訓練(Training)是一個過程,實質上是透過提供大量完成某項任務的範例來「教導」模型如何完成該任務,然後讓它找到模式、根據新的輸入進行預測,並在出錯時自我糾正。從概念上講,這類似於我們學習繪畫的方法:先透過模仿形狀開始,直到我們能夠創作原創作品,同時利用同伴和老師的回饋不斷改進我們的技能。當然,有一個關鍵區別:例如,文本生成模型並不像你我那樣學會寫作,而是學會以極高的精確度模擬寫作。這也是為什麼我越來越認同「模擬器」(simulators)而不是「智能體」(agents)是更適合神經網路的心理模型的眾多原因之一。
潛在空間(Latent Space) ,或者我更喜歡稱之為“高維可能性空間”,是神經網路中的一個表示空間,訓練過程中學習到的內容以壓縮形式呈現在這裡。打個比方,這類似於模型在學習理解訓練資料中各種可偵測特徵之間複雜關係時所建構的「內部世界模型」。理解潛在空間的概念是理解神經網路作為創作工具和媒介的關鍵。
嵌入(Embeddings):嵌入可以看作是將輸入映射到潛在空間中特定點的過程。這是將提示(Prompt)本質上被翻譯成了模型「思維語言」的過程。透過這種方式,我們可以將「提示」理解為探索和導航模型潛在空間的一種方式——這意味著,熟練提示是對模型潛在空間形狀形成直覺,從而能夠引導模型產生特定的、預期的輸出。
玩神經網路的樂趣之一在於,它們的深層內部運作對我們來說仍然是一個謎。然而,我認為這些基本概念能夠為將神經網路視為創作工具提供必要的背景。
Part.3、神經網路:一種新的創新典範
電腦媒體的一個核心要點是,它要求我們從專注於最終輸出(歌曲、圖像、影片、文字)轉向更專注於系統和流程。具體到神經網路的案例中,這意味著我們需要將其視為可程式化的媒體生成引擎,而不是單純地將其視為某一特定媒體的生成工具。透過這個視角,我發現了上述「人類創造力和工藝的價值在哪裡」的問題的答案:它存在於訓練過程和模型架構的設計中——這就是我所說的「在程式層面」 。
xhairymutantx是Holly Herndon和Mat Dryhurt合作創作的作品-這個模型嚴格地基於Holly的照片進行訓練,無論輸入什麼提示,都會產生受她相貌啟發的照片。
如果你將神經網路視為一種嘗試,即實現基於軟體的人類認知功能抽象化,那麼顯而易見,訓練和設計模型就相當於教它如何思考。
你可以想像向所有朋友發出一個指令(「提示」):「回憶一個童年的記憶。」每個人的回答顯然會不同,因為他們產生的內容將取決於他們的個人背景和想像力(即「訓練數據”)。在多次提示之後,你也可能發現一些朋友始終能夠產生更美麗或更有創意的回答,也許甚至表現出某種特定的個人風格。那麼,假如你可以用世上所有曾經存在的人類大腦來進行這項練習呢?如果你可以挑選出特別獨特的人類大腦,例如畢卡索或肯伊威斯特呢?
這本質上是神經網路為我們提供的創造性超級能力——利用其他想法作為創作工具的能力。在這裡,我認為真正引人注目的並不是某個模型的具體輸出,而是有機會創造性地編程出一個“軟體大腦” ,它可以產生獨特的思想和獨特的作品。
Arcade.ai是一個「從提示到產品」的市場,允許使用者設計自己的珠寶產品。他們專門調整了一個模型,用於生成高保真度的珠寶圖像,並且這些圖像僅使用最終用戶可用於製造的材料。
進一步探討「系統比輸出更重要」的觀點,與神經網路互動的另一個顯著特徵是,參與一個提示與回應的持續回饋循環——這種體驗我聽到一些人將其比作閱讀和寫作的反饋循環。我個人注意到,我很少在向模型發出一個提示、收到一個輸出後就結束互動。幾乎每次與模型的互動都會將我帶入這個互動式的回饋循環中,讓我不斷地迭代、反思和探索。這一點看似微妙,但卻是理解神經網路生成媒體類型的關鍵:
▎ 3.1 基於代理的媒體
我在之前的一篇文章中簡要提到這個概念,核心想法非常簡單——在這裡,模型模擬了某種人類伴侶的角色,透過文字對話與我們互動,同時它也可以理解並以其他形式的媒體作出回應。我們在這裡也能看到一些模型能夠代表其他人或它自己採取行動(例如執行金融交易)。典型案例包括聊天機器人、AI伴侶、遊戲中的NPC(非玩家角色)或任何其他擬人化的使用者體驗。例如,Andy Ayrey 的創意實驗「無限房間」(Infinite Backrooms),就是透過設定多個Claude 實例進行無人工幹預的交流,就是一個特別有趣的案例。
▎3.2 即時遊戲引擎
在這裡,模型模擬的是一個遊戲引擎(或更具體地說,是一個遊戲狀態轉換函數),透過接收遊戲中的使用者動作作為提示,產生遊戲中的下一幀回應輸出。如果速度夠快,這種體驗應該類似於在一個虛擬世界中導航,而這個世界會根據你的行動即時渲染。這是沉浸式和互動式媒體的極致表現。
DOOM遊戲幀由GameNGen生成,GameNGen 是一個完全由神經模型驅動的遊戲引擎,正如Google《擴散模型是即時遊戲引擎》論文中所述。
▎ 3.3 多元宇宙生成器
在這一幕下,模型扮演著創意「神諭」的角色,透過產生無限的變化版本幫助我們擴展原始想法,每個版本都可以進一步探索和操控。這使我們能夠從任何想法或概念出發,探索其周圍的可能性空間。例如,AI Dungeon(一個基於文字的「選擇你自己的冒險」遊戲)就是這方面的絕佳案例。
Loom的使用者介面視圖,Loom是一個基於樹形結構的寫作介面,適用於像Chat GPT這樣的語言模型,由@repligate提供。
▎3.4 潛在空間作為創作工具
我越來越相信, 「探索可能性空間」這個理念是理解神經網路作為創作工具和媒介的核心。在我使用諸如Midjourney、Suno、Websim、Claude 等工具的過程中,我注意到自己的大部分作業流程可以歸結為以下模式:
提示(Prompt)→ 產生特定輸出的變體→ 使用變體作為新輸出的提示→ 再生成特定變體→ 如此循環往復…
例如,在使用AI 驅動的音樂生成工具Suno 時,我通常會向模型提供一個60 秒的個人演唱範例和一些書面歌詞作為提示。接著,我會使用Cover 功能產生一個輸出,然後再產生該輸出的10 多個變體,並將我喜歡的部分從這些變體中挑選出來,作為進一步提示的輸入。
本質上,我是在探索模型潛在空間中圍繞我個人示例的可能性空間——發現基於我原創作品的變體,這些變體可能是我無法自己想出的,或者無法在合理的時間內完成的。我認為這種方式解鎖了一種前所未有的快速原型設計和創作測試流程,並將催生“100倍創作者”,類似於軟體領域所討論的“AI助力的100倍工程師”。
我清楚地認識到,潛在空間是一個創作工具。利用人工智慧進行創意生產,不僅在於訓練功能強大的模型,還在於設計出能夠賦能使用者以更高精度和細粒度探索並操控這些廣闊潛在可能性空間的介面。
Part.4、消費者行為與文化影響
關於這項技術如何改變消費者行為以及它創造了哪些新的商業機會,我有以下三個預測:
▎4.1 將成為創作工具
提示(Prompting)——無論是基於文字、圖像或其他形式——這種互動方式正逐漸嵌入越來越多的介面和體驗中,將終端使用者的創造力引入過去從未涉足的領域。 Scott Belsky 指出「GenAI 早期'基於prompt'生成文到圖像的時代削弱了創造力,而「controls」時代以難以想像的方式釋放了人類的創造力。工具不斷發展,但創造性的願景、精確度、品味和技能將比以往任何時候都更加重要。但更重要的是,我認為這股趨勢從根本上改變了我們對介面設計的思考方式。
▎4.2 企業媒體→ 使用者生成媒體→ 機器生成媒體
媒體商業模式的上一次重大轉變是從企業產生媒體轉向完全由使用者產生媒體。如今看來,下一個主要的消費媒體商業模式將圍繞著機器生成媒體的普及而建立。然而,仍然不清楚「贏家」會是什麼樣子。會是像Midjourney 這樣的通用模型?更專門的創作工具?還是基於這些科技之上的社交體驗?抑或是某種較不顯眼的第三種選擇?
無論如何,如果你是當下消費媒體領域的創辦人或獨立創作者,你可能需要製定策略,思考如何利用這些工具為你的業務增強價值並推動成長。
此外,我認為另一個值得關注的領域是:如何讓AI 驅動的體驗更具社交性和多用戶協作性。以我個人的體驗為例,如今的大多數AI 應用都顯得非常“反社交”,因為你主要是在與模型互動,而不是與其他人互動。在這一領域可能存在許多機會和設計空間,例如建立以人為中心的協同創作體驗,或創造新的方式讓人類與機器人實現更有意義的社交互動。
▎4.3 對智慧財產權的影響
不僅是創作生產的成本正在降至零,尤其是美學模仿的成本也在降為零。我可以拍下一個人穿搭的照片,將其輸入Midjourney 作為提示,用於設計一張風格相同的沙發。我還可以對該人的聲音、寫作風格等進行類似的風格遷移。在這種新典範下,智慧財產權的價值和意義是什麼?
我尚未找到答案,但顯然,大多數以往的假設和思考模型已經不再適用。
Part.5、加密貨幣的角色與總結
如果你讀到了這裡——感謝你的耐心!
我將在未來的文章中深入探討這些內容對加密貨幣的影響,但現在可以預覽我接下來將關注的幾個方向:
-
加密公司圍繞新媒體進行建設的機會
探索鏈上市場與機器生成媒體交會點的潛力。
-
加密作為智慧財產權的激勵層
超越歸因與溯源,思考圍繞媒體建構激勵機制與網絡。
-
加密作為媒體的貨幣化與存取控制層
尤其是在用戶生成的軟體領域,重新思考網頁架構;將「鑄造」(Minting)作為小型模型的商業模式;將NFT 作為個人程式和用戶生成軟體的基礎設施。
-
加密作為人與機器之間的社交與經濟協調層
支持人類與AI 在識別、資助和解決各種問題上的協作;探索社區擁有和運作的模式。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
關於 Bitget 上架 MSTR, COIN, HOOD, DFDV RWA 指數永續合約的公告
關於 Bitget 統一帳戶支援部分幣種借貸和保證金功能的公告
【首發上架】Camp Network (CAMP) 將在 Bitget 創新區和 Public Chain 區上架
關於 Bitget 上架 AAPL, GOOGL, AMZN, META, MCD RWA 指數永續合約的公告
加密貨幣價格
更多








