人工智慧公司OpenAI在2022年11月30日推出聊天機器人ChatGPT,正式揭開全球的AI軍備競賽。就在眾多公司瘋狂追趕之際,才時隔1年3個月,今年2月15日OpenAI又以影片生成AI模型「Sora」再度讓全球驚呆!

只要輸入一連串文字,Sora就可以快速生成最長1分鐘的影片,而且真實到令人懷疑現實,讓AI應用從文字、圖像,一舉升級到影片。

■AI神級進化

一名時髦女子自信漫步在東京街頭、一對牽著手的情侶在飄落的雪花中走過日本風格的街道、多隻長毛象在雪地中迎面衝來,OpenAI藉由一連串示範影片,讓外界見證到Sora文字生成影片的超強功力。OpenAI執行長奧特曼(Sam Altman)也在社群網站X(前身為推特)上廣邀網友前來切磋,在網友給予文字提示後,再公布Sora據此生成的影片,「別擔心你要求得太細,或難度太高!」

其實Sora並非第一個文字生成影片的大模型。早在ChatGPT公開之前,臉書母公司Meta、Alphabet旗下谷歌、Runway AI等就已開發文字轉影音的生成器。據不完全統計,截至去年底,全球能實現文生影片的大模型已有超過20個產品。可是這些產品的能力顯然都不像Sora這樣「逆天」。以Runway為例,該平台僅能生成長達4秒的影片,用戶最多只能延長至16秒,這也是過去一年AI文字生成影片的極限。但Sora一登場,直接以1分鐘的總長度輾壓其他對手。

據《紐約時報》報導,Sora這個名字取自於日語「空(そら)」,即「天空」之意。OpenAI團隊透露,選擇這個名字是因為其讓人聯想到無限的創作潛力。

Sora為影片生成領域帶來革命性的進步,同時也衝擊多個行業。(圖/美聯社)
Sora為影片生成領域帶來革命性的進步,同時也衝擊多個行業。(圖/美聯社)

■內容創作者憂失業

Sora的出現,不但讓網友驚呼,「好萊塢即將崩潰」、「皮克斯慘了」,就連向來愛批評OpenAI的特斯拉執行長馬斯克都感嘆,「人類認賭服輸」。

儘管Sora的示範影片中仍有細節錯誤,像是女子漫步街頭的影片中,招牌上的日語絕大部分並不準確,街景中也有不符合常規的障礙物等,但已有不少YouTuber與內容創作者提前「認輸」,憂心自己即將失業。

許多人認為,受到Sora的影響,影視行業將首當其衝,影片拍攝者與剪輯人員恐顯得「多餘」,就連演員都可能消失。據新浪科技報導,AI行業專家指出,受到影響的行業,包括但不限於廣告、影視、遊戲、教育、新聞等領域。

可是在此同時,Sora帶來的革命性力量也不容低估。專家與部分內容創作者就表示,與其懷抱著「飯碗焦慮」,不如將其視為提升工作的「工具」,利用它來幫企業與個人提高效率,轉化創意、打造精品。

DCCI互聯網研究院院長劉興亮指出,這是一個與AI攜手共舞的機會,探索新的藝術形式與表達方式,續寫影視行業的輝煌。

Sora的逼真呈現讓專家與民眾都憂心會助長詐騙犯罪。(圖/路透社)
Sora的逼真呈現讓專家與民眾都憂心會助長詐騙犯罪。(圖/路透社)

■資安挑戰加劇

雖說「眼見為憑」,但在AI當道的年代 ,真實與人造之間的差異 ,恐令人難辨真假。不少業界人士就擔心,Sora將為深度偽造(Deepfake)技術推波助瀾,讓有心人用於詐騙犯罪。

OpenAI尚未宣布Sora對公眾正式開放的日期,目前這項工具只對少數創作者與評估Sora安全性的專家團隊開放。OpenAI執行長奧特曼表示,目前一批專家團隊正在研究Sora,找出它可能被濫用的風險。不過對於造假疑慮,OpenAI也坦承,即使經過了廣泛的研究與測試,「我們無法預測人們使用我們技術的所有有益方式以及濫用我們技術的所有方式」。

去年就有男網友利用AI技術,改造日本首相岸田文雄的原始影像,製作的假影片還壓上「日本電視台」(日テレ)新聞節目的標誌等,幾可亂真,並在網路上瘋傳,引發軒然大波。儘管該名網友事後已道歉並撤下影片,但這段影片仍持續被轉載。

隨著美國總統大選逼近,已有不少人憂心,AI生成的影像恐引發資訊錯亂。儘管OpenAI已表示,該公司正在為此作準備,包括禁止將其旗下工具用於政治造勢活動。但卡內基國際事務倫理委員會(Carnegie Council for Ethics in International Affairs)研究AI與監控技術的資深研究員Arthur Holland Michel警告,Sora這類工具一旦落入有心人手中,事情將會更棘手。

#OpenAI #ChatGPT #Sora #影片 #生成