王德承:SORA的視頻生成神話 與Sam Altman的AI投資佈局

分享

(作者:王德承)

SORA的視頻生成神話 與Sam Altman的AI投資佈局

OpenAI所投資的冠絕全球應用之一SORA,初出道即成王者。其對電影業界乃至科技界的震撼,一時無倆。而AI發展的速度依然令人目不暇給。國內在不同算法、AI應用場景及AI與機器人聯合開發等等範疇,每個月也有不同的長足發展。

Sora一度流傳能夠生成整個視頻,一次性可長達一分鐘,在技術上是一個巨大的進步,尤其是Sora在保持視頻中主體一致性方面的能力遠超過同類型應用。而在網上所放出的精挑細選的影片中,Sora更讓人印象深刻,但同時大家也或多或少都知道這是有所賣弄的賣家秀。

外部一些製作團隊在過去幾周獲得了Sora的有限訪問權限,其中包括一隊名字為Shy Kids團隊,他們製作了Sora短片《Air Head》。該短片讓我們看到了Sora當前的實際工作狀態和痛點,從外界使用者的視角審視Sora的真正實力。

Sora生成的原始素材與最終影片中使用素材的比例是300:1。這意味著為了得到最終影片中的1秒鐘內容,使用者可能需要生成並審視300秒的原始素材。

每次視頻渲染需要10至20分鐘,可以生成3至20秒的視頻。也就是說要製作60秒的視頻,大概需要6,000分鐘的時間生成素材。也就是12天。

而Sora現版本尚未支持多模態輸入,很難保持多鏡頭一致性。因此仍需要大量的後期處理,包括分級、穩定化、上採樣以及移除不需要的元素。比較適合Sora視頻的編輯方式是採取了類似紀錄片的方法,從大量素材中編織故事,而不是嚴格按照劇本拍攝。

Sora仍需要製作團隊有對電影鏡頭較為嚴謹的控制能力,如跟蹤、平移、傾斜、推入等。最初的Sora中並未支持,Open AI的研究人員並未思考過這個問題,他們很意外地發現,創作者需要控制鏡頭來講故事。因此說Sora能完全取代電影的創作及拍攝團隊,為時尚早。而這段時間亦足夠讓國內的相關AI應用追趕上來。

宏觀來說,Sam Altman的投資佈局,涵蓋了演算法(Open AI)、算力、AI芯片、能源(核聚變研究)、以AI為核心的機器人等等。軟硬體及能源配套等等,全方位以實現AI改變現時世界的生態為配置。這些佈局,投資巨大,影響深遠,非一般個人或中小企能夠直接參與。對其影響,我們必須要有清醒的認識。因為AI的發展必然會解放生產力以及淘汰大量工種。但靜下心來觀察,中美在AI的競爭上仍然是你追我趕的格局。美國在AI的發展上未必已在遠超中國神壇上。

分享