(作者:王德承)
SORA的視頻生成神話 與Sam Altman的AI投資佈局
OpenAI所投資的冠絕全球應用之一SORA,初出道即成王者。其對電影業界乃至科技界的震撼,一時無倆。而AI發展的速度依然令人目不暇給。國內在不同算法、AI應用場景及AI與機器人聯合開發等等範疇,每個月也有不同的長足發展。
Sora一度流傳能夠生成整個視頻,一次性可長達一分鐘,在技術上是一個巨大的進步,尤其是Sora在保持視頻中主體一致性方面的能力遠超過同類型應用。而在網上所放出的精挑細選的影片中,Sora更讓人印象深刻,但同時大家也或多或少都知道這是有所賣弄的賣家秀。
外部一些製作團隊在過去幾周獲得了Sora的有限訪問權限,其中包括一隊名字為Shy Kids團隊,他們製作了Sora短片《Air Head》。該短片讓我們看到了Sora當前的實際工作狀態和痛點,從外界使用者的視角審視Sora的真正實力。
Sora生成的原始素材與最終影片中使用素材的比例是300:1。這意味著為了得到最終影片中的1秒鐘內容,使用者可能需要生成並審視300秒的原始素材。
每次視頻渲染需要10至20分鐘,可以生成3至20秒的視頻。也就是說要製作60秒的視頻,大概需要6,000分鐘的時間生成素材。也就是12天。
而Sora現版本尚未支持多模態輸入,很難保持多鏡頭一致性。因此仍需要大量的後期處理,包括分級、穩定化、上採樣以及移除不需要的元素。比較適合Sora視頻的編輯方式是採取了類似紀錄片的方法,從大量素材中編織故事,而不是嚴格按照劇本拍攝。
Sora仍需要製作團隊有對電影鏡頭較為嚴謹的控制能力,如跟蹤、平移、傾斜、推入等。最初的Sora中並未支持,Open AI的研究人員並未思考過這個問題,他們很意外地發現,創作者需要控制鏡頭來講故事。因此說Sora能完全取代電影的創作及拍攝團隊,為時尚早。而這段時間亦足夠讓國內的相關AI應用追趕上來。
宏觀來說,Sam Altman的投資佈局,涵蓋了演算法(Open AI)、算力、AI芯片、能源(核聚變研究)、以AI為核心的機器人等等。軟硬體及能源配套等等,全方位以實現AI改變現時世界的生態為配置。這些佈局,投資巨大,影響深遠,非一般個人或中小企能夠直接參與。對其影響,我們必須要有清醒的認識。因為AI的發展必然會解放生產力以及淘汰大量工種。但靜下心來觀察,中美在AI的競爭上仍然是你追我趕的格局。美國在AI的發展上未必已在遠超中國神壇上。