李鑒泉(Lierence)是公關及市場行銷公司Market Hubs董事總經理,擁有16年專業經驗,率先引入AI、Web3.0及元宇宙科技協助客戶解決問題。
《從驚艷到常態: AI生成影片新紀元》
當OpenAI在2024年2月首次展示SORA時,這個能夠生成逼真影片的AI模型立即引發全球轟動。那些栩栩如生的日本場景、流暢的運鏡,以及近乎完美的細節處理,不僅震驚了科技界,更讓整個創意產業為之震撼。然而,短短數月之後,當SORA終於開放測試時,人們的反應卻變得相對平淡。這種戲劇性的轉變,不僅反映了AI技術發展的驚人速度,更說明了市場對AI技術期待的轉變。
驚艷時刻:SORA的初次亮相
OpenAI發布的首批SORA示範影片展現了前所未有的生成質量。無論是航拍視角的城市景觀、細膩的人物動作,還是複雜的場景轉換,都達到了接近專業製作的水準。特別是在處理物理效果、光影變化,以及連續動作的流暢度方面,SORA展現出明顯優於當時市面上所有AI影片生成工具的能力。
這些演示影片在社交媒體上迅速傳播,引發了廣泛討論。創意工作者、電影製作人,甚至遊戲開發者都看到了顛覆性的可能。市場預期SORA將徹底改變影片製作的流程,大幅降低製作成本,並為創意表達開闢新的可能性。
AI影片生成的新標竿
然而,就在產業界引頸期盼SORA正式發布之際,Google推出的Veo 2不只帶來技術突破,更重新定義了AI影片生成的品質標準。在與頂尖模型的對比測試中,Veo 2展現出令人驚艷的性能:影片最高可達4K解析度,時長可達2分鐘,遠超過SORA 20美元版本的5秒720p和200美元版本的20秒1080p規格。
在Meta的MovieGenBench基準測試中,通過1003個提示詞的人工評估,Veo 2在整體表現和提示詞遵循度上都獲得最佳評價。特別值得注意的是,這次測試中除了OpenAI的SORA外,還包括了Meta的Movie Gen和國產的可靈、海螺等模型,而SORA竟然成為表現相對最差的主流影片生成模型。
技術創新與突破
Veo 2的核心優勢體現在幾個方面:
1.高質量的影片控制:能夠準確遵循簡單和複雜的指令,真實模擬物理世界
2.增強的真實感:在細節處理和偽影減少方面有明顯提升
3.先進的運動表現:對物理規律的理解使其能準確呈現各種動作
4.電影級鏡頭控制:能理解並執行各種拍攝風格、角度和運鏡指令
以一個切蕃茄的測試為例,Veo 2生成的影片中,不論是刀具的反光、切片的力度,還是整體的視覺效果都達到了接近真實的程度。這種細節的完美呈現,反映了AI影片生成技術已經進入一個新的階段。
寫實與創意的平衡
Google展示的多個測試案例中,無論是運動場景、實驗室特寫,還是田園風光,Veo 2都展現出極強的場景適應能力。特別是在處理複雜的運動鏡頭時,如打網球、投籃等大幅度運動場景,模型都能保持穩定的表現,被業界譽為年度尺度最大、效果最佳的影片模型。
然而,目前Google Labs平台上開放的是Veo 2的簡化版本,限制在720p解析度和8秒時長。DeepMind產品副總裁Eli Collins表示,他們將在接下來的幾個月中,根據用戶反饋持續迭代,逐步開放Veo 2的完整功能,並計劃將其整合到Google的生態系統中。
AI影片生成的未來展望
隨著AI影片生成技術的不斷進步,我們可以預見幾個重要的發展趨勢:
1.技術門檻的降低:更多企業和個人創作者將能夠使用這些工具
2.應用場景的擴展:從商業廣告到個人創作,AI影片生成將滲透到更多領域
3.創作方式的革新:AI將成為創意表達的新媒介,而非單純的工具
4.品質標準的提升:競爭將推動各家公司不斷提升生成內容的質量
SORA的發展歷程映射了AI技術從新奇到實用的轉變過程。隨著Google Veo 2等新技術的出現,AI影片生成領域的競爭格局已經發生了根本性的改變。這不僅體現在技術能力的提升上,更反映在使用者期待的轉變:從單純追求驚艷效果,到關注實際應用價值。
OpenAI由業界領先演變成一家Sam Altman的營銷公司,由未成熟的SORA到應用落後於Anthropic,人才持續流失,不免令人唏噓。2025年我們可以預期有更多模型落地,如果我們不走快一點,隨時像OpenAI被追趕過。祝大家2025年快樂。