要點:
OpenAI宣布將發布其備受期待的AI視頻生成工具Sora,標志着生成式人工智能的下一個重要發展領域,具有廣泛的行業應用潛力。
科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。
狂呼科技研究所聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。
狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。
聯系我們 // 相關文章
OpenAI今天表示,它將在當天晚些時候發布其熱門的人工智能AI視頻生成工具“Sora”。OpenAI 備受期待的AI文字到影片產生器Sora將於今天向所有人開放。
隨着聊天機器人和圖像生成器逐漸進入消費市場和商業應用,視頻生成有望成為生成式人工智能的下一個關鍵發展領域。這一技朮的潛力巨大,視頻生成的普及將顯著提升創作者與品牌之間的互動,進一步加速數字化轉型的進程。
從文字到視頻的技朮創新
AI視頻生成工具“Sora”的工作原理與OpenAI的圖像生成工具DALL-E相似:用戶輸入所需場景,Sora便能生成高清的視頻片段。此外,Sora還可以基於靜止影像創建影片剪輯,擴展現有影片或填補缺失畫面。
影片中展示了Sora如何將文字提示轉化為視頻,用戶可以通過其他文字提示自定義生成的內容,作為其“混音”功能的一部分。此外,Sora還支持將照片轉化為視頻,并通過故事板功能將多個文本提示串聯起來,力圖將這些提示融入到一個連貫的場景中。
但與此同時,Sora目前在生成逼真的物理效果方面仍存在挑戰,經常會顯示物體消失或相互穿透的現象。此外,Sora常常拒絕處理包含公眾人物或受版權保護角色的提示。
Reddit用戶在10月向OpenAI高層詢問Sora的發布日期,質疑其延遲是否是由於推理所需的計算量/時間或安全原因。作為回應,OpenAI的產品負責人表示,“需要完善模型,需要確保安全/模擬/其他事情正確,並且需要擴展計算!”
根據OpenAI的YouTube直播顯示,該工具將於今天晚些時候首次向美國用戶及大多數國際市場推出。但是,該公司尚未公布在歐洲、英國和其他一些國家推出的具體時間表。目前,Sora僅供少數安全測試人員使用,他們的任務是測試模型在錯誤信息、偏見等方面的漏洞。
近日,OpenAI的Sora產品負責人在直播中表示,“作為OpenAI,我們顯然有一個很大的目標,因此我們希望阻止Sora的合法活動,但我們也希望透過創意表達來平衡這一點。”此外,OpenAI表示,用戶無需額外付費,該工具將包括在現有的ChatGPT帳戶中,如Plus和Pro等訂閱服務。在直播中,OpenAI的員工和執行長Sam Altman展示了例如“混合”功能(即根據用戶指示將兩個場景融合)以及讓AI生成的影片無限循環播放的選項。
早在今年2月,OpenAI公司首次發布了全新的視頻生成AI大模型Sora。這一模型能夠通過文本描述快速制作出長達60秒的視頻,視頻中不僅可以呈現多個角色、特定動作,還能展示復雜的場景。
當時,OpenAI發布了多段由其製作的高清視頻片段,包括一輛SUV行駛在山路上、蠟燭旁的“短毛怪”動畫、兩個人們在雪地裡走過東京,以及加州淘金熱的假歷史鏡頭,並表示它能夠產生長達一分鐘的影片。從文字生成到視頻生成,Sora的這一發布無疑引發了AI領域的震動。
自ChatGPT問世以來,各大軟件廠商紛紛加碼,展開了激烈的競爭
百度率先推出了“文心一言”,阿里推出了“通義千問”等,業內各大巨頭都在爭奪這一重要的風口。此外,就在市場局勢漸趨平靜時,谷歌/Google發布了重磅產品“Gemini 1.5”,并將上下文窗口長度擴展至100萬個tokens,使得Gemini 1.5具備了處理超過三萬行代碼的能力。然而,谷歌的這一舉動也促使OpenAI發布了其“王炸”級產品Sora。
從目前Sora展現的能力來看,它顯然已經超越了谷歌的“Gemini 1.5”。然而,也有質疑的聲音,圖靈獎得主表示,像Sora這樣僅憑文字提示生成逼真視頻,并不意味着模型理解了物理世界。生成視頻的過程與基於世界模型的因果預測截然不同。隨后,Meta推出了一個全新的無監督“視頻預測模型”V-JEPA,聲稱能“以人類的視角來理解世界”。
不可否認的是,Sora的推出不僅標志着生成式AI從語言模型向視頻模型邁出了重要一步,更加深了“世界模型”這一概念的關注。未來,AI模型的發展方向將更側重於更真實地理解和模擬現實世界。
“世界模擬”成為了AI發展的新方向,這也推動了人工通用智能/AGI時代的到來。隨着AI擁有模擬和感知世界的能力,并結合攝像頭和傳感器,AI將朝着具備自主感知、理解現實世界的能力,能夠處理語言、圖像、視頻的人工通用智能方向不斷前進。
視頻生成的新紀元
如今,Sora的推出將生成式AI帶入了視頻生成的新紀元,並將對整個AI市場格局產生重大、深遠的影響。
目前,在短視頻平台上,諸如AI配音有聲小說、AI為小說配漫畫等形式的視頻已獲得極高的關注度。隨着視頻生成大模型技朮的不斷進步,未來或許一部小說可以由AI自動轉化為電視劇或電影。對於觀眾而言,生成式視頻大模型可能成為最懂你的“導演”,為你量身定制最合適的劇情和演員。
對於短視頻創作者來說,視頻生成大模型能夠顯著降低拍攝成本。創作者只需提供簡單的文字描述,便能生成理想的場景、演員和劇情素材,極大地簡化視頻制作過程。由於AI視頻生成的高效性,許多時效性要求強的短視頻領域將成為AI的主戰場。
而對於視頻后期制作人員,尤其是特效設計師,視頻生成大模型的加入同樣提升了生產力。通過向AI提供簡單的描述,制作復雜的特效畫面、場景替換等變得更加便捷,甚至可以創造現實中從未出現過的特效。
但與此同時,正是因為AI的強大功能,許多人對行業和職業前景產生了擔憂
奇虎360公司董事長周鴻禕曾表示,基於大模型技朮,結合人類知識的引導,可以創造出許多超級工具,推動包括生物醫學、基因研究、物理、化學和數學等領域的進步。甚至,AI的算力可以幫助我們推演尚未被人類掌握的自然規律。
盡管從技朮發布到廣泛應用仍有一段距離,未來是否真如周鴻禕所設想的那樣,憑借大模型技朮引發一場“技朮爆炸”尚未可知。
就像當年的工業革命時期,珍妮紡紗機的出現讓許多人面臨失業,但并不意味着人類會進入一個由AI主導的“無用”時代。AI依舊需要人類的支配和維護,也需要人類在學習和應用方面的輔助。盡管有一些悲觀的聲音,認為AI會取代人類,但現實可能更為復雜和多樣。
面對這場科技革命,我們必須轉變心態,擁抱新時代的到來。當AI能夠創造出一個足夠真實的虛擬世界時,也許曾經在科幻電影中展現的“黑客帝國”或“頭號玩家”中的世界,真的會在不久的將來成為現實。隨着“世界模型”技朮的持續進步,曾經趨冷的元宇宙概念或許會再次成為風口。
今年2月,蘋果公司發布的虛擬現實設備Vision Pro正式上市,雖然第一代產品并不完美,但其在可用性和操控性方面已經超越了許多同類產品,展現出虛擬現實設備成為未來移動設備的巨大潛力。
Sora與Vision Pro或許正是叩開“元宇宙”大門的兩把鑰匙。無論是Meta之前推出的頭戴設備,還是蘋果當前的設備,都無法真正做到虛擬與現實的融合,也就是說,現實中的人無法完全沉浸於虛擬世界中。然而,如果Sora能夠搆建出一個與物理世界几乎無差別的虛擬世界,打造出一個宏大的元宇宙,那時才有可能迎來元宇宙的真正爆發。這一進程將促使各大企業通過技朮創新建立起更為堅固的護城河,搶占虛擬世界的制高點,推動數字化轉型的步伐,同時創造出更多商業機會和社會變革。
布局AI生成式視頻新風口
OpenAI於今年10月完成了最新一輪融資,估值達到1570億美元,其中包括從多家投資公司和大型科技公司籌集的66億美元。此外,OpenAI還獲得了40億美元的循環信貸額度,使其流動資金總額超過100億美元。
這一切都體現了OpenAI在發展戰略上的決心。作為微軟支持的人工智能初創公司,OpenAI與亞馬遜/Amazon等公司展開競爭,目標是占領生成人工智能市場的最大份額。預計這一市場將在未來十年突破1萬億美元的收入規模。
近期,OpenAI也加強了營銷投入,聘請了首位首席營銷官,計划通過擴大用戶群來提升品牌影響力。10月,OpenAI在ChatGPT中加入了搜索功能,旨在與谷歌、微軟的Bing和Perplexity等搜索引擎競爭,并吸引更多進行網絡搜索的用戶。
此外,OpenAI的ChatGPT制造商希望通過Sora與Meta和谷歌等公司推出的視頻生成AI工具展開競爭。其他新興公司也提供類似的人工智能工具,例如Stability AI的Stable Video Diffusion,亞馬遜則推出了專為兒童設計的短片動畫創作模型Create with Alexa。
隨着聊天機器人和圖像生成器進入消費市場和商業應用,視頻生成可能成為生成式人工智能的下一個重要前沿領域
這一領域的潛力無疑是巨大的,不僅能在娛樂、廣告、教育和醫療等行業創造前所未有的機遇,還將催生出更多創新應用,徹底改變我們創建、消費和互動內容的方式。從個性化廣告到虛擬直播,視頻生成的普及將極大地提升創作者和品牌之間的互動,進一步推動數字化轉型的浪潮。
作為投資者,我們應該緊跟技朮發展的步伐,關注視頻生成技朮的初創企業和領先公司,尤其是在那些能提供創新性解決方案和強大技朮平台的企業。與傳統視頻制作相比,生成式視頻的成本和時間消耗將大幅度下降,這意味着更多小型公司和個人創作者將能夠利用這些工具,降低內容創作的門檻,從而開啟一個更加多元和充滿創意的市場。而與此同時,擁有領先技朮的企業將能夠獲得更大的市場份額,成為下一波科技浪潮的主導者。
此外,投資者還應密切關注視頻生成技朮背后的倫理和合規問題,特別是在虛假信息和深度偽造視頻的風險日益增加的背景下。盡管這一技朮為創意領域帶來了激動人心的機遇,但在全球重大政治選舉的背景下,AI生成的虛假信息問題引發了廣泛的擔憂。根據機器學習公司Clarity的數據顯示,人工智能生成的深度偽造內容數量每年增長了900%。OpenAI將多模態(結合文字、圖像和視頻生成)作為其提供更廣泛人工智能模型的一項重要目標。
隨着生成式視頻技朮的普及,我們需要看到更多企業和平台加強對內容真實性的監管和防護措施。這不僅關乎技朮的發展,也直接影響到投資者的回報和風險管理。隨着技朮的快速進步,投資者需要保持敏銳的洞察力,抓住具有潛力的創新公司,同時也要關注技朮帶來的社會責任和市場變革,以確保在未來的競爭中占據有利位置。
在如此動蕩的金融市場中,你會選擇怎樣投資?
一起深入了解資深投資者的交易策略。在投入股市之前,多認識金融市場,才可提高投資回報率。關注狂呼"思錢想後"欄目,緊密跟蹤股市走勢,尋找更多投資機會。
點擊此處了解更多
投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。
狂呼金融研究所聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。
狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。
聯系我們 // 相關文章