OpenAI發布AI視頻生成工具Sora,開啟生成式人工智能新篇章

OpenAI發布AI視頻生成工具Sora,開啟生成式人工智能新篇章

發布日期:

商業 Business 科技 Tech


要點:
OpenAI宣布將發布其備受期待的AI視頻生成工具Sora,標志着生成式人工智能的下一個重要發展領域,具有廣泛的行業應用潛力。

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技研究所聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 // 相關文章

OpenAI今天表示,它將在當天晚些時候發布其熱門的人工智能AI視頻生成工具“Sora”。OpenAI 備受期待的AI文字到影片產生器Sora將於今天向所有人開放。

隨着聊天機器人和圖像生成器逐漸進入消費市場和商業應用,視頻生成有望成為生成式人工智能的下一個關鍵發展領域。這一技朮的潛力巨大,視頻生成的普及將顯著提升創作者與品牌之間的互動,進一步加速數字化轉型的進程。

從文字到視頻的技朮創新
AI視頻生成工具“Sora”的工作原理與OpenAI的圖像生成工具DALL-E相似:用戶輸入所需場景,Sora便能生成高清的視頻片段。此外,Sora還可以基於靜止影像創建影片剪輯,擴展現有影片或填補缺失畫面。

影片中展示了Sora如何將文字提示轉化為視頻,用戶可以通過其他文字提示自定義生成的內容,作為其“混音”功能的一部分。此外,Sora還支持將照片轉化為視頻,并通過故事板功能將多個文本提示串聯起來,力圖將這些提示融入到一個連貫的場景中。

但與此同時,Sora目前在生成逼真的物理效果方面仍存在挑戰,經常會顯示物體消失或相互穿透的現象。此外,Sora常常拒絕處理包含公眾人物或受版權保護角色的提示。

Reddit用戶在10月向OpenAI高層詢問Sora的發布日期,質疑其延遲是否是由於推理所需的計算量/時間或安全原因。作為回應,OpenAI的產品負責人表示,“需要完善模型,需要確保安全/模擬/其他事情正確,並且需要擴展計算!”

根據OpenAI的YouTube直播顯示,該工具將於今天晚些時候首次向美國用戶及大多數國際市場推出。但是,該公司尚未公布在歐洲、英國和其他一些國家推出的具體時間表。目前,Sora僅供少數安全測試人員使用,他們的任務是測試模型在錯誤信息、偏見等方面的漏洞。

近日,OpenAI的Sora產品負責人在直播中表示,“作為OpenAI,我們顯然有一個很大的目標,因此我們希望阻止Sora的合法活動,但我們也希望透過創意表達來平衡這一點。”此外,OpenAI表示,用戶無需額外付費,該工具將包括在現有的ChatGPT帳戶中,如Plus和Pro等訂閱服務。在直播中,OpenAI的員工和執行長Sam Altman展示了例如“混合”功能(即根據用戶指示將兩個場景融合)以及讓AI生成的影片無限循環播放的選項。

早在今年2月,OpenAI公司首次發布了全新的視頻生成AI大模型Sora。這一模型能夠通過文本描述快速制作出長達60秒的視頻,視頻中不僅可以呈現多個角色、特定動作,還能展示復雜的場景。

當時,OpenAI發布了多段由其製作的高清視頻片段,包括一輛SUV行駛在山路上、蠟燭旁的“短毛怪”動畫、兩個人們在雪地裡走過東京,以及加州淘金熱的假歷史鏡頭,並表示它能夠產生長達一分鐘的影片。從文字生成到視頻生成,Sora的這一發布無疑引發了AI領域的震動。

自ChatGPT問世以來,各大軟件廠商紛紛加碼,展開了激烈的競爭
百度率先推出了“文心一言”,阿里推出了“通義千問”等,業內各大巨頭都在爭奪這一重要的風口。此外,就在市場局勢漸趨平靜時,谷歌/Google發布了重磅產品“Gemini 1.5”,并將上下文窗口長度擴展至100萬個tokens,使得Gemini 1.5具備了處理超過三萬行代碼的能力。然而,谷歌的這一舉動也促使OpenAI發布了其“王炸”級產品Sora。

從目前Sora展現的能力來看,它顯然已經超越了谷歌的“Gemini 1.5”。然而,也有質疑的聲音,圖靈獎得主表示,像Sora這樣僅憑文字提示生成逼真視頻,并不意味着模型理解了物理世界。生成視頻的過程與基於世界模型的因果預測截然不同。隨后,Meta推出了一個全新的無監督“視頻預測模型”V-JEPA,聲稱能“以人類的視角來理解世界”。

不可否認的是,Sora的推出不僅標志着生成式AI從語言模型向視頻模型邁出了重要一步,更加深了“世界模型”這一概念的關注。未來,AI模型的發展方向將更側重於更真實地理解和模擬現實世界。

“世界模擬”成為了AI發展的新方向,這也推動了人工通用智能/AGI時代的到來。隨着AI擁有模擬和感知世界的能力,并結合攝像頭和傳感器,AI將朝着具備自主感知、理解現實世界的能力,能夠處理語言、圖像、視頻的人工通用智能方向不斷前進。

視頻生成的新紀元
如今,Sora的推出將生成式AI帶入了視頻生成的新紀元,並將對整個AI市場格局產生重大、深遠的影響。

目前,在短視頻平台上,諸如AI配音有聲小說、AI為小說配漫畫等形式的視頻已獲得極高的關注度。隨着視頻生成大模型技朮的不斷進步,未來或許一部小說可以由AI自動轉化為電視劇或電影。對於觀眾而言,生成式視頻大模型可能成為最懂你的“導演”,為你量身定制最合適的劇情和演員。

對於短視頻創作者來說,視頻生成大模型能夠顯著降低拍攝成本。創作者只需提供簡單的文字描述,便能生成理想的場景、演員和劇情素材,極大地簡化視頻制作過程。由於AI視頻生成的高效性,許多時效性要求強的短視頻領域將成為AI的主戰場。

而對於視頻后期制作人員,尤其是特效設計師,視頻生成大模型的加入同樣提升了生產力。通過向AI提供簡單的描述,制作復雜的特效畫面、場景替換等變得更加便捷,甚至可以創造現實中從未出現過的特效。

但與此同時,正是因為AI的強大功能,許多人對行業和職業前景產生了擔憂
奇虎360公司董事長周鴻禕曾表示,基於大模型技朮,結合人類知識的引導,可以創造出許多超級工具,推動包括生物醫學、基因研究、物理、化學和數學等領域的進步。甚至,AI的算力可以幫助我們推演尚未被人類掌握的自然規律。

盡管從技朮發布到廣泛應用仍有一段距離,未來是否真如周鴻禕所設想的那樣,憑借大模型技朮引發一場“技朮爆炸”尚未可知。

就像當年的工業革命時期,珍妮紡紗機的出現讓許多人面臨失業,但并不意味着人類會進入一個由AI主導的“無用”時代。AI依舊需要人類的支配和維護,也需要人類在學習和應用方面的輔助。盡管有一些悲觀的聲音,認為AI會取代人類,但現實可能更為復雜和多樣。

面對這場科技革命,我們必須轉變心態,擁抱新時代的到來。當AI能夠創造出一個足夠真實的虛擬世界時,也許曾經在科幻電影中展現的“黑客帝國”或“頭號玩家”中的世界,真的會在不久的將來成為現實。隨着“世界模型”技朮的持續進步,曾經趨冷的元宇宙概念或許會再次成為風口。

今年2月,蘋果公司發布的虛擬現實設備Vision Pro正式上市,雖然第一代產品并不完美,但其在可用性和操控性方面已經超越了許多同類產品,展現出虛擬現實設備成為未來移動設備的巨大潛力。

Sora與Vision Pro或許正是叩開“元宇宙”大門的兩把鑰匙。無論是Meta之前推出的頭戴設備,還是蘋果當前的設備,都無法真正做到虛擬與現實的融合,也就是說,現實中的人無法完全沉浸於虛擬世界中。然而,如果Sora能夠搆建出一個與物理世界几乎無差別的虛擬世界,打造出一個宏大的元宇宙,那時才有可能迎來元宇宙的真正爆發。這一進程將促使各大企業通過技朮創新建立起更為堅固的護城河,搶占虛擬世界的制高點,推動數字化轉型的步伐,同時創造出更多商業機會和社會變革。

布局AI生成式視頻新風口
OpenAI於今年10月完成了最新一輪融資,估值達到1570億美元,其中包括從多家投資公司和大型科技公司籌集的66億美元。此外,OpenAI還獲得了40億美元的循環信貸額度,使其流動資金總額超過100億美元。

這一切都體現了OpenAI在發展戰略上的決心。作為微軟支持的人工智能初創公司,OpenAI與亞馬遜/Amazon等公司展開競爭,目標是占領生成人工智能市場的最大份額。預計這一市場將在未來十年突破1萬億美元的收入規模。

近期,OpenAI也加強了營銷投入,聘請了首位首席營銷官,計划通過擴大用戶群來提升品牌影響力。10月,OpenAI在ChatGPT中加入了搜索功能,旨在與谷歌、微軟的Bing和Perplexity等搜索引擎競爭,并吸引更多進行網絡搜索的用戶。

此外,OpenAI的ChatGPT制造商希望通過Sora與Meta和谷歌等公司推出的視頻生成AI工具展開競爭。其他新興公司也提供類似的人工智能工具,例如Stability AI的Stable Video Diffusion,亞馬遜則推出了專為兒童設計的短片動畫創作模型Create with Alexa。

隨着聊天機器人和圖像生成器進入消費市場和商業應用,視頻生成可能成為生成式人工智能的下一個重要前沿領域
這一領域的潛力無疑是巨大的,不僅能在娛樂、廣告、教育和醫療等行業創造前所未有的機遇,還將催生出更多創新應用,徹底改變我們創建、消費和互動內容的方式。從個性化廣告到虛擬直播,視頻生成的普及將極大地提升創作者和品牌之間的互動,進一步推動數字化轉型的浪潮。

作為投資者,我們應該緊跟技朮發展的步伐,關注視頻生成技朮的初創企業和領先公司,尤其是在那些能提供創新性解決方案和強大技朮平台的企業。與傳統視頻制作相比,生成式視頻的成本和時間消耗將大幅度下降,這意味着更多小型公司和個人創作者將能夠利用這些工具,降低內容創作的門檻,從而開啟一個更加多元和充滿創意的市場。而與此同時,擁有領先技朮的企業將能夠獲得更大的市場份額,成為下一波科技浪潮的主導者。

此外,投資者還應密切關注視頻生成技朮背后的倫理和合規問題,特別是在虛假信息和深度偽造視頻的風險日益增加的背景下。盡管這一技朮為創意領域帶來了激動人心的機遇,但在全球重大政治選舉的背景下,AI生成的虛假信息問題引發了廣泛的擔憂。根據機器學習公司Clarity的數據顯示,人工智能生成的深度偽造內容數量每年增長了900%。OpenAI將多模態(結合文字、圖像和視頻生成)作為其提供更廣泛人工智能模型的一項重要目標。

隨着生成式視頻技朮的普及,我們需要看到更多企業和平台加強對內容真實性的監管和防護措施。這不僅關乎技朮的發展,也直接影響到投資者的回報和風險管理。隨着技朮的快速進步,投資者需要保持敏銳的洞察力,抓住具有潛力的創新公司,同時也要關注技朮帶來的社會責任和市場變革,以確保在未來的競爭中占據有利位置。

在如此動蕩的金融市場中,你會選擇怎樣投資?
一起深入了解資深投資者的交易策略。在投入股市之前,多認識金融市場,才可提高投資回報率。關注狂呼"思錢想後"欄目,緊密跟蹤股走勢,尋找更多投資機會

點擊此處了解更多

投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。

狂呼金融研究所聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。

聯系我們 // 相關文章

免責聲明:本網站提供的信息僅供一般信息目的,並不應被視為投資建議。

返回網誌
1 / 8
  • Google推出最新量子芯片Willow,實現量子計算突破!

    Google推出最新量子芯片Willow,實現量子計算突破!

    Google宣布推出最新量子芯片Willow,突破量子糾錯和計算速度極限,標志着量子計算商業應用的重要進展。Willow能夠實現指數級的錯誤減少,這解決了量子糾錯這一領域近30年來一直追求的核心挑戰。

    Google推出最新量子芯片Willow,實現量子計算突破!

    Google宣布推出最新量子芯片Willow,突破量子糾錯和計算速度極限,標志着量子計算商業應用的重要進展。Willow能夠實現指數級的錯誤減少,這解決了量子糾錯這一領域近30年來一直追求的核心挑戰。

  • 德國研究人員創新分子太陽能儲存技術,為可持續發展開闢新道路

    德國研究人員創新分子太陽能儲存技術,為可持續發展開闢新道路

    太陽能電池板和風力渦輪機的輸出則會不斷波動,這是依賴再生能源的主要挑戰之一。我們需要一種方式來儲存過剩的電力,直到需要時再釋放。如何進一步提升儲能技術的容量、成本效益和持久性,將成為我們未來能源系統的關鍵挑戰。

    德國研究人員創新分子太陽能儲存技術,為可持續發展開闢新道路

    太陽能電池板和風力渦輪機的輸出則會不斷波動,這是依賴再生能源的主要挑戰之一。我們需要一種方式來儲存過剩的電力,直到需要時再釋放。如何進一步提升儲能技術的容量、成本效益和持久性,將成為我們未來能源系統的關鍵挑戰。

  • SiPhox開發微型硅光芯片血液檢測系統,創新性實現在家驗血

    SiPhox開發微型硅光芯片血液檢測系統,創新性實現在家驗血

    SiPhox Health正在通過一種創新的基於硅光子芯片的血液檢測技朮,幫助慢性病患者在家中便捷地管理病情。該設備大小類似於一台咖啡機,能夠精確檢測20種不同的生物標志物,極大簡化了檢測流程,使患者無需離開家門便可完成檢測。

    SiPhox開發微型硅光芯片血液檢測系統,創新性實現在家驗血

    SiPhox Health正在通過一種創新的基於硅光子芯片的血液檢測技朮,幫助慢性病患者在家中便捷地管理病情。該設備大小類似於一台咖啡機,能夠精確檢測20種不同的生物標志物,極大簡化了檢測流程,使患者無需離開家門便可完成檢測。

  • AI與量子計算:誰將引領未來科技?

    AI與量子計算:誰將引領未來科技?

    多年來,科技公司多年投入數十億美元於量子計算機,寄希望於它們能在金融、藥物研發、物流等多個領域帶來顛覆性變革,尤其是在物理和化學領域,這種期待更為強烈,因為量子力學的獨特效應在這些領域中發揮着重要作用。

    AI與量子計算:誰將引領未來科技?

    多年來,科技公司多年投入數十億美元於量子計算機,寄希望於它們能在金融、藥物研發、物流等多個領域帶來顛覆性變革,尤其是在物理和化學領域,這種期待更為強烈,因為量子力學的獨特效應在這些領域中發揮着重要作用。

1 / 4
1 / 4
  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

  • 京東楊笠事件背后:愚昧的社會何去何從?

    京東楊笠事件背后:愚昧的社會何去何從?

    臨近雙十一,沒想到第一場公關戰就炸在了京東身上。而更萬萬沒想到的是,翻車的點不是價格,也不是帶貨主播,而是更尖銳更為敏感的“男女性別”話題,還把脫口秀演員楊笠推向了風口浪尖。

    京東楊笠事件背后:愚昧的社會何去何從?

    臨近雙十一,沒想到第一場公關戰就炸在了京東身上。而更萬萬沒想到的是,翻車的點不是價格,也不是帶貨主播,而是更尖銳更為敏感的“男女性別”話題,還把脫口秀演員楊笠推向了風口浪尖。

1 / 4