AI大模型技術浪潮,專訪華為雲CTO張宇昕 | 播客Podcast

AI大模型技術浪潮,專訪華為雲CTO張宇昕 | 播客Podcast

發布日期:

商業 Business 商業漫談 x Jane's Talk 播客 Podcast 科技 Tech


要點:
中國的眾多雲廠商中,只有華為雲,堅定地選擇了難度最高的AI for Industry要將大模型率先應用於工業領域。所有B端企業都意識到,這一次,真的是狼來了。

衛詩婕 | 商業漫談 Jane's Talk | 播客 Podcast | 國語 | 2024年12月26號

「這一次,狼真的來了。」張宇昕對我說

1999年加入華為的張宇昕,至今擔任華為雲CTO已有七年頭。從一名基層軟體開發工程師做起,先後經歷了互聯網和行動互聯網浪潮(過程中創立了歐拉部),而這一次,他確定,生成式 AI 的技術浪潮,真的與以往不同。

「這一波人工智慧讓大家看到了泛化與通用——通用就是大家都能用。」

「AI 從一個局部真理,走向了人人都信。」

「人工智慧浪潮來臨後,沒有一個企業說我不用人工智慧。」

不過,冰冷的現實是,人們對於技術的暢想無限,而落地時卻進展緩慢——這是大模型浪潮迄今經歷的,從熱情高昂,到冷靜務實的600多天。

昂貴、使用門檻高、技術仍有侷限,是大模型難以進入現象級應用的真相。

因此,放眼中外,雲廠商成為大模型劇目中的絕對主角。他們既是輔導員──幫助一群企業率先用上大模型,過程中也售賣出自己的算力、基礎設施和服務;同時也是攢局者──憑藉對產業上下游的連接,先實現技術最大面積地應用,並充分觀察、統籌、整合,再讓產品反向牽引技術進步。

而中國的眾多雲廠商中,只有華為雲,堅定地選擇了難度最大的「AI for industry」 ——要將大模型率先應用於工業領域。

如果將華為視為一扇窗口,便能窺視千行百業在這次新科技浪潮下的眾生相——

產業裡的熱情和焦慮都是空前的。在此情緒之下,一批巨無霸工業龍頭,已經率先踏上大模型應用的牌桌,因為只有它們——擁有足夠的財力和數據積累,有資格當「第一批吃螃蟹的人」。

一週前,我在海南,創原會技術高峰會的現場,目睹了這些令人稱奇的先進案例:在生產精煤、煉鋼、水泥製造、醫藥開發與研製、疾病預測等等重要的場景裡,貼著行業訓出的大模型,能極大地提升這些場景的計算效率——在原本高危、高成本、高精度的作業裡,大模型能夠加速計算。舉一個通俗例子,過去,做一次氣象預報需要幾千台高檔的伺服器,並運算上半天。現在,只要用一張卡,10秒鐘就能出結果。

看起來,第一批吃螃蟹的企業也已經嚐到了甜頭:透過加速計算,行業能夠極大地縮短生產週期(原本需要研發十年的藥物可能縮短到月、甚至天)、減少生產過程中的冗餘(煉錯一爐鋼可能產生幾十噸的廢料),從而達到驚人的效益提升——在山東,僅一個礦井,在大模型的加持下,在大尺寸的煤炭加持下,在大產量的高產量。

那天,我身邊的與會人士西裝革履,他們大多來自傳統產業——但會顛覆你認為它「傳統」的刻板印象。因為,在生成式AI的浪潮下,居然是中國工業界,現象級地、率先湧現出一批大模型應用的小閉環。

我在創原會現場,專訪了華為雲的CTO張宇昕先生。我們談到了新的人工智慧浪潮下,中國產業裡的集體性焦慮及其對策,以及華為對AI Native的思考。

企業用上、用好大模型的正確姿勢是什麼?這項技術在哪些產業已經率先落地,具體如何應用?華為所倡導的大模型to B路線,如何理解?

有關這些關鍵問題,以及大量華為的內在視角,都蘊藏在這次高密度的訪談中。

以下是訪談整理,經編輯後發布:

01. 要充分發揮製造業優勢:「中國是AI 最好的黑土地」

Q :如果姑且把ChatGPT誕生作為這一波大模型浪潮的源頭,這兩三年間,華為雲內部是如何反應的?有哪些關鍵的決策和判斷?張宇昕:華為對於人工智慧機會的捕捉,其實比ChatGPT還要早。

張宇昕:早在2018年華為的全聯接大會上就發布了相關策略,當時我們認為,人工智慧未來會成為一個通用技術;到了2021年,在華為開發者大會上,餘總(余承東)發布了我們的盤古大模型;2023年,我們把盤古版模型升級到了3.05版,基本升級到了GPT版,基本升級到了GPT05版。

但是我們所走的路可能跟美國大模型的路不完全相同,跟國內業界也不完全相同。我們的定位是「AI for industry(工業AI) 」。

Q:「AI for industry」的策略,是基於華為的基因嗎?

張宇昕:是的,但也是結合我們中國產業的特色──全球666個工業產業裡,我們國家有220多個是全球領先。我們的產業門類也最齊全。這意味著,我們國家在這些產業的技術經驗、工程能力都是領先的,如果把這些技術經驗、工程能力用數據沉澱下來,就是人工智慧最好的數據集。這是人工智慧大有可為的地方。

所以,中國要在人工智慧上建立優勢,一定要充分發揮中國製造業領先的優勢。

Q :我也留意到一句很有趣的話,中國是AI發展的黑土地。您認同嗎?

張宇昕:我認同,這是我們的結構、產業特徵所決定的。

02. 與以往不同的科技浪潮:「這一次,狼真的來了」

Q :華為雲連接著千行百業。如果把你們視為一扇窗口,中國企業擁抱新科技浪潮時,呈現出什麼樣的心態和姿態?

張宇昕:不同的客戶可能有不同的特點,大體分為兩類:

一類客戶對於新技術變革的意願度不是太高,因為他們有大量傳統的業務和模式,傳統的軟硬體的包袱,很難改變,他們偏向一種平緩的、漸進式的變革;

但是很多創新的企業,他們對新技術很敏感,認為這些技術一定會帶來新機會、以及價值分配的變化,所以他們會有某種緊迫感和渴望,甚至有些焦慮。

不過技術肯定有門檻,對於許多企業而言,他們獲取、掌握、運用這些技術,存在諸多的困難;他們希望用一些快捷、低門檻、但能夠支撐自己業務的方式來快速進入大模型的應用。華為有著長期、大量的技術研發投入,能夠很好地支持他們(去做這件事)。

Q :就是在華為這片很深的技術土壤中,長出一些大模型的基建和一系列工具,企業直接拿來用。

張宇昕:對,我們把基礎的能力建構好,也把客戶業務所需的這些能力,建構成服務。所以我們提出:「一切皆服務」,包括技術設施——技術資料庫、大數據、安全性等,把這些做成雲端服務。

客戶就在這些能力上,搭自己的業務系統。

Q :剛才您介紹了兩大類客戶的畫像,這兩類客戶,哪一類比比較大?

張宇昕:現在來看,起碼五五開,甚至擁抱新科技的還超過一半以上。

Q :大模型這波科技浪潮跟過往的科技浪潮有什麼不一樣?

張宇昕:大家更覺得這波浪潮是難以抵擋的,是所有企業必須採納的。

中國雲化的節奏是比美國的節奏至少晚5年——很多企業還覺得自己不用上雲,或者不一定要擁抱公有云,但是美國絕大部分的企業、政府機構都已經擁抱公有雲了。但是人工智慧浪潮來臨後,沒有一家企業說我不用人工智慧。大家都覺得我必須擁抱這波浪潮,如果我不擁抱​​它,我就會被這波浪潮打翻。

Q :為什麼呢?

張宇昕:這一波人工智慧讓大家看到了一個泛化、或者說是通用技術的一個前景。換言之就是廣泛應用——通用就是大家都能用、各行各業都能用。要知道過去這麼多年,人工智慧還在一個小眾範圍。

此外,大家看到新科技帶來了許多顛覆商業模式、創新體驗的可能性,這些企業客戶是很擔心的──要嘛我做,我去改變自己,要嘛就可能被新的(對手)顛覆掉。

Q :人工智慧這個詞出現已經70年了,過程當中也有過一些熱點高潮,比如Alphago 下棋、人臉識別,但都是曇花一現,熱情一下子脈衝到很高,然後又回落了,大模型一定不會是曇花一現嗎?

張宇昕:過去70年,人工智慧的科學理論雖然有很多的進步,但這些科學理論始終難以落地到實際的產業當中,都是在一些局部的環境、場景裡應用,過去的人臉識別或是圖形識別,都只是影響很少一些客戶、或者很小一些場景。

而這次ChatGPT解決了大家一個共識問題──就是大家終於意識到,透過海量AI算力的計算,用無監督、自動化的訓練方法,完全可以實現人工智慧的通用化。ChatGPT給大家最大的震撼在於這裡,以前大家覺得人工智慧是局部真理,但一旦它是一個通用的技術,那麼所有的人都與此相關了。

Q :通用這個詞可以用一個通俗比喻,我們常說訓大模型就像訓一個大學生,比如華為有那麼多的就業崗位,很多也是從校招生培養起來的。那如果可以培養一個人,其實也可以培養一個智能體。

張宇昕:是的,完全可以。

Q :既然這波科技浪潮與以往不同,產業上下游的企業最直觀的反應是什麼?

張宇昕:B端的所有企業都意識到,這次真的是狼來了。

這個新技術將會深刻地改變B端的企業,這也是他們又興奮又焦慮的重要原因。客戶的積極性是空前的,幾乎我們談到的所有客戶都想擁抱人工智慧,只是他們不知道該從哪裡下手,該如何應用。儘管他們不知道,但這種願望是很強烈。

Q :這當中有沒有什麼泡泡、幻想、誤解是要戳破的?

張宇昕:當然會有。大家對新技術的期望很高。但首先,人工智慧不是無所不能,畢竟人工智慧沉澱的是我們人的知識、經驗和技能,人不會的,不能指望大模型它會;人所不具備的知識和經驗它一樣不具備。

現在的大模型解題也就是大學生的水平,我們輸入哥德巴赫猜想給他還是解不出來的,因為人沒解決這問題。 Sora雖然能夠生成視頻,大家覺得很新奇,但是你拿它和李安比,肯定還差太遠。它並不具備思想、美學的觀點、光、流體動力學,這些它都不懂,我們說可控性比較差,離真實也比較遠,還有幻覺問題等等,這是人工智慧當前的限制。

但如果等人工智慧已經特別成熟了,已經到了100%可以產業化的階段,你再去用,你就已經落後於這個時代。

Q :先下場練習很重要。

張宇昕:擁抱AI,與科技共同成長。因為技術的成熟是要靠產業的實踐不斷去推動它。新技術一定會帶來新應用,反過來新應用又會提供技術要求,提供它場景、練兵場,兩者是像DNA一樣螺旋型、循環成長的過程。

03. 大模型是雲的Game Changer:過去是水電煤氣,「今天,雲端的服務層更厚實了」

Q :回顧整個大模型浪潮,我們會發現不管是中國還是美國,雲廠商都在其中扮演最關鍵的角色,這其中的深層邏輯是什麼?

張宇昕:人工智慧有三大要素,第一是要消耗大量的算力,第二,人工智慧的原料是大量的數據。第三,人工智慧還需要許多客戶的應用場景、用演算法把業務融入,才能讓客戶使用成功。

那麼,在哪一個平台能把這些要素聚集在一起呢?想來想去只有雲廠商——雲上有規模的算力,雲上匯聚了海量的數據,透過雲的生態,我們連接著產業上下游所有的伙伴,所以,雲是最好的人工智慧的黑土地。

Q :過去外行人看雲,會很粗略地認為雲就是賣算力、賣存儲,大模型來臨後,雲廠商是否有額外的價值會凸顯?

張宇昕:在雲端的最早期,我們的確是賣算力、賣計算、賣存儲,幫助客戶搭建基礎設施,這是雲的最初級的價值;我們提供的第二層價值是技術即服務——軟體開發的技術,數據庫、大數據的技術,包括安全的技術,人工智能來臨後,技術即服務這一層就會做的更加厚實了。

例如我們過去的資料庫和大數據,其實並不理解數據本身的價值,以及數據裡的意義是什麼?這些價值和意義原本藏在企業的各類專家腦海裡——比如一個財務報表,給我這個不懂財務的人看,可能就是個阿拉伯數字而已;但是財務專家一看,就知道數據背後的含義,因為我腦海裡沒有這些知識,但是財務專家有——我們現在做的人工智能,就是幫助企業進一步把這些知識數字化,他們數倉、大數據集,

所謂模型表達,就是讓這些數據裡的經驗、知識、以及彼此之間的關係,透過模型和軟體,讓這些數據進一步發揮價值。過去,我們用人來做各種數據分析、洞察、決策的支撐,現在就可以用機器來輔助,輔助成本要低一些,效率要高,可能精度也要更高。

Q :你們呼籲企業,基於模型來改造自己的應用和軟體,把原本行業裡各種專家含金量最高的經驗餵給人工智慧?

張宇昕:對,回到最開始的比喻,通用大模型已經被訓練成一個大學生程度。如果我們能夠把產業知識注入到大模型裡去,就等於把一台電腦變成了一個產業專家。

人類大學生進入一個企業,也是要靠老師傅帶,才能逐漸培養成一個專家;現在我們把老師傅的這些經驗和知識,數據化後,餵給大模型,過去一個專家可能理解50個維度的經驗,不同的專家有不同維度的經驗,一個人無法同時掌握這麼多(知識),但是機器可以。於是機器就可以幫助大家提升效率。這就是人工智慧的價值。

所以,雲端過去是提供基礎設施和技術,現在還能幫企業把經驗傳承,把寶藏數據的價值發揮,這意味著雲端本身的價值也在提升。

Q :所以我之前看過一句話:過去雲廠商提供的價值就像水電煤氣,你不能缺少它,但是似乎也不會為它付出太高的交易價格。今天的雲端廠商能做的事情就可能更豐富了,它的價值也更大了。

張宇昕:對。它變成一種類似你業務的一種諮詢顧問,提供一些更有價值的決策的判斷,這就跟過去的雲端發揮的價值層次就不一樣。

04. 過去一年,雲端的競爭:「我們派了幾百個科學家深入田間地頭」

Q :大模型的淘金熱,賣鏟子的人最開心。過去一年,雲端產業經歷了什麼樣的競爭?

張宇昕:如你所說,整個雲端產業裡有兩個層面的競爭,一個是就是賣鏟子,就是算力;第二個層面就是大模型本身。

我講了,美國、包括中國的互聯網廠商,他們主要做的是以toC服務為主的業務類型,所以還是傾向於往通用大模型裡放更多的通識,如此一來,大模型更大,所包含的通識更多、更廣,這是一條路子。所以我們看見了國內外很多雲廠商都提供了類似ChatGPT這類對話的能力,大家呼叫API即可。

但華為服務to B,對許多企業客戶來說,你提供我一個對話機器人又如何呢?當然可以幫助解決一些客服、內部交流等問題,但企業客戶,更關注人工智慧是否能在生產系統上發揮價值。所以我們希望讓每個企業都擁有自己的大模型,讓每個開發者都有自己的人工智慧助手,說穿了就是結合產業應用、產業知識來做產業的大模型。

我相信,慢慢地,toC和toB這兩條路徑會分叉。

Q : 業內很多人還是會認為,算力是華為雲的最大的優勢,據我所知一些友商也買華為的晶片,因為他們的政企客戶需要國產替代。您認可算力是華為雲目前最大的優勢嗎?

張宇昕:算力肯定是我們的優勢之一。如您所說,算力不只我們自己有,也賣給友商和產業。因此絕不是獨特優勢。如果說華為雲端有什麼獨特優勢,也許是我們能實現軟硬體協同——軟體的服務能夠驅動華為晶片和硬體的定義,我們能結合客戶業務場景的需求,來設計整個系統,由此能發揮整系統的優勢。

Q :矽谷那邊,對Scaling law的追求有放緩,但與此同時一些世界大廠仍在算力豪賭這條路上狂奔著。再反觀國內,2024年相比2023年是更理性冷靜的。但前陣子袁進輝老師提出一個觀點:如果說大模型的訓練成本是一池游泳池的水,那麼推理成本可能是一片汪洋大海,是無止盡的。您有觀察到中美兩邊對於算力需求的變化嗎?如果說推理成本無限,是否代表算力這門生意也是無限的?

張宇昕:我們早就判斷,世界上能持續做大模型訓練的,誇張一點說,中美各五家就差不多了,確實沒必要每個廠商都從頭去做,因為模型的訓練是一個很高的投入,很苦的差事,而絕大部分的客戶用大模型,其實主要就是推理,所以推理遠的市場空間確實是大於訓練的市場空間。

第二個就是成本的問題,我的觀點是 Scaling law還會持續的發展,為什麼?因為目前的人工智慧技術,單位計算成本仍然太高,效率還是太低。以人腦為例,首先現在AI 還沒達到我們人腦的算力程度。其次,人最多消耗一點吃的、穿的,但是要堆起一個跟人的思考能力相同的算力系統,還要多少錢?

如果人工智慧真的要取代人的一些基礎工作,它必須把成本降到和人相當、甚至更低,才符合經濟法則。就像您手上拿的筆記型電腦,如果還是大型主機的階段,我們絕對都擁有不了。

要做到這樣的成本水平,意味著算力規模還要繼續擴大。所以長期來看,我覺得未來5年、10年,可能還有幾十倍、數百倍的需求成長。

而我們之所以看到現在市場的理性,是因為現有成本結構下,一味地擴大算力意味著高代價,這不是所有廠商都負擔得起的。所以,必須設定一些低門檻、高效率、低成本的方案,讓第一批願意吃螃蟹的客戶,能及早地應用這些技術,及早地產生效益。更重要的是,應用之後,它就會給技術回饋,來推動技術進步。

Q :這種正向回饋發生了嗎?

張宇昕:時時刻刻都在(發生)。

我們這幾年做了30多個行業,上千個客戶,每一個客戶在建立大模型的過程中都會提出很多新的要求,都是當前大模型的能力還沒有具備的;

所以我們這幾年派了幾百個科學家、博士專家深入田間地頭、工廠車間,生產一線——不是說做好了一個東西拿給人家用,人家馬上就能用的;還是要到客戶的業務系統裡去、到現場,看見新的問題,提出新的挑戰,再回過頭來攻克這些技術。

這個過程也是人工智慧技術發展的過程。

05. 大模型的實用性問題:「精準度好的『小模型』,可能是企業的未來」

Q :你剛才講到大模型的成本還不夠低。週鴻禕在前不久的演講中講了一句話,他說希望「把大模型拉下神壇」,先用一個模型解決一個具體的問題,他覺得這是最重要的。您該挺認同的吧?

張宇昕:我非常認同。我認為他這個觀點表達了兩個意義。

第一,大模型高,但不能貴,華為過去也常講這句話,叫做「高而不貴」。因為如果一個技術又高又貴,那隻能飄在天上,落不了地;大家都能用得起來,這是叫「高而不貴」。

第二是,在大模型的早期,如果能夠聚焦解決生產系統當中的某一個問題或某一類問題,把成本降下來、自動化水準提上去,也是個好事。

Q :提一個有點尖銳的問題,華為也自研了盤古大模型,但跟其他廠商比起來,它不太參與刷榜,為什麼?

張宇昕:剛才講過,華為是走大模型to B路線最堅定的實踐者之一。基於這個選擇,我們沒有必要跟著人家去刷榜,因為現在絕大部分的刷榜是基於NLP通用的評測榜,這類通用能力無法解決企業的問題。

不如沈下心來,踏實地幫助客戶去建立他們的人工智慧系統——讓客戶拿著自己的行業know-how在我們的(大模型)底座上去做增量訓練,做微調,訓出自己的大模型。

所以我們是一個使能者,是個黑土地,我們不是黑土地上最後長出來的那棵樹或那朵花。樹和花是客戶的;但對於網路而言,他們本身就是樹,就是花;各自定位不一樣,所以有些指標沒有必要去比。例如對科技大模型而言,可能需要考慮產業數據和通用數據的配比,才能使得整體效果最優,一味追求某個指標可能是種浪費。

Q :這裡就有個細節問題,關於您講的配比問題,據我所知,訓大模型時會有一組矛盾——模型的泛化能力和專業性能力是相牽制甚至相悖的。

張宇昕:是的,專業資料訓得越多,泛化性就會受影響;如果追求泛化性很好,那專業能力一定就會比較差,這是目前的難題。

Q :這個問題現在有解嗎?

張宇昕:技術還需不斷攻克。

或許未來模型的架構還會發生變化,又或是訓練資料的處理方法會變;當然也許未來算力大了,這個問題就不成問題了— —就像小學生一樣,一次教多了他消化不了,教了A,忘了B。但如果對方是大學生,你會發現一次教他3 件事,他是記得住的。這就是當下的人工智慧技術還不成熟。

如果未來有更新的技術,更強的算力,也許這種泛化性和專業性的矛盾就不會這麼尖銳。

Q :今天我看到你們台上演講的一些客戶案例,都是巨無霸企業,體量挺大的,我有些懷疑你們所說的,「希望把模型價格打下來,讓企業都能用得起」。現在一般企業能用得起你們的模型和服務嗎?

張宇昕:為什麼現在只有大企業在玩人工智慧?

因為人工智慧三要素裡面,第一是算力,第二是演算法,這兩點華為也許能幫客戶解決──沒有算力我們可以幫客戶去建,演算法不行我們也有足夠的專家;但第三點,數據,只有大企業擁有足夠的數據。業界的小企業們,他們也很想趕緊擁抱人工智慧,但是他們手上所掌握的數據(知識和經驗)太少。

所以,我們提出了大模型的層次結構:
第一層L0叫通識大模型,通用大模型是底座,其實不是客戶最終使用的。

第二層L1的產業大模型要靠產業的領頭羊,這些企業掌握的數據夠多,能把產業的通用能力也做成大模型,不僅僅自己能用,也開放出來給中小企業用,這就降低了中小客戶的門檻;

第三層L2指的是特定場景的大模型,這就進一步降低了使用門檻了。

同時我們也號召業界來共建這種開放資料集。因為一類型的企業,你有一些(數據),我有一些(數據),只要這些數據不涉及企業的隱私或保密數據,這些脫敏的通用數據都可以拿出來,在行業裡建立、共享一個行業通用數據集。他人的數據和經驗,可能剛好能補我之不足,這個過程也充分體現了竟合的精神。

Q:上午還有一個觀察,我發現拿出來講的模型從參數量級來看,並不算大,例如一個藥物分子大模型,是億級參數。今天我們很少在公共敘事中看到億級參數的模型。小模型的價值有多大?模型越做越小、把小參數模型做好,會是趨勢嗎?

張宇昕:你說的「小模型」,「小」應該指的是參數量級,我把它理解為小的大模型——在通用資料訓練的基礎上,再疊加專用資料。

為什麼會有小的大模型?業界很多客戶容易被誤導了。其實參數量大的主要是自然語言(NLP)的模型,現在NLP模型起始都是千億、甚至兆。但是如果是視覺模型,幾十億(參數)可能也夠。推理決策的模型,幾十億、幾億都夠;像藥物分子大模型,它不需要(參數)這麼大。

對一個企業而言,第一,它首先要求大模型要有專業能力,第二,一個企業要選擇多種模態──不只語言,也要視覺,也要決策推理,也要優化。像是分子藥物大模型和我們做的氣像大模型,都叫做科學計算大模型──過去我們用解方程式的方式算出來,現在用學習的方式加速計算。

例如過去做一次氣象預報,需要3000台到5000台高檔的伺服器算半天才能算一次,現在,我們用一張卡,10秒鐘就能出來。過去研發一個藥物要10年,現在一個藥物篩選,可以由月的時間縮短到天,甚至縮短到小時。這些案例,都是用人工智慧的方式在加速運算。所以,小的大模型也有價值。

第三,企業也要選擇尺寸──因為同等能力的大模型,尺寸越小,成本越低,這就需要我們有技術了,比如做量化抽取,能否盡量降低它的算力成本,使得精度在下降不多的情況下,更經濟地使用。

以上這些,都是企業要綜合考慮的問題。未來,小參數、但是精準度非常好的大模型,可能是未來企業不斷追求的。

06. 產業裡的高價值AI 場景:「一個礦井,我們一年幫他多生產2000 噸煤」

Q:你們跟那麼多客戶貼身合作,發現哪些高價值的AI場景?

張宇昕:例如煤礦是一個高風險的場景,過去靠人值守,現在可以透過攝影機和CV(視覺大模型)來判斷挖煤的工況,甚至還可以透過聲音來判斷,地底下是煤還是水?還是岩石?過去都是老師傅站在那聽,老師聽得不對,(喊)「不能挖了!」,因為再挖可能挖透了或者怎麼的。現在這些場景都可以用人工智慧方式去判斷。

還有一個場景是傳送帶分揀,過去主要靠人分辨煤渣、石頭和煤塊,效率又低、成本又高。現在分類的效率會大大提升。

還有生產精煤,精煤是需要各種配比,過去的配比是按一個比例生產出來後,再去檢驗成分,如果達不到期望就再回去重新配,需要反複試驗——但現在我們把多種數據綜合起來,模型分析就會給出最佳參數,就省去了反複試驗。在山東,就一個礦井,我們一年幫他多生產2000噸煤。如果推廣到全國,可想而知能夠提產多少。

同樣原理的還有煉鋼,鋼要煉得品質好,溫度、原料、各種微量元素的配比,都需要很精確。過去是靠煉鋼師傅的經驗,去做各種試驗──一爐鋼幾十噸就去了。現在人工智慧就不需要那麼長時間去反覆跑試驗,煉出的精確度品質比原來好很多。就算一噸鋼降低一塊錢的成本,當然我們初步測算的效果可能不只一塊錢,可以看我們國家一年要生產多少億噸鋼。其中的降本將會是個驚人的數字。

Q:我相信你們一定從產業裡挖掘了非常多的場景和需求,但也不可能一上來就所有都做,一定有一個優先排列的過程,選擇做什麼、不做什麼,先做什麼、後做什麼。在華為內部,這個過程是怎麼樣的?

張宇昕:首先第一步,還是必須深入客戶第一線。以煤炭為例,有三個場景,假設人力有限,只能做一個場景,那我必須知道,哪一個場景條件最成熟、產生的價值最大、客戶最著急。這需要基於客戶自己的經驗以及我們的經驗,結合起來才能判斷。

收集到這些需求後,我們每一層專家和主管都在碰撞,如何用手上有限的人,把這些需求里共性的東西抽取出來?這需要先理解業務、辨識需求,在需求中抽取共通性──我們講去粗存精、去偽存真,由表即裡,由此即彼。這樣的話,也許客戶沒有提出的問題,也有機會解決。這也是技術團隊最大的價值。

做出技術和產品後,我們要再把它帶回客戶現場去驗證。是一個不斷持續迭代的過程。

Q :收集並確定第一批次的需求,這個週期經歷了多久?

張宇昕:比較快速。實際上對於大顆粒度的需求有年度的規劃,中間會有迭代,以季度或月為單位的需求可以識別和納入進去;對於緊急需求也會有緊急決策的流程。雲還是比較靈活。

Q :大模型浪潮來臨後,華為雲端用多久定義了自己的新目標?

張宇昕:不太好說,其實這幾年我們還在不斷地學習,也在不斷地調整目標,有些調整是覺得方向偏了,有些是目標低了。或是目標的優先順序要排一排。

Q :方向偏了和目標低了,可以舉個例子嗎?

張宇昕:例如到現在為止,公司裡還有人問我,為什麼我們不提供大模型的API ?

但在我看來,大模型的API其實是個類別toC的業務。我們絕大部分的政企客戶,你提供給他們一個大模型的API,對於企業的生產應用,幫助並不大。API主要是類似ChatGPT這樣的對話機器人,企業希望它回答的問題,背後用到的知識可能是機密的,可能涉及隱私,不能開放的;

所以,如果說我們也去提供公開的API,優先權到底高不高?這個公司內部就有爭論。那透過一段時間的思考,我們還是覺得不要走這條路,走AI for industry,這就是修正方向。

Q :那哪些目標定低了呢?

張宇昕:那當然還是大家最關心的性價比。

我們每一回都覺得對性價比的追求還不夠,還要再去挖可靠性;儘管我們的大模型的訓練集群穩定度已經在業界算是比較好的了。但我們還是希望中斷時間能否再短一點,客戶恢復(維持)的時間能否再長一點,每回都是還要加碼,還要再提升。

07. AI Native、中國道路與產業協同「優勢擋不住趨勢」

Q :三、四年前我們還在提「雲端原生」,今天所有人都在提「 AI 原生」,華為雲怎麼理解AI native?去年李彥宏在提到AI native的時候,講到他要內部拋棄所有舊有的認知,完全解構了之後重新做,他說大廠在這件事情上肯定會反應慢。您認不認同他的看法?

張宇昕:透過我們這幾年的一些合作和實踐,我把AI Native總結成四個方面,不一定全,但是能概括我們現在看到的比較主要的四個實踐路徑:

第一,如果要做人工智慧,一定要選擇AI Native的算力,也就是新型的算力──一定要能支援大算力、大頻寬、低時延,能支援大模型訓練和推理中,大量的資料同步,傳統算力搞不定。

第二,因為客戶要建構智慧化的應用,所以它的業務系統必須要構築在一個已經智慧化的底座之上。過去的底座包括傳統的資料庫、數倉、大數據安全、軟體開發等等這些技術,都需要升級。底座不智能,也就無法支撐業務的智能化。這是雲端服務的智能化。

第三,很關鍵的一點是要建立一個產業或企業的大模型,這就是人工智慧的核心。一個企業能不能人工智慧化,核心就在於它能不能把這些知識經驗做到大模型裡去。

第四,如果我們既用了算力,也用了智能化的底座服務,也構建了自己的大模型,毫無疑問,那整個應用系統就要改造,我們叫大模型系統。

這四個面向是企業必須要做的事情。如果這四個面向做得比較好,我們覺得這可能就是走向 AI Native之路。那麼,第二個問題就不言自明了:技術的每一層都變化了,所以李彥宏說要重構,是很自然的。

Q:那華為有沒有經歷過這種結構又重構?

張宇昕:這兩年,我們華為雲端已經把自己的基礎建設全部重構了。我們叫「 reshape the cloud service(重塑雲端服務)」。我們所有的雲端服務都用人工智慧加持了。有的是增加了智慧助手,有的是為大模型做了很多功能,例如安全態勢、漏洞攻擊的感知,例如資料庫的管理、運維,當然升級的過程沒有完成,這是一個長期不斷迭代的過程。

所以這個重構已經開始了。

Q :解構和重構這件事,對華為來說有包袱嗎?

張宇昕:包袱一定是有。

過去這麼多年累積的程式碼,誰都不想說這些程式碼要改,甚至於有些程式碼要拋棄掉。但是我們華為有一句話,叫「優勢擋不住趨勢」。如果你不想變革,你可能就被這場變革顛覆掉。與其被這場變革顛覆掉,不如及早擁抱他,你也成為這場改革紅利的享受者。

Q :就在我們談話的今天,業界發生了一件大事, ChatGPT之父離開了OpenAI,我們看到美國(AI 業界)現在人才流動非常的劇烈。在中美AI的競爭路上,您有什麼主張和判斷嗎?

張宇昕:我有幾個想法。
第一是,中國的人工智慧發展道路一定要走中國特色,結合我們自己的產業特色去走。我們如果走美國的道路,不一定能成功,例如以語言大模型為例,我個人認為,英語語言的大模型我們無論如何都很難超過西方世界的。因為英語是西方世界的主流語言。工業革命以來,人類最主要的公開的文化、論文、知識,基本上都是英文的。這條路,現實來講我們可能趕不上。

第二點是,美國現在在打壓我們的人工智慧,技術上打壓,未來可能在人才上也打壓。中國學生再想去美國學電腦、人工智慧相關專業都很困難。這就更加要求我們中國的產業界要協同起來。在人工智慧這件事上,更多的是協作,而不是競爭,只有發揮各自的優勢、協同起來,才能把整個產業帶起來,才能跟美國進行這種全棧的競爭。

第三,產業界和學界也要協同。比較好的事情是人工智慧的學術研究,除了美國就是中國,世界上找不到其他地方了。所以中國的產業一定要給學術界提問題​​,給他們這個場景,給他們這種理論發展的空間和機會。當學術界研究出了新技術,要快速地到產業來進行驗證。

如果能把這樣一個循環做起來,那我們的人工智慧產業,就誰也不怕了。

衛詩婕 Jane

衛詩婕,媒體人,獨立商業作者,曾任極客公園執行總編。早年任職於《人物》、GQ報道、字節跳動。虎嗅2024年度作者、金字節獎年度新銳作者、網易非虛構文學獎年度作者、全球真實故事獎TSA(True Story Award)中文報道十佳。2024年離開了媒體機構,選擇以獨立商業作者的身份繼續內容之路,開設了一檔商業訪談觀察IP,商業漫談 Jane's talk 一檔關注科技、商業、人文的深度訪談節目,一份時代側寫筆記。 聚焦商業趨勢、倫理、公平、競爭和價值。 「打撈時代碎片,文字對抗時間。」

微博:詩婕SJ_Jelyne | 小紅書:詩婕Jane's Talk | 微信:SJ_Jelyne

聯繫 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回網誌
1 / 8
1 / 4
  • 中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    “我的前女友叫劉佳”、“前女友叫劉佳”、“劉佳是我前女友”.。以上這些男士的前女友竟然都叫“劉佳”,而更離奇的是,這些男士還都是同一棟樓的業主,他們都表示自己是前女友“劉佳”介紹來買房的。這一切看似巧合,實則隱藏着不為人知的騙局。

    中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    “我的前女友叫劉佳”、“前女友叫劉佳”、“劉佳是我前女友”.。以上這些男士的前女友竟然都叫“劉佳”,而更離奇的是,這些男士還都是同一棟樓的業主,他們都表示自己是前女友“劉佳”介紹來買房的。這一切看似巧合,實則隱藏着不為人知的騙局。

  • 美國性勒索與網路犯罪:青少年如何避免成為下一個受害者?

    美國性勒索與網路犯罪:青少年如何避免成為下一個受害者?

    在數字化時代,網絡犯罪的形式愈加多樣且隱蔽,其中“性勒索”/sextortion已成為一個日益嚴重的問題。這類網絡犯罪不僅涉及個人隱私的泄露,還會對受害者的心理健康和社會生活造成深遠影響。“性勒索”/Sextortion犯罪在現代技朮的推動下,呈現出爆發式增長。

    美國性勒索與網路犯罪:青少年如何避免成為下一個受害者?

    在數字化時代,網絡犯罪的形式愈加多樣且隱蔽,其中“性勒索”/sextortion已成為一個日益嚴重的問題。這類網絡犯罪不僅涉及個人隱私的泄露,還會對受害者的心理健康和社會生活造成深遠影響。“性勒索”/Sextortion犯罪在現代技朮的推動下,呈現出爆發式增長。

  • 加州洛杉磯野火的“囚犯消防員”

    加州洛杉磯野火的“囚犯消防員”

    加州洛杉磯囚犯參與了搆筑防火線、清除廢墟及易燃物等工作,彌補了加州消防隊伍的不足。然而,他們的低薪待遇卻令人震驚。囚犯消防員的收入在每天5.8美元至10.2美元之間,而相比之下,加州的最低工資標准為每小時16.5美元。

    加州洛杉磯野火的“囚犯消防員”

    加州洛杉磯囚犯參與了搆筑防火線、清除廢墟及易燃物等工作,彌補了加州消防隊伍的不足。然而,他們的低薪待遇卻令人震驚。囚犯消防員的收入在每天5.8美元至10.2美元之間,而相比之下,加州的最低工資標准為每小時16.5美元。

  • 從吉他少年到海嘎小學教師,顧亞用音樂敲開鄉村孩子通往世界的大門

    從吉他少年到海嘎小學教師,顧亞用音樂敲開鄉村孩子通往世界的大門

    2014年,在家人的“慫恿”下,27歲的顧亞參加了鄉鎮特崗教師的招聘考試,意外地來到了這個偏遠的村莊。海嘎村的孩子們大多沒有見過吉他,但他們天生擁有出色的嗓音和節奏感。顧亞毅然申請從大灣鎮的臘寨小學調動,前往海嘎村當起了老師。

    從吉他少年到海嘎小學教師,顧亞用音樂敲開鄉村孩子通往世界的大門

    2014年,在家人的“慫恿”下,27歲的顧亞參加了鄉鎮特崗教師的招聘考試,意外地來到了這個偏遠的村莊。海嘎村的孩子們大多沒有見過吉他,但他們天生擁有出色的嗓音和節奏感。顧亞毅然申請從大灣鎮的臘寨小學調動,前往海嘎村當起了老師。

1 / 4
  • 從中國經濟看背後困境及發展新構想?

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

1 / 4