聲明:本文來自于微信公眾號 字母榜(ID:wujicaijing),作者:彥飛,授權轉載發(fā)布。
上市之門展現出重啟的征兆,而抖音的現有業(yè)務卻已經耗盡了想象力。幸運的是,迎面駛來的時代快車 ChatGPT上,裝載的全是故事。
2月9日,有媒體爆料稱,抖音旗下的人工智能實驗室(AI Lab)正在開展類似ChatGPT和AIGC(人工智能生成內容)的研發(fā),未來將為VR(虛擬現實)部門PICO提供技術支持。
PICO相關負責人隨后回應稱,相關傳言不實,PICO目前沒有采用類似ChatGPT技術的產品規(guī)劃。
ChatGPT是一個由美國人工智能科技公司OpenAI推出的大型語言預訓練模型,去年11月底上線。憑借看似無所不知、無所不能的AI聊天能力,ChatGPT短短三個月就吸引了超1億活躍用戶,也促使科技公司爭先恐后扎身同一條賽道。
在美國,長期押注OpenAI的微軟成為ChatGPT全球浪潮的最大贏家,今年1月底宣布再向該公司投入100億美元,并計劃在Office、Bing等核心產品中植入相關功能;深感搜索引擎遭遇史詩級挑戰(zhàn)的谷歌,也在2月初匆忙上線對標產品Bard。
國內科技公司中,BAT爭相入局。百度2月7日宣布將推出類ChatGPT應用“文心一言”,預計3月完成內測、面向公眾開放;騰訊宣稱在ChatGPT和AIGC相關方向已有布局;阿里也放出達摩院版本ChatGPT正在內測的消息。次一級的中小玩家也不甘落后,京東、知乎、快手、小米、360等公司都和ChatGPT產生了或遠或近的關聯。
作為中國互聯網的第三極,抖音2016年就設立了人工智能實驗室,追趕這波ChatGPT的熱浪順理成章。同時,PICO是抖音元宇宙的探路急先鋒,倘若將元宇宙和ChatGPT兩大熱點勾連起來,即便找不到應用場景,也有助于進一步打響品牌、提升銷量。
但對于抖音而言,ChatGPT及其背后的通用人工智能的價值遠不止于此。無論是為了中短期的上市,還是長期的互聯網技術代際競爭,抖音都需要自己的ChatGPT。
抖音上市籌謀已久,但靴子遲遲未能落地。進入2023年,中概股及互聯網行業(yè)轉暖,尤其是螞蟻集團基本完成整改,以及滴滴恢復上架和新用戶注冊,都給整個產業(yè)注入新期待。而抖音去年已經完成集團更名、CFO更換等多項關鍵動作,今年重啟IPO恰逢其時。
但尷尬的是,抖音目前盤子很大,但要么是逐漸步入成熟期的老業(yè)務,比如抖音APP、今日頭條等,要么是扶不起來的阿斗,比如教育、游戲等;集團發(fā)力點也集中在能夠迅速帶來現金流的業(yè)務上,比如貨架電商和生活服務等。以抖音的底子,這些業(yè)務固然能夠貢獻收入,但都屬于一眼望到頭的生意,缺少超越時代的想象空間,難以讓投資人感到興奮。
倘若抖音趁著這波ChatGPT的空前熱度,拿出自己的通用人工智能路線圖,哪怕暫時只是一張大餅,也極有可能在一級二級市場上掀起浪花,給不斷下滑的公司估值帶來提振。百度、知乎等公司股價飆升,已經驗證了資本市場對于ChatGPT概念的追捧。
從長遠來看,以ChatGPT為代表的AI技術,將是抖音完成技術底座升級的鑰匙。
抖音一直借助中心化算法進行圖文和視頻內容分發(fā),但如今算法的效率正在逼近極限,反映到業(yè)務上就是抖音、今日頭條等主要產品增長放緩甚至停滯。再考慮到互聯網新用戶紅利枯竭,抖音只有從底層做出改變,才能讓內容池和用戶池的聯通更加精準高效,進而重啟整個生態(tài)的增長引擎。
ChatGPT背后的AIGC恰好具備這種潛能。它借助人工智能完成了對存量非標準化信息的海量整合,并以自然語言聊天方式實現了更精細的個性化分發(fā)。這是抖音尚未涉足的信息分發(fā)路徑,也是它需要在推薦算法之外增添的新引擎。
抖音從機器推薦向機器人推薦躍升,除了業(yè)務層面的價值外,也是在戰(zhàn)略層面上抵御人工智能對于機器算法的降維打擊。ChatGPT引領著的通用人工智能浪潮已經到來;而應對浪潮的最佳方式,就是成為它的一部分。
A
抖音很早就注意到了類似ChatGPT的技術風向,卻起了個大早、干了個晚集。
2019年7月,抖音人工智能實驗室負責人李航在一場演講中談到,自然語言對話存在不錯的發(fā)展機遇,從產品設計角度可以重點考慮四個機會,包括:任務驅動的對話機器人,信息類機器人,情感類機器人,以及游戲類機器人。其中,“任務驅動的對話機器人”的理想形態(tài)已經與今天的ChatGPT十分接近。
同一個月,大洋彼岸的OpenAI實現了公司化轉型后的第一個重大突破,拿到微軟10億美元投資,同時也借助微軟Azure云計算平臺打通了商業(yè)化路徑。
可以說,在自然語言大模型研究方面,抖音AI技術人員頗有前瞻性,對其產品形態(tài)的預測也和日后發(fā)展相吻合。而在資金方面,抖音雖然不及微軟,但也已經是中國互聯網新貴,掏錢支持AI研究不在話下。
然而,與OpenAI可以心無旁騖地all in通用人工智能相比,抖音人工智能團隊的KPI要繁雜得多,越來越多地趨向與業(yè)務部門打配合。這最終導致兩者的成長曲線天差地別。
從公開信息來看,抖音對于AI技術在集團內部落地有著明確要求。它的人工智能實驗室官網宣稱,自己的研究重點是開發(fā)為字節(jié)內容平臺服務的新技術;具體領域則包括自然語言處理、數據挖掘、計算機視覺、機器學習等,且和抖音各業(yè)務板塊貼合緊密。
比如,在自然語言處理這塊,網站列出了幾個應用場景:Byte Translator,為字節(jié)跳動所有產品提供翻譯服務;AI寫稿機器人Xiaomingbot,涉獵體育、金融、時事的新聞寫作機器人;以及頭條和抖音的搜索服務。而在計算機視覺方面,抖音將AI技術運用在內容審核、短視頻推薦系統(tǒng)、足球比賽理解和尬舞機等方面。
相比之下,OpenAI在誕生之初就把目標放在了通用人工智能上,也就是讓機器能夠像人一樣思考、從事多種多樣的活動。如果說抖音做AI是為了某一應用場景而研發(fā)技術,那么OpenAI恰恰相反,它首先試圖讓AI變得盡可能像人,至于能夠做什么事,完全留給市場和公眾去探索和檢驗。
其結果是,抖音AI部門雖然近幾年成果不少,但整體集中在集團內部,尚不具備打破圈層的劃時代技術力。而在許多時候,即便是抖音自己,對于自家AI能力的運用也并不算純熟。
以自然語言處理為例,這是抖音AI團隊的重點研究對象之一,而集團也在2017年前后試圖扶持悟空問答,并連續(xù)兩年投入10億元補貼答主。但在這場并不成功的問答社區(qū)攻堅戰(zhàn)中,抖音AI并未發(fā)揮顯著功用,僅僅疑似在熱點問題自動生成方面起了一點兒作用。
應用場景受限,又反過來拖累了技術實力的提升。根據市場研究公司statista的統(tǒng)計,2021年全球持有AI專利最多的7家公司中,騰訊、百度和IBM位居前三,而抖音并未上榜。
另一邊,OpenAI一年一個臺階,與谷歌交替站在全球人工智能行業(yè)的頂峰。從2018年期,GPT(生成式預訓練變換器)模型經過三次迭代,其中GPT-3模型在微調之后,成為如今的ChatGPT,幾乎可以生成任何類型的文字,包括聊天、問答、論文、營銷方案、詩歌、劇本甚至代碼,擁有了近乎無窮無盡的應用可能。
在最新一輪融資中,OpenAI的估值達到290億美元,約相當于1/10個抖音,且增長前景遠未看到盡頭。ChatGPT大火,或許會促使抖音重新審視自身的AI戰(zhàn)略,并給AI團隊更多時間和空間。
B
倘若抖音發(fā)力通用人工智能,集團內部的直接受益者當屬今日頭條。
今日頭條發(fā)展至今,增長空間已經極為有限,負責人多次更迭。但它畢竟是整個抖音的龍興之地,同時也是第二大活躍用戶池,數億MAU無法輕言放棄。
過去一兩年間,抖音試圖從供給側激活今日頭條,圍繞創(chuàng)作者生態(tài)做文章,主要是提供更多的流量激勵和現金補貼等。這類活動或許能夠發(fā)揮局部效用,但無法真正改寫今日頭條增長基本停滯的大局。
根本問題在于,今日頭條用戶在被平臺推薦算法“投喂”多年后,沉浸于信息繭房之中,越來越難以對那些超越認知和口味的內容產生興趣。這種需求側的活力下滑,很容易導致任何運營動作的效能大打折扣。
要想打破僵局,抖音必須在需求側做出改變。它之前試圖做問答、搜索等,都是希望讓用戶更加主動地獲取信息,而非單純等著平臺上菜。但受限于各種短板,抖音的這些嘗試并未取得顯著成效。
如今,ChatGPT的爆紅,讓抖音看到了激活今日頭條內容池、提升用戶活躍度的新路徑。
先看內容側。自然語言大模型需要巨量文本數據進行訓練:OpenAI的GPT-1的數據規(guī)模為4GB,GPT-2增至40GB,GPT-3膨脹至2TB。一般來說,數據多、質量越高,最終訓練出來的模型的能力也就越強。
對抖音而言,這意味著今日頭條沉淀十年的內容池突然有了廣闊的應用前景。作為網絡資訊,這些內容很多已經喪失了時效性,但由于不少內容具備較好的文本和信息價值,仍不失為大模型訓練的養(yǎng)料,繼續(xù)發(fā)揮余熱。
再看用戶側。抖音擅長的算法推薦能夠洞察用戶喜好,卻難以察覺人類獲取結構化信息和系統(tǒng)知識的高層次需求,這也是它做不好問答的底層原因之一。
但ChatGPT開辟了一種新的信息獲取范式:用戶設計和提出問題,由AI整合梳理內容,并以用戶期待的形態(tài)即時反饋。它提供的體驗迥異于算法推薦、搜索和問答社區(qū)等舊工具,同時又在效率和準確度上有了顯著提升。這種基于通用人工智能的個性化信息整合輸出能力,是抖音提升圖文用戶活躍度的終極秘鑰。
更長遠來看,ChatGPT這樣的大模型除了應用在文本信息方面,也必然向圖片、音頻、視頻等富媒體形態(tài)延展。抖音倘若做出自己的ChatGPT,受益者除了今日頭條,也將是整個抖音陣營。
以“圖文轉視頻”功能為例,知乎此前已經推出基于文本產出視頻的功能,但效果差強人意;抖音也已經支持輸入文字、搭配圖片生成短視頻,但AI在其中的運用并不多,成品質量主要取決于創(chuàng)作者自身。
人工智能有望改變這一現狀。OpenAI此前發(fā)布了基于文本生成圖像的模型DALL-E,國內的騰訊、百度等公司也上線了自己的AI繪圖工具。抖音2022年發(fā)布了基于開源模型的AI繪畫功能,累計近2800萬人使用。對于通用人工智能而言,從生成文字到圖片,再到視頻,不過是一步之遙。
對于抖音集團而言,加碼通用人工智能,即便暫時搞不出來ChatGPT同等量級的成果,也能帶來資本市場所渴求的新故事,進而為上市增添籌碼。畢竟,這一動作本身就表明,抖音并不是一家只專注于“去肥增瘦”的普通公司,仍然保有探索科技前沿的野心和能力。
C
不過,通用人工智能的研發(fā)需要耗費大量時間,每年的資金投入也以億計。這對于花錢愈發(fā)謹慎的抖音而言,是一個不小的負擔。
根據業(yè)內人士估算,目前大語言模型的單次訓練硬件成本已經突破3000萬元人民幣,且仍在隨著模型體量的放大而攀升。再加上其他成本,各大巨頭需要準備百億美元,才能最終決出勝負。
即便是有微軟撐腰的OpenAI,也不得不在模型精度和成本之間做出平衡。它僅僅對GPT-3訓練了一次;盡管AI模型存在錯誤,但OpenAI認為成本太高,沒有再次訓練模型。
作為一家中國公司,抖音還面臨著先進芯片難以獲取的問題。目前,英偉達是全球主流大預言模型開發(fā)者的主要芯片供應商,其客戶包括微軟、谷歌、Meta等。但受地緣政治因素影響,中國企業(yè)越來越難第一時間買到最先進的芯片,在模型訓練等方面勢必遭遇掣肘。
與百度、騰訊、阿里等公司一樣,抖音想要做出與ChatGPT等量齊觀的產品,可謂難上加難。但倘若能夠殺出一條血路,其回報也將是巨大的。
對于抖音而言,一個擁有自主知識產權的自然語言大模型,除了能夠給今日頭條及其他板塊帶來飛躍外,還能向外輸出AI底座能力,構建商業(yè)模式閉環(huán)。無論是內容創(chuàng)作、客戶管理,還是代碼編寫、重復工作替代等,都可以發(fā)掘出大量應用場景。
以ChatGPT為例,除了充當免費的聊天機器人外,它還作為AI組件融入了微軟Office等眾多第三方產品,并通過API(應用程序接口)鏈接中小開發(fā)者,由后者探索出更多玩法。2月初,ChatGPT還上線了付費版本,用戶可以支付20美元月費,從而在高峰時段訪問聊天機器人。
母公司OpenAI已經從中獲得不少收入。該公司預計,2023年營收將達到2億美元,2024年將超過10億美元。抖音倘若做出自己的ChatGPT,在前期的高投入之后,商業(yè)變現之路也會很快越走越寬。
不考慮財務因素,發(fā)展自己的通用人工智能,也是抖音避免淪為時代“恐龍”的必由之路。
ChatGPT橫空出世后,整個科技行業(yè)都看到了AIGC的強大威力,互聯網內容生態(tài)有可能被改寫,直接感受到威脅的谷歌和百度馬上官宣了類似產品。與兩家公司相比,抖音已經完成從圖文到視頻的躍遷,ChatGPT至少目前威脅不到它,但并不意味著可以高枕無憂。
抖音的看家本領是推薦算法,它之所以擊敗了傳統(tǒng)門戶和視頻網站,靠的是“機器取代人工”所帶來的效率和體驗提升。但推薦算法也面臨著一個更加強大的對手——AI,后者以“機器人取代機器”,能夠更準確地實時掌握用戶需求和反饋,從而讓信息分發(fā)更精準和高效。
就像當年算法推薦對于人工編輯的降維打擊一樣,通用人工智能相對于算法推薦也是另一個維度的存在。如今,它通過ChatGPT初露崢嶸,就已經顯露出顛覆舊格局的巨大潛能。
對于握有互聯網信息分發(fā)權的抖音而言,沖擊浪潮雖尚未到來,但已經在路上。倘若無法避開來自下一個時代的沖擊,那么最好的應對方式,就是成為下一個時代的一部分。盡快上馬自己的ChatGPT,或許是抖音2023年必須要做的事之一。
參考資料:
字母榜,《換帥救得了今日頭條嗎?》
雷鋒網,《字節(jié)跳動 AI 實驗室負責人李航:未來5到10年,自然語言對話該如何尋求突破?》
做AI做的事兒,《ChatGPT的前世今生,以及未來》
人人都是產品經理,《用網絡科學解構,悟空問答輸給知乎背后的邏輯》
21世紀經濟報道,《昂貴的ChatGPT背后 國產GPU“掘金”路漫漫》