如果仔細(xì)觀察會(huì)發(fā)現(xiàn),大家似乎很少再提“AIGC”,取而代之的是“生成式AI”、“LLaMA 2”以及“AI大模型”等新詞。
這場(chǎng)由“Chat GPT”引發(fā)的內(nèi)容生產(chǎn)力大革命,已經(jīng)慢慢走出了單一的“對(duì)話式場(chǎng)景”,并迅速蔓延到商業(yè)應(yīng)用的各個(gè)場(chǎng)景,尤其是“AI數(shù)字員工”的出現(xiàn),更是打響了互聯(lián)網(wǎng)大廠AI大模型應(yīng)用第一槍。“企業(yè)需要快速建立‘收入增長(zhǎng)飛輪’并通過AI構(gòu)建更加高效的組織協(xié)同和作戰(zhàn)能力?!边@是見實(shí)和360 集團(tuán)副總裁、N 世界負(fù)責(zé)人梁志輝深聊時(shí)的一段話。可見,面對(duì)這波新的AI大浪潮,行業(yè)似乎更加克制和理性,當(dāng)然,這也和稍顯窘迫的大環(huán)境密切相關(guān)。作為一名互聯(lián)網(wǎng)老兵,梁志輝經(jīng)歷了從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)的完整周期,這波AI浪潮的出現(xiàn),不由得讓他找回了剛進(jìn)入PC 互聯(lián)網(wǎng)時(shí)代的感覺,只是這次變革的速度遠(yuǎn)比上次快。對(duì)此,梁志輝喜憂參半。喜的是,能在幾十年短暫的職業(yè)生涯中,同時(shí)經(jīng)歷兩次行業(yè)大浪潮,并跟隨360這家企業(yè)沖在時(shí)代最前沿;憂的是,一大波不行動(dòng)的企業(yè)即將被加速淘汰,部分看似牢固的商業(yè)模式也在加速崩塌。深聊中,梁志輝分享了大模型在企業(yè)數(shù)字化過程中的應(yīng)用和未來發(fā)展趨勢(shì),并稱這次不可逆的底層技術(shù)大變革充滿了機(jī)遇和挑戰(zhàn):無論企業(yè)大小,接入AI技術(shù)的門檻將越來越低,大模型可以為企業(yè)帶來十倍速的提升,但這種提升并不會(huì)立即體現(xiàn)在營(yíng)收上。因此,企業(yè)在接入大模型時(shí)需要權(quán)衡好ROI,確保大模型能夠?yàn)槠髽I(yè)帶來實(shí)際的經(jīng)濟(jì)效益。這也是為什么360會(huì)選擇切入數(shù)字員工領(lǐng)域的原因,企業(yè)應(yīng)該先打造一支具備數(shù)字化思維的“AI鐵軍”,率先建起一支懂AI的團(tuán)隊(duì),或許才能在未來商業(yè)戰(zhàn)場(chǎng)上提前占據(jù)有利地勢(shì)。一邊是百年之未有之大變局;另一邊,大模型應(yīng)用也面臨著一些挑戰(zhàn),如數(shù)據(jù)安全、成本控制和技術(shù)門檻等。尤其對(duì)于中小企業(yè)而言,如何在保證效果的前提下降低使用成本是一個(gè)亟待解決的問題。基于此,360提出了“人工+大模型知識(shí)庫(kù)+AI”的組合策略,確保數(shù)據(jù)安全的同時(shí),還能大大降低企業(yè)自建大模型的成本。如今的大模型已經(jīng)成為企業(yè)提高效率的新利器,資本、用戶和場(chǎng)景都發(fā)生了翻天覆地的變化,如果仍然堅(jiān)持過去的產(chǎn)品和項(xiàng)目,那么回報(bào)率肯定會(huì)大打折扣。企業(yè)如何擁抱新技術(shù),不斷提升自身的數(shù)字化能力,以應(yīng)對(duì)市場(chǎng)競(jìng)爭(zhēng)帶來的挑戰(zhàn)呢?在明天(9月20日)的AIGC大會(huì)上,我們邀請(qǐng)了梁志輝一起來現(xiàn)場(chǎng)交流,歡迎你在文末報(bào)名或點(diǎn)擊菜單欄報(bào)名,到時(shí)一起面對(duì)面交流更多。接下來,讓我們回到對(duì)話現(xiàn)場(chǎng),聽聽360 AI大模型的落地與實(shí)踐,或許會(huì)給您在AI布局上帶來新的參考。如下,Enjoy:360 集團(tuán)副總裁、N 世界負(fù)責(zé)人梁志輝01
巨變:局部10倍速增長(zhǎng)
360開始“猛撲”AI數(shù)字員工
見實(shí):接入大模型后,企業(yè)效率普遍提升多少?市場(chǎng)反饋如何?
梁志輝:市場(chǎng)對(duì)AI的歡迎程度實(shí)際上比我們想象的更強(qiáng)烈。今年3月,Chat GPT引發(fā)AI浪潮之初,大眾對(duì)AI有一種科幻的想象。我們切身的體會(huì)是,因?yàn)榇竽P蜆I(yè)務(wù)我們接觸了很少遇到的化工企業(yè)客戶。技術(shù)變革的同時(shí),也涌現(xiàn)了一批在長(zhǎng)尾端的高價(jià)值客戶。據(jù)觀察,接入AI后,以前 4 個(gè)人的工作可能只需要1人就能完成,這意味著,企業(yè)可以吞吐更大規(guī)模的業(yè)務(wù)量。然而,實(shí)際情況可能并不樂觀,更多老板可能會(huì)選擇先優(yōu)化員工,雖然沒有通過AI接到更多訂單,但起碼可以通過AI降低企業(yè)員工成本。我們內(nèi)部有一種觀點(diǎn):AI是企業(yè)的發(fā)展優(yōu)先權(quán)。以前,采用數(shù)字化工具可以顯著提高企業(yè)績(jī)效和效率,現(xiàn)在輪到AI領(lǐng)域。大模型讓我們學(xué)會(huì)重新審視現(xiàn)有業(yè)務(wù)。在內(nèi)容理解方面,AI可以幫我們提高十倍工作效率,但企業(yè)營(yíng)收是否會(huì)因?yàn)榫植?0倍速增長(zhǎng)而增長(zhǎng),依然需要一段時(shí)間檢驗(yàn)。見實(shí):無論企業(yè)大小,接入AI技術(shù)的門檻在逐漸降低,你認(rèn)為企業(yè)未來的決勝點(diǎn)會(huì)偏向于哪?產(chǎn)品、服務(wù)還是品牌?
梁志輝:誠(chéng)然,技術(shù)壁壘已經(jīng)被打破,很多開源軟件和社區(qū)。企業(yè)如何快速建立“收入增長(zhǎng)飛輪”以及如何通過AI構(gòu)建更加高效的組織協(xié)同和作戰(zhàn)能力變得非常重要。
一方面是商業(yè)模式的創(chuàng)新,另一方面則是向內(nèi)看組織協(xié)同能力。這也是為什么360會(huì)切入數(shù)字員工的原因,只有員工率先完成AI能力的升級(jí),只有一支具備數(shù)字化思維的“AI鐵軍”才能在未來的商業(yè)戰(zhàn)場(chǎng)上更快占領(lǐng)優(yōu)勢(shì)地位。見實(shí):360 布局大模型業(yè)務(wù)是何時(shí)開始的?定位是怎樣的?
梁志輝:實(shí)際上,360很早就開始涉足人工智能領(lǐng)域,特別是深度人工智能領(lǐng)域,2016年開始組建360人工智能研究院。今年3月29號(hào)正式發(fā)布360AI大模型,按照我們創(chuàng)始人當(dāng)時(shí)的說法——把剛出生的孩子抱出來讓大家看看。
今年5月,360發(fā)布了針對(duì)to B市場(chǎng)的千億通用大模型,并在多個(gè)行業(yè)成功落地應(yīng)用,尤其是企業(yè)數(shù)字員工方面的應(yīng)用,是當(dāng)前的主營(yíng)業(yè)務(wù);到了六七月份,發(fā)布360大模型行業(yè)聯(lián)盟以及企業(yè)大模型解決方案。目前,以“企業(yè)數(shù)字員工”為出發(fā)點(diǎn),我們已經(jīng)組建了面向To B和To C兩個(gè)不同領(lǐng)域的大模型團(tuán)隊(duì)進(jìn)行研究。其中To B業(yè)務(wù)中的AI數(shù)字人和AI數(shù)字員工等生成式AI產(chǎn)品是當(dāng)前開發(fā)的主力軍。不僅如此我們也有部分 To G 業(yè)務(wù),也會(huì)有和合作伙伴共同完成一些垂直大模型,基本上覆蓋了大模型領(lǐng)域的上中下游,但“安全”依舊是360的核心關(guān)鍵詞。見實(shí):和同類型通過大模型技術(shù)做數(shù)字員工的企業(yè)相比,360作為協(xié)同領(lǐng)域的新人具備哪些優(yōu)勢(shì)?
梁志輝:一直以來,360占據(jù)著國(guó)內(nèi)辦公電腦最大的市場(chǎng)份額,具備C端應(yīng)用場(chǎng)景與B端安全經(jīng)驗(yàn),如,360安全導(dǎo)航首頁(yè)、瀏覽器搜索等這幾個(gè)主要產(chǎn)品為我們帶來了大量的關(guān)注量和使用量。
上周,我們發(fā)布了AI瀏覽器和AI搜索功能。在這個(gè)過程中,潛移默化的讓 C 端用戶通過低成本甚至免費(fèi)的方式使用大模型的技術(shù),B端企業(yè)也可以通過性價(jià)比更高的SaaS解決方案,選擇月租的方式完成大模型商用。02
實(shí)踐:高效自建大模型
“人+知識(shí)庫(kù)+AI”三方協(xié)同
見實(shí):在 To B業(yè)務(wù)的數(shù)字員工業(yè)務(wù)中,必定會(huì)涉及大量企業(yè)內(nèi)部文檔或數(shù)據(jù),數(shù)據(jù)安全問題是否會(huì)成為影響效率的阻力?你們是如何解決的?
梁志輝:確實(shí)會(huì)涉及到,但也要看企業(yè)的性質(zhì)。我們會(huì)分三類企業(yè)來看:
一是,絕大多數(shù)中小企業(yè),他們可能沒有太多機(jī)密數(shù)據(jù),也不會(huì)把銷售數(shù)據(jù)放入大模型進(jìn)行計(jì)算,這類企業(yè),只要提供一個(gè)專有的數(shù)據(jù)空間,實(shí)現(xiàn)數(shù)據(jù)隔離即可。二是,規(guī)模較大的企業(yè),一般都有自己的信息安全管理規(guī)定和內(nèi)部要求,他們不太可能將內(nèi)部數(shù)據(jù)存儲(chǔ)在公共云上,即使是專有云環(huán)境也有疑慮。因此,我們會(huì)提供一個(gè)“大模型知識(shí)庫(kù)”解決方案。企業(yè)可以將所有需要大模型處理和訪問的數(shù)據(jù)放入這個(gè)知識(shí)庫(kù)中,這個(gè)知識(shí)庫(kù)可以在企業(yè)內(nèi)部環(huán)境中部署為云服務(wù),僅在提問時(shí)才與大模型進(jìn)行部分交互。從成本角度看,配置獨(dú)立的大模型推理節(jié)點(diǎn)成本相對(duì)較高(一臺(tái)約150萬(wàn)),并且一臺(tái)推理節(jié)點(diǎn)通常無法滿足所有需求,知識(shí)庫(kù)的中轉(zhuǎn)策略是相對(duì)而言“高質(zhì)價(jià)比”的解決方案。三是,高度保密的企業(yè),原則上他們連簡(jiǎn)單的交互也是不允許的,在這種情況下,我們會(huì)提供一個(gè)相對(duì)低成本的獨(dú)立大模型推理節(jié)點(diǎn),并與大模型工具捆綁銷售。見實(shí):企業(yè)需要提供多大數(shù)據(jù)量才能實(shí)現(xiàn)智能化?接入大模型并使其運(yùn)行,需要多長(zhǎng)時(shí)間?
梁志輝:我們?cè)鵀橐患覍?duì)數(shù)據(jù)保密要求極高的企業(yè)提供服務(wù),大約花費(fèi)了一個(gè)半月時(shí)間,對(duì)于企業(yè)級(jí)的大項(xiàng)目而言,時(shí)間周期剛剛好。
數(shù)據(jù)量的需求因企業(yè)需求不同而異,對(duì)于某些具體任務(wù),如營(yíng)銷寫稿,可能提供3篇文章即可;但對(duì)于大型企業(yè)的數(shù)據(jù)協(xié)同,那可能就需要提供數(shù)萬(wàn)份文檔。見實(shí):那如果想達(dá)到Chat GPT的智能水平,需要滿足哪些硬性或軟性要求?
梁志輝:國(guó)內(nèi)大模型目前基本都是自研,備案制度也已經(jīng)不允許套殼。所以,在具體應(yīng)用中,你可能發(fā)現(xiàn)國(guó)內(nèi)產(chǎn)品不如海外產(chǎn)品,這背后至少受三方面影響:
一是,缺乏對(duì)大規(guī)模超算中心的運(yùn)營(yíng)和管理經(jīng)驗(yàn)。算法實(shí)際上是開源的,大家缺少的是實(shí)際經(jīng)驗(yàn),使用1000張顯卡與1萬(wàn)張顯卡會(huì)產(chǎn)生完全不同的問題,所需的基礎(chǔ)計(jì)算中心架構(gòu)也會(huì)有所不同,這些經(jīng)驗(yàn)只能通過實(shí)踐來積累。因此,懂得如何構(gòu)建硬件架構(gòu)以支持上千甚至上萬(wàn)張顯卡的人才就變得非常重要,這方面知識(shí)國(guó)內(nèi)廠商仍然需要多交學(xué)費(fèi),多實(shí)踐才能掌握,只要有一個(gè)人掌握了關(guān)鍵知識(shí),國(guó)內(nèi)的學(xué)習(xí)速度會(huì)很快。二是,數(shù)據(jù)因素。Chat GPT的確有先發(fā)優(yōu)勢(shì),他們的數(shù)據(jù)訓(xùn)練樣本是國(guó)內(nèi)廠商望塵莫及的,國(guó)內(nèi)的優(yōu)勢(shì)是離用戶場(chǎng)景更近。實(shí)際上,大模型訓(xùn)練數(shù)據(jù)量并不是越多越好,而是數(shù)據(jù)質(zhì)量越高越好,一些高質(zhì)量的文本,如代碼、論文和法律文書,才是真正能提升大模型邏輯推理能力的內(nèi)容。有些人可能誤以為百度貼吧或知乎上的內(nèi)容是高質(zhì)量數(shù)據(jù),但在實(shí)際操作中,這些平臺(tái)可能包含大量不相關(guān)的信息,對(duì)大模型的邏輯處理能力無益,即便是知乎內(nèi)容,很多內(nèi)容也算不上高質(zhì)量。還有一部分人會(huì)拿聊天對(duì)話來訓(xùn)練,也是非常低效的,聊天記錄可以幫助大模型獲得更加口語(yǔ)化的表達(dá),但無法真正拿來解決問題。核心原因是人與人之間的對(duì)話往往是主觀無邏輯的,AI很難梳理出背后的對(duì)話邏輯,除非單人的樣本量足夠大,但這依舊很難實(shí)現(xiàn)。曾經(jīng)有一個(gè)AI聊天機(jī)器人在上線后,由于接受了推特和Facebook中大量負(fù)面評(píng)論的訓(xùn)練數(shù)據(jù),幾天后它學(xué)會(huì)了說不當(dāng)言論并采取了不當(dāng)行為。三是,沒有足夠多的顯卡資源,AI算法高度依賴高端顯卡,設(shè)備采買的價(jià)格比以前從事計(jì)算和存儲(chǔ)密集型數(shù)據(jù)中心的設(shè)備要高出大約5到10倍。所以,大家都在關(guān)注“國(guó)產(chǎn)高容量顯卡”的研發(fā)進(jìn)度,一旦研發(fā)出來,成本將大幅度降低,國(guó)內(nèi)AI 大模型的進(jìn)展將實(shí)現(xiàn)質(zhì)的飛躍。我們非常期待華為能降低這方面的價(jià)格,或者隨著其他中國(guó)廠商加入,能否將價(jià)格降低一半或降至四分之一,這一天的到來令人期待。見實(shí):目前,大模型處理哪些工作會(huì)比較低效?
梁志輝:大模型在內(nèi)容生成和理解方面,比我們見過的所有技術(shù)方案都強(qiáng)大很多,但如果要讓大模型完成一些類似信息抽取能力或者強(qiáng)大推理能力的工作,目前來說僅靠大模型的一次交互是無法實(shí)現(xiàn)的。
比如我讓大模型編寫一份行業(yè)研究報(bào)告,如果人工操作,大約能拆出1000 多步,如果讓大模型通過Auto GPT的方式進(jìn)行推理拆解,分步執(zhí)行,可能處理一半時(shí)就會(huì)斷掉,AI很難理解這1000多步的內(nèi)在邏輯,以至于直接中斷生成。尤其在大模型“幻覺”問題上,當(dāng)你問它一個(gè)問題時(shí),它可能會(huì)“不懂裝懂”,編一個(gè)新故事來回答你。例如,我嘗試過讓GPT幫我推薦北京飯館,他就編了一些我從未聽過的地方,實(shí)際上是杭州飯店,這里就出現(xiàn)了一種幻覺。見實(shí):為什么會(huì)出現(xiàn)幻覺?
梁志輝:主要是大模型基于的是大量語(yǔ)料進(jìn)行訓(xùn)練,但大量語(yǔ)料無法與搜索引擎相比。引擎是基于現(xiàn)實(shí)世界,有人真正寫過。
盡管有很多事實(shí)信息,但我們會(huì)發(fā)現(xiàn)大模型在涉及到一些他不了解的事實(shí)信息時(shí),會(huì)立即開始胡編。想讓大模型完成復(fù)雜任務(wù),僅靠一個(gè)prompt 是無法實(shí)現(xiàn)的,即使給出一個(gè)可編程的解決方案,大模型在一次交互中仍然無法解決問題。所以,我們正在考慮通過AI Agent(人工智能代理,一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。比如,告訴AI Agent幫忙下單一份外賣,它就可以直接調(diào)用 APP 選擇外賣,再調(diào)用支付程序下單支付,無需人類去指定每一步的操作。)的解決方案,讓大模型專注于他最擅長(zhǎng)的事。見實(shí):這種 AI“幻覺”可能是大量數(shù)據(jù)“涌現(xiàn)”出的結(jié)果,但有時(shí)這種“涌現(xiàn)”數(shù)據(jù)反倒成了冗余信息,這么理解對(duì)嗎?另外,請(qǐng)您具體展開講講360在AI Agent方面的實(shí)踐。
梁志輝:是的,如果無法解決“幻覺”問題,企業(yè)貿(mào)然接入大模型的風(fēng)險(xiǎn)會(huì)很大,360在對(duì)抗大模型幻覺或推理能力不足的方式是采用AI Agent的方式來處理,也就是先把整個(gè)項(xiàng)目“人為劃分出詳細(xì)的工作流”,讓大模型執(zhí)行工作流中每個(gè)子任務(wù),我們只要教大模型學(xué)會(huì)調(diào)用外部搜索、計(jì)算以及其他工具即可,發(fā)揮了大模型最擅長(zhǎng)的部分。
基于事實(shí)信息進(jìn)行總結(jié),提供更優(yōu)質(zhì)的語(yǔ)料,且是一件非常具體的事,那么99.9%的情況下,大模型的表現(xiàn)都會(huì)特別穩(wěn)定,底層思維就是把大項(xiàng)目拆分成小項(xiàng)目,把小項(xiàng)目拆分成具體步驟來處理。比如,做一份旅游規(guī)劃,你可以讓AI同時(shí)打開200個(gè)網(wǎng)頁(yè),讓它快速理解,并同時(shí)讓他總結(jié)涉及到的內(nèi)容深層部分,包括搜索關(guān)鍵詞,閱讀網(wǎng)頁(yè)內(nèi)的所有內(nèi)容,如攜程、機(jī)票等。至于如何實(shí)時(shí)抓取動(dòng)態(tài)的航班信息,我們可以通過調(diào)用第三方API,讓大模型在規(guī)定的流程中執(zhí)行準(zhǔn)確的分支跳轉(zhuǎn)即可。這其實(shí)還催生了一個(gè)有趣的現(xiàn)象,就是企業(yè)內(nèi)部可以自定義工作流,員工之間可以把做好的工作流分享給彼此。這意味著,以后AI Native APP可能不一定是現(xiàn)在移動(dòng)端的APP,它可以是一個(gè)用于Agent 的工作流。這個(gè)工作流已經(jīng)把大模型要做的事的工作流程和框架穩(wěn)定下來,那它就可以幫你很穩(wěn)定處理需要幾百步才能完成的任務(wù),這在我們內(nèi)部的測(cè)試效果非常好。整個(gè)過程中,我們希望用戶不要寫 prompt,只有基于我的低代碼平臺(tái),就能建立起自己的大模型。就像是小學(xué)生使用的編程軟件,在配置大模型工作流的過程中,您只需添加一些控件和框架,無需具體編寫具體代碼,通過拖拽幾個(gè)邏輯運(yùn)算點(diǎn),大模型就可以按照指定步驟完成任務(wù)。03
趨勢(shì):大模型下一個(gè)拐點(diǎn)
或在半年內(nèi)到來
見實(shí):一派聲音是“無AI不投資”,另一派則認(rèn)為早期AI項(xiàng)目的風(fēng)險(xiǎn)太高,必須先賺到錢才能投,對(duì)此您怎么看?
梁志輝:國(guó)內(nèi)和國(guó)外要分開看,國(guó)外許多產(chǎn)品已經(jīng)從流量和收入方面取得了很好的成績(jī);國(guó)內(nèi)To B端則集中在營(yíng)銷和辦公領(lǐng)域,To C個(gè)人付費(fèi)用戶的意愿相對(duì)較低,C端用戶往往需要的是情感陪伴方向,真正實(shí)現(xiàn)這些需求還是有很大挑戰(zhàn)的。
一是,對(duì)于深處AI賽道的企業(yè)而言,不要舍本求末做一款強(qiáng)AI產(chǎn)品,而要學(xué)會(huì)用AI解決實(shí)際問題。AI提高效率有其優(yōu)勢(shì),但必須確保與現(xiàn)有業(yè)務(wù)和需求結(jié)合,不脫離實(shí)際才是根本。二是,積極擁抱新事物,從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)的變革,當(dāng)前整個(gè)市場(chǎng)正在發(fā)生大的變革,正如當(dāng)初從塞班到安卓系統(tǒng)的轉(zhuǎn)變,甚至很快就可能出現(xiàn)“iPhone時(shí)刻”,如果資本、用戶和整個(gè)使用場(chǎng)景都發(fā)生了變化,企業(yè)仍然堅(jiān)持過去的產(chǎn)品和項(xiàng)目,回報(bào)率肯定會(huì)大大折扣。見實(shí):這會(huì)是一場(chǎng)正和游戲還是零和游戲?會(huì)出現(xiàn)一家獨(dú)大嗎?
梁志輝:我不認(rèn)為會(huì)一家獨(dú)大,AI大模型的市場(chǎng)很大,國(guó)內(nèi)C端市場(chǎng)競(jìng)爭(zhēng)尤為激烈。未來,每個(gè)行業(yè)都可能會(huì)有自己的大模型,有各自的開源算法和數(shù)據(jù),但仍需要時(shí)間來調(diào)優(yōu)以確保數(shù)據(jù)算力和用戶效果。
國(guó)內(nèi)的廠商今年已經(jīng)真正下場(chǎng),需要時(shí)間來適應(yīng)新技術(shù)。見實(shí):也就意味著大模型并不存在先發(fā)優(yōu)勢(shì)?
梁志輝:實(shí)際上,盡管市面有大量數(shù)據(jù)可用于訓(xùn)練,但如果你無法獲得垂直領(lǐng)域的精準(zhǔn)數(shù)據(jù),那么大模型仍然只是一個(gè)剛剛?cè)胄械男率?,就像是一個(gè)剛畢業(yè)的高考狀元,依舊不懂如何開中藥。
如果對(duì)于某些特定領(lǐng)域的專業(yè)知識(shí)不足,很難真正產(chǎn)生價(jià)值,數(shù)據(jù)本身就是一個(gè)壁壘。能夠提供精確有效的高質(zhì)量數(shù)據(jù),這將成為大模型能力的一個(gè)關(guān)鍵因素。例如,一些法院的判例是否公開數(shù)據(jù)?如果你想建立一個(gè)法律大模型,如果這些案例數(shù)據(jù)不可獲得,就會(huì)成為一個(gè)難以逾越的壁壘?見實(shí):是否會(huì)“涌現(xiàn)”出新的商業(yè)模式?
梁志輝:確實(shí)有可能發(fā)生重大變革,比如,訂閱方式就是最直接的變化。過去,無論是銷售軟件還是訂閱服務(wù),都與時(shí)間相關(guān)。
現(xiàn)在,技術(shù)計(jì)價(jià)單位不再是按月定價(jià),而是按照計(jì)算能量點(diǎn)和算力券等方式,如果你希望更快獲得更多結(jié)果,需要支付更多費(fèi)用,而不再像以前那樣采用固定費(fèi)用或存儲(chǔ)空間來計(jì)費(fèi)。見實(shí):你認(rèn)為國(guó)內(nèi)大模型會(huì)在什么時(shí)候迎來下一個(gè)拐點(diǎn)?
梁志輝:從實(shí)際情況來看,文生文的大語(yǔ)言模型,無論是訓(xùn)練工具還是相應(yīng)的內(nèi)容都不容樂觀。GPT雖然在開源過程中表現(xiàn)良好,但中途又關(guān)閉了開源。
慶幸的是,今年7月18日,Meta發(fā)布了開源大模型 LLaMA 2,性能接近GPT3.5,預(yù)訓(xùn)練模型在2萬(wàn)億tokens以上,精調(diào)Chat 模型是在100萬(wàn)人類標(biāo)記數(shù)據(jù)上訓(xùn)練的。目前,如果一家公司想要做成一個(gè)大語(yǔ)言模型,需要備案大約1000臺(tái)服務(wù)器,還要高薪招聘工程師來撰寫大型訓(xùn)練文件,成本實(shí)在太高了。不過,我們也看到一個(gè)向好的現(xiàn)象:比如,自然語(yǔ)言處理和圖像處理的領(lǐng)域,已經(jīng)具備了足夠多的工具和標(biāo)準(zhǔn)化云產(chǎn)品,幾乎人人都能構(gòu)建自己簡(jiǎn)易的大模型;再比如,現(xiàn)在最火的“煉丹師”(深度學(xué)習(xí)領(lǐng)域的AI研究員)還不是上班族,很可能是一群高中或初中生,他們?cè)敢鉃樽约簾釔鄣亩卧獎(jiǎng)勇钊胙芯浚⒊D昊钴S在QQ討論群里。一旦有一個(gè)開源工具或社區(qū),發(fā)展速度就會(huì)超越由幾個(gè)大公司壟斷的狀態(tài),在這種情況下,行業(yè)發(fā)展會(huì)更加迅速,這個(gè)狀態(tài)可能不需要一年,大約半年就可以實(shí)現(xiàn),加上不斷加強(qiáng)的開源大語(yǔ)言模型,未來可期!
-
END
-
聲明:本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表牛片立場(chǎng)。轉(zhuǎn)載此文是出于傳遞更多信息之目的。若有來源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時(shí)更正、刪除,謝謝。
-
原創(chuàng) 唐露堯 https://mp.weixin.qq.com/s/rU6YYm2jVTli8NbvttZVxQ
表情
添加圖片
發(fā)表評(píng)論