明略科技何敏:生成式營(yíng)銷落地的六個(gè)體系架構(gòu)思維與三個(gè)前沿方向
2024-10-28
10月11日,明略科技集團(tuán)副總裁、大模型基礎(chǔ)架構(gòu)負(fù)責(zé)人何敏,在2024第八屆營(yíng)銷科學(xué)大會(huì)上了發(fā)表《生成式營(yíng)銷必備的體系架構(gòu)思維和前沿方向》主題演講,深入分享了生成式營(yíng)銷落地的六個(gè)體系架構(gòu)思維與三個(gè)前沿方向。

本文目錄如下:
01 生成式營(yíng)銷落地的六個(gè)體系架構(gòu)思維:
02 生成式營(yíng)銷的三個(gè)前沿方向:
過(guò)去一年,很多企業(yè)做了大量嘗試,我們和企業(yè)交流時(shí)發(fā)現(xiàn)一個(gè)問(wèn)題:做demo的時(shí)候“一馬平川”,一周就可以出效果,但真正落地的時(shí)候“舉步維艱”,半年都上不了線。為了解決這類問(wèn)題,大家的共識(shí)是:生成式營(yíng)銷的落地需要體系架構(gòu)思維。
在人人都可以搭建大模型智能體的時(shí)代,上傳一個(gè)產(chǎn)品文檔,寫一個(gè)prompt,大模型的回答可以做到精準(zhǔn)無(wú)比。當(dāng)產(chǎn)品從一個(gè)變成十個(gè)時(shí),大模型就從精準(zhǔn)無(wú)比變成了胡言亂語(yǔ)。這是什么原因造成的呢?
一句話概括,信息濃度決定問(wèn)答準(zhǔn)確率。
只有一個(gè)產(chǎn)品時(shí),單一產(chǎn)品信息濃度是100%;十個(gè)產(chǎn)品時(shí),單一產(chǎn)品信息濃度會(huì)被稀釋為10%。當(dāng)問(wèn)到A產(chǎn)品信息時(shí),其它產(chǎn)品還會(huì)來(lái)“搗亂”,大模型的準(zhǔn)確率自然而然就下降了。

通過(guò)上面的例子,我們可以思考,精準(zhǔn)問(wèn)答場(chǎng)景,適合采用合庫(kù)思維,還是分庫(kù)思維?
合庫(kù)思維是指把所有的產(chǎn)品放到一個(gè)知識(shí)庫(kù);分庫(kù)思維是指把A產(chǎn)品放在A的知識(shí)庫(kù),B產(chǎn)品放在B的知識(shí)庫(kù),A產(chǎn)品的問(wèn)題到A知識(shí)庫(kù)找,B產(chǎn)品的問(wèn)題到B知識(shí)庫(kù)找。顯然,分庫(kù)思維更適用于精準(zhǔn)問(wèn)答場(chǎng)景。
當(dāng)品牌方進(jìn)行雙十一活動(dòng)策劃時(shí),需要用到各種知識(shí)庫(kù),比如秒針系統(tǒng)有Media的知識(shí)庫(kù),Social的知識(shí)庫(kù),電商、私域、線下廣告的知識(shí)庫(kù)。合庫(kù)思維更適用于創(chuàng)意探索場(chǎng)景,更容易找到創(chuàng)新點(diǎn),生成的報(bào)告也會(huì)更加完整。
總的來(lái)說(shuō),數(shù)據(jù)的組織形式,決定了業(yè)務(wù)效果。

與此同時(shí),數(shù)據(jù)的提取形式,也決定了業(yè)務(wù)效果。

以知識(shí)問(wèn)答為例,一種方式是長(zhǎng)文本問(wèn)答,另一種方式是檢索增強(qiáng)問(wèn)答。
長(zhǎng)文本問(wèn)答,指把100頁(yè)的文檔丟給大模型直接回答;檢索增強(qiáng)問(wèn)答,指從100頁(yè)的文檔中提取2頁(yè)與問(wèn)題相關(guān)的信息丟給大模型。如何在這兩種方式中選擇?主要依賴于企業(yè)的業(yè)務(wù)場(chǎng)景。
長(zhǎng)文本問(wèn)答方式,更適合全文總結(jié)場(chǎng)景。比如總結(jié)100頁(yè)文檔的核心信息,或分析本周周報(bào)與上一周相比的進(jìn)展。
檢索增強(qiáng)問(wèn)答方式,則適用于精準(zhǔn)問(wèn)答。比如100頁(yè)的產(chǎn)品手冊(cè)中包含產(chǎn)品介紹、功效、使用方法、原理、注意事項(xiàng)、售后服務(wù)等。當(dāng)用戶咨詢產(chǎn)品功效時(shí),只需找到相關(guān)的2頁(yè)丟給大模型,無(wú)需閱讀100頁(yè)。它的優(yōu)點(diǎn)是準(zhǔn)確率更高,且成本更低。因?yàn)槿绻喿x100頁(yè)信息,其它98頁(yè)對(duì)相關(guān)的2頁(yè)內(nèi)容反而會(huì)產(chǎn)生干擾。
提到思考系統(tǒng),我們可以聯(lián)想到最近爆火的OpenAI o1模型。OpenAI o1模型在美國(guó)數(shù)學(xué)奧林匹克 (AIME) 預(yù)選賽中躋身美國(guó)前500名學(xué)生之列,在競(jìng)爭(zhēng)性編程問(wèn)題(Codeforces)中百分位排名是89%,并在物理、生物和化學(xué)問(wèn)題 (GPQA) 基準(zhǔn)測(cè)試中超越人類博士級(jí)水平。
為什么它會(huì)獲得這樣好的成績(jī)?原因是o1采用了體系思考的模式。在訓(xùn)練與推理階段,思考計(jì)算的時(shí)間越長(zhǎng),模型的準(zhǔn)確率就會(huì)越高。

同時(shí),o1模型的發(fā)布將《思考:快與慢》這本書帶入大眾視野。書中提到人類有兩種思考模式,分別是系統(tǒng)1和系統(tǒng)2。系統(tǒng)1指的是快思考,類似于直覺(jué)思考;系統(tǒng)2指的是慢思考,是有意識(shí)、深思熟慮的思考。就像我們解最后一道數(shù)學(xué)大題時(shí),要理解問(wèn)題、分析問(wèn)題、拆解步驟,進(jìn)行推理,才能得出答案。

接下來(lái),我們就來(lái)介紹與思考系統(tǒng)相關(guān)的體系思維。
還是從最簡(jiǎn)單的選擇題開(kāi)始。讓大模型執(zhí)行分類任務(wù),判斷帖子屬于ABCD哪一類,是做大模型應(yīng)用的常見(jiàn)問(wèn)題。
通過(guò)實(shí)驗(yàn),我們發(fā)現(xiàn)一個(gè)非常有趣的現(xiàn)象:如果先選擇結(jié)論后分析原因,大模型的答案往往飄忽不定,結(jié)論選A,分析后的答案選C;如果先分析原因后選擇結(jié)論,分析與結(jié)論往往一致。這是什么原因造成的?

回到剛才提到的思考系統(tǒng),人類在做一道選擇題時(shí),系統(tǒng)1的思維模式是下意識(shí)地先給結(jié)論,告訴你這道題肯定選A;當(dāng)我們采用系統(tǒng)2的思維,一步步拆解后會(huì)發(fā)現(xiàn)答案應(yīng)該選C。
所以結(jié)論的不一致是因?yàn)槲覀兊拇竽X進(jìn)行了系統(tǒng)1與系統(tǒng)2思維模式的切換。大模型也是類似的道理。基于分析給出結(jié)論,答案的一致性、可靠性會(huì)更好,因?yàn)槭冀K處在同一個(gè)系統(tǒng)思維模式里。

我們經(jīng)常收到企業(yè)市場(chǎng)部的需求,洞察100篇帖子中的內(nèi)容策略。最簡(jiǎn)單的做法是黑盒分析,把這些帖子都丟給大模型。這樣做的好處是速度快,可以做定性分析;缺點(diǎn)是可解釋性較差,難以給出結(jié)論背后的原因。
另一種做法是白盒分析,同樣把100篇帖子丟給大模型,但不輸出總結(jié),而是先輸出ABCD等所有特征,然后通過(guò)小模型采用聚類分析的方法統(tǒng)計(jì)ABCD哪些權(quán)重更高,最后再輸出內(nèi)容策略。白盒分析的好處是可解釋、可回溯。大模型給出的結(jié)果基于ABCD權(quán)重最高的元素而產(chǎn)生,并且還能找到ABCD的原帖進(jìn)行分析。因此,白盒分析更適合做定量、可解釋、可回溯的分析。

前面我們講到數(shù)據(jù)的組織形式、提取形式?jīng)Q定了業(yè)務(wù)的最終效果。同樣地,只有確定了業(yè)務(wù)目標(biāo),才能更好地定義效果、數(shù)據(jù)與訓(xùn)練方法。所以,業(yè)務(wù)優(yōu)先、目標(biāo)優(yōu)先,是更加落地的方式。相比平臺(tái)式的規(guī)劃,在實(shí)戰(zhàn)中,我們通常建議企業(yè)優(yōu)先選擇單點(diǎn)。

在幫助企業(yè)客戶落地的過(guò)程中,我們有四層單點(diǎn)應(yīng)用的業(yè)務(wù)目標(biāo)。

上午場(chǎng)明略科技集團(tuán)創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官吳明輝提到了奧運(yùn)營(yíng)銷大學(xué)生素人發(fā)帖的例子,這些學(xué)生利用明略科技提供的SocialGrow、SocialX、小明助理等AI工具,通過(guò)挖掘奧運(yùn)熱點(diǎn)來(lái)指導(dǎo)創(chuàng)作方向,在生成海量?jī)?nèi)容后,從中挑選出優(yōu)質(zhì)帖發(fā)布,并進(jìn)行了監(jiān)測(cè)與調(diào)優(yōu),形成了一個(gè)正向的創(chuàng)作循環(huán)。

整個(gè)過(guò)程共計(jì)發(fā)布了1237篇帖子,總互動(dòng)量23萬(wàn)+,爆帖率15%。值得注意的是,一些學(xué)生的粉絲只有幾十個(gè),但小紅書單帖互動(dòng)最高做到了7萬(wàn)+,抖音單帖最高互動(dòng)做到了6000+。
通過(guò)上面的例子可以看出,分析和生成結(jié)合起來(lái)更重要。分析的產(chǎn)出可以作為生成的輸入,帶來(lái)更好的內(nèi)容效果。這也是InsightFlow CMS(洞察驅(qū)動(dòng)的內(nèi)容管理平臺(tái))背后的思考邏輯。

生成式營(yíng)銷有很多前沿的研究主線,其中一條,我們可以沿著OpenAI o1模型的思路進(jìn)行探索。o1的發(fā)布引用了OpenAI的一篇文章《Let’s Verify Step by Step》。這篇文章提出了兩種獎(jiǎng)勵(lì)機(jī)制,結(jié)果監(jiān)督的獎(jiǎng)勵(lì)機(jī)制和過(guò)程監(jiān)督的獎(jiǎng)勵(lì)機(jī)制。
通過(guò)這兩種獎(jiǎng)勵(lì)機(jī)制,o1模型在數(shù)學(xué)領(lǐng)域有了大幅提升。我們認(rèn)為,這兩種監(jiān)督獎(jiǎng)勵(lì)方式對(duì)生成式營(yíng)銷的研究也有啟發(fā)。圍繞這個(gè)思路,我們將闡述以下三個(gè)生成式營(yíng)銷的前沿研究方向。

這一研究方向主要借鑒明略科技在ACMMM,以及Adobe在ICLR人工智能頂會(huì)發(fā)布的論文,闡述未來(lái)大模型輸出結(jié)果的豐富性。

目前,大模型輸入的內(nèi)容形態(tài)有視頻、語(yǔ)音、文本,輸出的主要是文本,未來(lái)在營(yíng)銷領(lǐng)域會(huì)有怎樣的變化?
通過(guò)引入感觀指標(biāo)、效果指標(biāo),我們?cè)谪S富大模型輸出維度的同時(shí),還可以輔助企業(yè)優(yōu)化內(nèi)容策略。
這一方向主要借鑒Google DeepMind 8月發(fā)表的兩篇文章。

基于過(guò)程監(jiān)督獎(jiǎng)勵(lì)的驗(yàn)證器,類似媽媽陪我寫作業(yè)場(chǎng)景。相當(dāng)于在生成大模型Generator的基礎(chǔ)上(想象成“孩子寫作業(yè)大模型”),引入一個(gè)新的大模型Verifier(想象成“媽媽陪讀大模型”)。這個(gè)Verifier盯著Generator輸出時(shí),不僅看結(jié)果,還能指出每一步的對(duì)錯(cuò)。因此,基于Verifier的過(guò)程監(jiān)督,生成大模型Generator的成績(jī)就很容易得到提高。

什么叫作最優(yōu)過(guò)程探索策略?
舉個(gè)例子,生成大模型Generator這個(gè)“孩子”解不出題,困在迷宮里了,怎么辦?可以一下子變成七個(gè)葫蘆娃兄弟分身,用不同的思路去解。最厲害的是它還結(jié)合了“媽媽陪讀大模型”Verifier,可以監(jiān)督每一步,幫助孩子在迷宮里找到最優(yōu)策略。打個(gè)比方,大娃走了這條路走不通,媽媽就可以告訴二娃,這條路走不通了,繼續(xù)找新的路,直到七娃最后走出迷宮,這就是最優(yōu)解。

應(yīng)用到營(yíng)銷領(lǐng)域,這個(gè)Verifier相當(dāng)于營(yíng)銷策劃的智囊團(tuán),當(dāng)營(yíng)銷的Generator提供各種營(yíng)銷策劃方案時(shí),Verifier可以幫助我們驗(yàn)證營(yíng)銷的策略、數(shù)據(jù)、邏輯關(guān)系等,同時(shí)找到最佳的營(yíng)銷策略或方法。比如一筆預(yù)算到底選哪些渠道,哪類圈層人群,采用何種內(nèi)容策略,有成千上萬(wàn)種組合,可以在ROI里找到最優(yōu)的路徑。
這一方向主要借鑒斯坦福大學(xué)的STaR和Quiet-STaR兩篇文章。STaR是Self-Taught Reasoner的縮寫,是自學(xué)推理過(guò)程。

我們繼續(xù)前面的比喻,媽媽陪我寫作業(yè)寫了1億次,我變成葫蘆娃兄弟走迷宮走了1億次,我們便積累了1億次的自我反思以及1億次多角度探索的過(guò)程經(jīng)驗(yàn)數(shù)據(jù)。我們可以使用這些過(guò)程數(shù)據(jù),用來(lái)訓(xùn)練大模型Generator,提升“孩子”的體系思考能力。當(dāng)生成大模型自己學(xué)會(huì)獨(dú)立思考之后,就不需要媽媽指導(dǎo),不需要其他六個(gè)兄弟同時(shí)做好多遍題找最終的答案,而是在每次解題過(guò)程中進(jìn)行自我反思和多角度思考,再輸出最終答案。這個(gè)過(guò)程我們稱作思維的內(nèi)隱化,它形成的思維鏈叫作隱式思維鏈。再通俗一點(diǎn),這就是內(nèi)功心法的修煉過(guò)程。

應(yīng)用到營(yíng)銷領(lǐng)域,營(yíng)銷大模型可以學(xué)習(xí)行業(yè)和企業(yè)的各種決策經(jīng)驗(yàn),包括各種A/B Test經(jīng)驗(yàn)數(shù)據(jù),從而給出更加落地的答案。此時(shí)的大模型就像沉淀了行業(yè)最佳實(shí)踐、企業(yè)多年實(shí)戰(zhàn)經(jīng)驗(yàn)和體系架構(gòu)思維的掃地僧,即使簡(jiǎn)單輸出幾十token,實(shí)際上威力無(wú)窮、效果炸裂。因?yàn)槊恳粋€(gè)token輸出的背后都進(jìn)行了大量思考和計(jì)算,其他大模型難以與之相比。類似奧運(yùn)營(yíng)銷發(fā)帖的例子,素人大學(xué)生在體系思考的大模型內(nèi)功心法加持下,也能一招打出成千上萬(wàn)的互動(dòng)效果。
內(nèi)力凝精髓,普招也暴擊!
信息填寫