Sora爆火!多模態(tài)技術(shù)如何影響營銷洞察?
2024-03-26
前段時間,Sora的橫空出世,標(biāo)志著文生視頻大模型的突破性進(jìn)展,進(jìn)一步帶動了多模態(tài)技術(shù)的熱度。
所謂多模態(tài)技術(shù),涉及機(jī)器學(xué)習(xí)和人工智能領(lǐng)域,可以處理和分析文本、圖像、音頻、視頻等多種數(shù)據(jù)類型,并利用不同數(shù)據(jù)類型間的互補(bǔ)信息,提升模型的理解、分析和預(yù)測能力。從初期的單一模態(tài)分析,到模態(tài)融合,再到當(dāng)前的廣泛應(yīng)用與優(yōu)化,已展現(xiàn)出巨大的潛力和廣闊的應(yīng)用前景。
在營銷領(lǐng)域,不僅僅是視頻生成,利用多模態(tài)強(qiáng)大的視頻解析能力,解決日益增長的視頻類內(nèi)容洞察,是當(dāng)下品牌主更值得關(guān)注的核心場景。
隨著社媒熱點、圈層、表達(dá)方式的快速變化,品牌要想獲得消費(fèi)者的認(rèn)可,往往需要對消費(fèi)者進(jìn)行更細(xì)顆粒度的分析,挖掘出潛在需求。在社媒洞察的初始環(huán)節(jié),標(biāo)簽標(biāo)注是否全面準(zhǔn)確,會影響到后面一系列營銷決策的判斷。
秒針系統(tǒng)將標(biāo)簽劃分為穩(wěn)定標(biāo)簽與趨勢標(biāo)簽兩大類型。
穩(wěn)定標(biāo)簽:與產(chǎn)品品質(zhì)、質(zhì)量、功效定義相關(guān)的內(nèi)容標(biāo)簽,此類標(biāo)簽相對穩(wěn)定,不易改動
趨勢標(biāo)簽:與當(dāng)期社媒平臺內(nèi)容流行趨勢、熱點話題、消費(fèi)者需求相關(guān)的內(nèi)容標(biāo)簽
傳統(tǒng)的數(shù)據(jù)解析,要經(jīng)歷人工讀帖、抽取帖子、訓(xùn)練模型,再到對齊為一個固定屬性值的過程。這個固定的屬性值被稱為穩(wěn)定標(biāo)簽,如產(chǎn)品品質(zhì)、質(zhì)量、功效等,優(yōu)點是標(biāo)準(zhǔn)化、覆蓋面廣、可復(fù)用程度高,但同時也存在個性化方面的局限,部分細(xì)節(jié)信息難以被保留下來。
多模態(tài)大模型擁有海量參數(shù),具有強(qiáng)大的泛化能力。基于多模態(tài)大模型識別出來的趨勢標(biāo)簽可以反映出當(dāng)前的流行趨勢、熱點話題、消費(fèi)者需求,說法泛化更廣,敞口更大,既保留了“原汁原味”的表述,又能夠靈活滿足不同品牌多維度、個性化的分析需求。在場景方面,對穩(wěn)定標(biāo)簽作出了有益補(bǔ)充。
針對音頻、文字等顯性信息較少的視頻,多模態(tài)技術(shù)能夠從多個維度科學(xué)提煉出畫面中的隱含信息。相比人工分析,更加全面、系統(tǒng),更能確保一致性。在強(qiáng)調(diào)品牌調(diào)性的創(chuàng)意視頻解析中,可以發(fā)揮出巨大價值。
以下畫面展示了一位女性在雪地里和哈士奇犬互動的場景:
一位女性在雪地里和哈士奇犬互動(圖片由小明助理Copilot生成)
根據(jù)常規(guī)的解析方式,可以得出基于畫面本身的顯性信息:
包含元素:女性,哈士奇犬,雪地,被雪覆蓋的樹木
具體季節(jié):冬季
構(gòu)圖邏輯:圖像中心為一位穿著冬季服裝的女性和一只哈士奇犬,兩者位于畫面的前景,背景是密集的雪覆蓋的樹木,構(gòu)成了一種自然和諧的構(gòu)圖
色彩搭配:圖像以白色(雪)和深色(女性的服裝和狗的毛發(fā))為主,形成了鮮明的對比
通過明略多模態(tài)大語言模型進(jìn)行解析,在顯性信息提取的基礎(chǔ)上,繼續(xù)下鉆,還可實現(xiàn)對隱含信息/開放性特征的識別:
拍攝手法:使用了柔和的光線和較低的視角,可能使用了淺景深來突出前景主體,背景清晰卻不搶眼,營造出一種寧靜的感覺
象征意義:圖像可能象征著人與自然的和諧共處,或者強(qiáng)調(diào)了冬季的純凈與寧靜
整體氛圍:圖像傳達(dá)出一種平和、寧靜的氛圍,同時也有一種親近自然和動物的溫馨感
我們再以O(shè)penAI Sora大模型官方展示的視頻?”一名女子漫步在東京街頭“ 進(jìn)行解析:
一名女子漫步在東京街頭(視頻由Sora生成,此處僅為截圖展示)
常規(guī)解析要素:
人物元素:女性,時尚,皮夾克,紅色裙子,黑色高跟鞋,墨鏡,耳環(huán),黑色手提包
背景元素:繁忙的城市,霓虹燈和商店招牌,雨后濕潤的街道,高樓和各種商店,很多行人
季節(jié)元素:春季或秋季,考慮到女性的著裝和濕潤的街道,這兩個季節(jié)的天氣比較適合穿皮夾克,且可能會有雨
構(gòu)圖邏輯:視頻構(gòu)圖集中在女性主體上,她位于畫面的中心,走在街道的一側(cè);攝影師可能使用了對稱或引導(dǎo)線的構(gòu)圖技巧,利用街道的線條和城市的燈光引導(dǎo)觀眾的視線;女性的位置和姿態(tài)在每個畫面中都有所變化,展現(xiàn)了她在街道上行走的動態(tài)
色彩搭配:以對比鮮明的暖色和冷色為主,女性的紅色衣物與周圍藍(lán)色調(diào)的夜景形成對比;背景的霓虹燈提供了豐富的色彩,增添了都市的活力
明略多模態(tài)大語言模型挖掘到的隱含要素:
拍攝手法:視頻可能使用了穩(wěn)定器或手持穩(wěn)定拍攝技術(shù),保持畫面的平穩(wěn);攝影師可能使用了淺景深來突出主體,使背景稍微模糊,從而聚焦于女性
象征意義:視頻可能在象征城市生活的快節(jié)奏和時尚感;女性的自信步伐和時尚的打扮可能代表了現(xiàn)代都市人的生活態(tài)度和個性表達(dá)
整體氛圍:視頻營造了一種充滿活力的都市夜景氛圍;女性的時尚造型和背后繁華的街道共同傳達(dá)了一種現(xiàn)代、時尚、充滿活力的都市生活感覺
進(jìn)入到洞察環(huán)節(jié),基于多模態(tài)技術(shù)全面、深度的解析,在對不同特征進(jìn)行聚類的過程中,由于前期保留了多樣化的細(xì)節(jié)描述,品牌往往能發(fā)現(xiàn)令人驚喜的“Aha時刻”,收獲意想不到的新鮮洞察。在品牌賣點同質(zhì)化嚴(yán)重的情況下,找到打動消費(fèi)者的新故事。
某品牌在洞察“學(xué)生黨”群體時,通過大模型聚類,得到“眼袋掉到下巴”、“美國作息”等多種來自用戶真實生活的鮮活描述,側(cè)面反映出該群體經(jīng)常熬夜。品牌便可以進(jìn)一步感知到,“學(xué)生黨”在某一特定階段,存在緩解疲勞、改善睡眠等訴求,從而以更接近消費(fèi)者需求、心理的場景切入,開展接下來的營銷動作,為營銷決策提供科學(xué)支撐。
通過多維度特征的交叉、融合,多模態(tài)大模型能夠進(jìn)一步形成“場景豐富”“具象生動”的用戶畫像故事,為海量爆款內(nèi)容生成打好地基,讓每一個從消費(fèi)者那里聽到的聲音,再次抵達(dá)消費(fèi)者心靈,真正解決用戶最迫切的需求。
從執(zhí)行效率來看,以往采用人工模式一個月才能完成的分析與洞察,在多模態(tài)大模型的助力下,一周即可快速完成,準(zhǔn)確率更高,且可回溯。
明略多模態(tài)大語言模型能力展示
超預(yù)期,可落地,更迅速的執(zhí)行效果,意味著多模態(tài)技術(shù)將成為品牌快速讀懂消費(fèi)者的關(guān)鍵,由技術(shù)驅(qū)動的品牌將更快搶占先機(jī)。
明略科技旗下秒針系統(tǒng),依托18年來沉淀下來的大量營銷數(shù)據(jù)與行業(yè)經(jīng)驗,與多模態(tài)技術(shù)實現(xiàn)創(chuàng)新融合,對營銷鏈路中的各個環(huán)節(jié)進(jìn)行了全面的優(yōu)化與重塑。從人群發(fā)現(xiàn)、分析、聚類,到內(nèi)容生成,已形成完整的閉環(huán)。目前,在美妝行業(yè)已率先落地。在生成式營銷的浪潮下,明略科技將助力更多品牌抓住新技術(shù)帶來的寶貴機(jī)會,實現(xiàn)精準(zhǔn)營銷和業(yè)務(wù)增長。
信息填寫