本發(fā)明屬于社交網(wǎng)絡(luò),具體涉及一種基于反事實(shí)推理的社交網(wǎng)絡(luò)知識(shí)感知推薦方法、程序、系統(tǒng)及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在這個(gè)信息過(guò)載時(shí)代,推薦系統(tǒng)(recsys)已成為方便用戶獲取信息的基礎(chǔ)服務(wù)。從早期的淺層模型[koren?y,bell?r,volinsky?c.matrix?factorization?techniquesfor?recommender?systems[j].computer,2009,42(8):30-37.],到近期以深度學(xué)習(xí)為基礎(chǔ)的模式[covington?p,adams?j,sargin?e.deep?neural?networks?for?youtuberecommendations[c]//proceedings?ofthe10th?acm?conference?on?recommendersystems.new?york,ny,usa:association?for?computing?machinery,2016:191-198.],再到基于圖神經(jīng)網(wǎng)絡(luò)[ying?r,he?r,chen?k,et?al.graph?convolutional?neural?networksfor?web-scale?recommender?systems[c]//proceedings?ofthe?24th?acmsigkddinternational?conference?on?knowledge?discovery&data?mining.new?york,ny,usa:association?for?computing?machinery,2018:974-983.]的最新模型,推薦系統(tǒng)中技術(shù)與模型一直都在飛速發(fā)展。在一般情況下,推薦系統(tǒng)的目標(biāo)是通過(guò)對(duì)用戶歷史行為和采集到的用戶信息、項(xiàng)目屬性或者其他上下文信息進(jìn)行擬合,以了解用戶的喜好。這里的數(shù)據(jù)來(lái)源主要是已有歷史數(shù)據(jù),并在較大程度上受到推薦策略的影響。接著,推薦系統(tǒng)對(duì)項(xiàng)目候選池進(jìn)行篩選,篩選出滿足用戶個(gè)性化偏好與要求的項(xiàng)目。在部署完成之后,該系統(tǒng)將在運(yùn)行中采集新數(shù)據(jù)并對(duì)模型進(jìn)行更新,這樣,整個(gè)框架就構(gòu)成了反饋循環(huán)。
2、推薦系統(tǒng)的算法一般分為兩種:基于用戶的協(xié)同過(guò)濾和基于內(nèi)容的協(xié)同過(guò)濾。基于用戶的協(xié)同過(guò)濾算法是基于用戶的歷史行為數(shù)據(jù)和其他用戶的行為數(shù)據(jù),來(lái)分析用戶的興趣和需求。基于內(nèi)容的協(xié)同過(guò)濾算法則是基于推薦的內(nèi)容的特征,來(lái)分析用戶的興趣和需求。推薦系統(tǒng)的研究一直是機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的熱門(mén)課題,并且不斷有新的算法和技術(shù)被提出。隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,推薦系統(tǒng)也在不斷演進(jìn)和完善。
3、當(dāng)今推薦系統(tǒng)的基礎(chǔ)是對(duì)相關(guān)性進(jìn)行建模,例如協(xié)同過(guò)濾中的行為相關(guān)性、特征-特征相關(guān)性或特征-行為相關(guān)性。由于遵循相關(guān)性驅(qū)動(dòng)的范式,現(xiàn)有的推薦系統(tǒng)仍然存在嚴(yán)重的瓶頸。具體來(lái)說(shuō),面臨的主要問(wèn)題包括:
4、(1)數(shù)據(jù)偏差問(wèn)題。推薦系統(tǒng)所收集的數(shù)據(jù)是觀察性的,而非實(shí)驗(yàn)性的,例如最重要的用戶-項(xiàng)目交互數(shù)據(jù)。這可能導(dǎo)致包括從眾偏差、流行偏差等在內(nèi)的偏差[魏甜甜,陳莉,范婷婷,等.結(jié)合項(xiàng)目流行度加權(quán)的協(xié)同過(guò)濾推薦算法[j].計(jì)算機(jī)應(yīng)用研究,2020,37(3):676-679.]。這使得推薦系統(tǒng)期望的模型同時(shí)學(xué)習(xí)了用戶偏好以及數(shù)據(jù)偏差,最終導(dǎo)致推薦性能較差。
5、(2)數(shù)據(jù)稀疏問(wèn)題。推薦系統(tǒng)中所需的數(shù)據(jù)受到收集過(guò)程的限制,使得數(shù)據(jù)可能存在稀疏問(wèn)題。例如,盡管有大規(guī)模的項(xiàng)目池,但用戶只與一小部分項(xiàng)目進(jìn)行交互,這意味著無(wú)法收集大量未觀察到的用戶-項(xiàng)目反饋。此外,有時(shí)觀察到的反饋是不準(zhǔn)確的,不能反映用戶的實(shí)際滿意度,例如用戶在一次購(gòu)物后留下了差評(píng),說(shuō)明所推薦的商品雖然吸引了用戶點(diǎn)擊和下單,但最終用戶對(duì)商品是不滿意的。
6、(3)超準(zhǔn)確率問(wèn)題。除了準(zhǔn)確性之外,推薦系統(tǒng)還應(yīng)該考慮其他目標(biāo),例如公平性、可解釋性、透明度等。提高這些超出準(zhǔn)確率的目標(biāo)可能會(huì)導(dǎo)致推薦準(zhǔn)確率的下降,最終導(dǎo)致兩難境地。例如,考慮用戶行為中多個(gè)驅(qū)動(dòng)原因的模型,基于分離每個(gè)驅(qū)動(dòng)原因和可解釋分析,可以更好地提供準(zhǔn)確和可解釋的推薦。另一個(gè)例子是多樣性,目前存在一種批評(píng)觀點(diǎn)是推薦系統(tǒng)把用戶困在了充滿同質(zhì)化內(nèi)容的“信息繭房”內(nèi),但如果只注重推薦的多樣性,可能會(huì)無(wú)法滿足用戶的需求,如何平衡同質(zhì)化內(nèi)容和多樣化內(nèi)容的推薦頻次是一個(gè)難題。
7、以上問(wèn)題大多出自同一個(gè)原因,即對(duì)相關(guān)性學(xué)習(xí)的高度依賴。事實(shí)上,現(xiàn)實(shí)世界是由因果關(guān)系而不是相關(guān)性驅(qū)動(dòng)的,而相關(guān)性并不意味著因果關(guān)系。從形式上講,因果關(guān)系可以定義為原因和結(jié)果兩部分,其中原因?qū)Y(jié)果有部分影響[yao?l,chu?z,li?s,et?al.asurvey?on?causal?inference[j].acm?transactions?on?knowledge?discovery?fromdata,2021,15(5):74:1-74:46.]。推薦系統(tǒng)中廣泛存在兩種因果關(guān)系,用戶方面和交互方面。用戶方面的因果關(guān)系是指用戶的決策過(guò)程是由因果關(guān)系驅(qū)動(dòng)的。例如,用戶可能在買(mǎi)了手機(jī)后又買(mǎi)了充電器,前者可以作為后者的原因,這種因果關(guān)系是不可逆的。交互方面的因果關(guān)系是指推薦策略在很大程度上影響用戶與系統(tǒng)的交互。例如,未被觀察到的用戶-項(xiàng)目交互并不意味著用戶不喜歡該項(xiàng)目,這可能只是由于項(xiàng)目未曝光給用戶造成的。
8、因果推理是一種推理方法[pearl?j.causal?inference?in?statistics:anoverview[j].statistics?surveys,2009,3:96-146.],它通過(guò)對(duì)因果關(guān)系的分析和理解,從已知的因素和關(guān)系推斷出未知的因素和關(guān)系,主要包含干預(yù)和反事實(shí)推理兩種方法。反事實(shí)推理通過(guò)假設(shè)已知事實(shí)是不同的,從而推斷事物可能發(fā)生的不同結(jié)果,可以通過(guò)設(shè)置反事實(shí)問(wèn)題來(lái)生成原始數(shù)據(jù)中不存在的反事實(shí)數(shù)據(jù)。與相關(guān)性推理不同,因果推理著重于理解因果關(guān)系,即一件事情的發(fā)生是否會(huì)導(dǎo)致另一件事情的發(fā)生,因此,因果推理是一種更為深入和精準(zhǔn)的推理方式。
9、目前,許多推薦系統(tǒng)的研究者正在嘗試通過(guò)精心設(shè)計(jì)因果推理方法,來(lái)解決上面提到的推薦系統(tǒng)存在的問(wèn)題。首先,具有因果關(guān)系的推薦方法可以構(gòu)建因果圖,在因果圖下,大多數(shù)情況下可以將偏差視為混雜因素,并通過(guò)因果推理方法減輕或消除混雜因素的影響。其次,對(duì)于數(shù)據(jù)缺失,反事實(shí)推理方法可以幫助構(gòu)建一個(gè)反事實(shí)世界,從而可以通過(guò)反事實(shí)推理創(chuàng)建缺失數(shù)據(jù)。最后,因果推理可以幫助構(gòu)建可解釋和可控的模型,在此基礎(chǔ)上可以實(shí)現(xiàn)模型本身和推薦結(jié)果的可解釋性。
10、綜上所述,因果推理是一個(gè)有望解決推薦系統(tǒng)當(dāng)前所面臨困難的理論,通過(guò)研究因果推理對(duì)推薦系統(tǒng)的改良可以提高推薦效果和準(zhǔn)確度、解決數(shù)據(jù)稀疏問(wèn)題,且因果推理中的反事實(shí)推理方法在解決推薦系統(tǒng)數(shù)據(jù)方面的問(wèn)題具有獨(dú)特的優(yōu)勢(shì),具有重要的研究?jī)r(jià)值和應(yīng)用前景。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于反事實(shí)推理的社交網(wǎng)絡(luò)知識(shí)感知推薦方法、程序、系統(tǒng)及存儲(chǔ)介質(zhì)。
2、本發(fā)明的目的通過(guò)如下技術(shù)方案來(lái)實(shí)現(xiàn):
3、一種基于反事實(shí)推理的社交網(wǎng)絡(luò)知識(shí)感知推薦方法,具體步驟如下:
4、步驟1:基于用戶與項(xiàng)目交互集合構(gòu)建知識(shí)圖譜,初始化圖神經(jīng)網(wǎng)絡(luò)搭建推薦器;
5、步驟2:反事實(shí)生成器首先選擇導(dǎo)致虛假相關(guān)性的知識(shí)圖譜三元組,并使用馬爾可夫決策過(guò)程來(lái)制定生成過(guò)程;狀態(tài)由當(dāng)前用戶和反事實(shí)項(xiàng)組成,動(dòng)作空間包含所有修改操作;修改操作分為選擇目標(biāo)實(shí)體和替換實(shí)體兩個(gè)步驟,旨在識(shí)別導(dǎo)致虛假關(guān)聯(lián)的屬性實(shí)體并更新反事實(shí)項(xiàng);
6、步驟3:生成策略的每個(gè)修改操作的概率由學(xué)習(xí)參數(shù)和softmax函數(shù)確定;
7、步驟4:獎(jiǎng)賞反饋裝置通過(guò)結(jié)合兩種獎(jiǎng)勵(lì)機(jī)制指導(dǎo)反事實(shí)生成器生成更具信息豐富性和準(zhǔn)確性的反事實(shí)交互;
8、步驟5:推薦器采用歸納式gnn架構(gòu)來(lái)學(xué)習(xí)項(xiàng)目表示,一旦知識(shí)圖譜的結(jié)構(gòu)被修改,生成信號(hào)令反事實(shí)生成器利用局部鄰域信息對(duì)知識(shí)圖譜更新;
9、步驟6:推薦器同時(shí)采用一種轉(zhuǎn)導(dǎo)式gnn架構(gòu)來(lái)聚合來(lái)自用戶-項(xiàng)目交互的信息以學(xué)習(xí)用戶表示,基于整個(gè)圖更新節(jié)點(diǎn)表示,從而減少信息損失;
10、步驟7:最終,基于更新后的用戶與項(xiàng)目之間的匹配分?jǐn)?shù),形成用戶-項(xiàng)目交互的評(píng)分,對(duì)用戶進(jìn)行推薦。
11、進(jìn)一步地,所述步驟2中使用內(nèi)積來(lái)計(jì)算屬性實(shí)體和狀態(tài)之間的分?jǐn)?shù);
12、
13、其中和是可學(xué)習(xí)參數(shù),ea表示目標(biāo)實(shí)體,st∈s表示馬爾可夫過(guò)程在當(dāng)前步驟t中的狀態(tài)。
14、進(jìn)一步地,所述步驟4具體為:
15、步驟4.1:基于信息的獎(jiǎng)賞通過(guò)優(yōu)化信息瓶頸損失,鼓勵(lì)刪除多余的實(shí)體并保留有用的因果實(shí)體;
16、步驟4.2:基于預(yù)測(cè)的獎(jiǎng)賞則利用推薦系統(tǒng)作為鑒別器,評(píng)估反事實(shí)交互的預(yù)測(cè)差異,從而生成提供更多信息的反事實(shí)項(xiàng)。
17、一種基于反事實(shí)推理的社交網(wǎng)絡(luò)知識(shí)感知推薦系統(tǒng),包括反事實(shí)數(shù)據(jù)生成裝置、數(shù)據(jù)篩選裝置、獎(jiǎng)勵(lì)反饋裝置及推薦裝置;
18、所述反事實(shí)數(shù)據(jù)生成裝置,利用馬爾可夫決策過(guò)程框架,在推薦系統(tǒng)中探索潛在的虛假相關(guān)性,生成正面或負(fù)面的反事實(shí)交互;通過(guò)修改知識(shí)圖譜三元組中的項(xiàng)目屬性信息,選擇目標(biāo)實(shí)體并替換為修改實(shí)體,以降低虛假相關(guān)性的影響,并生成每個(gè)修改操作的概率策略。
19、所述數(shù)據(jù)篩選裝置,通過(guò)設(shè)置置信度參數(shù)來(lái)篩選生成的顯式反事實(shí)數(shù)據(jù),減少不準(zhǔn)確的反事實(shí)示例的數(shù)量;
20、所述獎(jiǎng)勵(lì)反饋裝置,基于推薦系統(tǒng)的反饋信號(hào),設(shè)計(jì)并結(jié)合基于信息的獎(jiǎng)勵(lì)和基于預(yù)測(cè)的獎(jiǎng)勵(lì),用于指導(dǎo)反事實(shí)生成器的操作;
21、所述推薦裝置,利用圖神經(jīng)網(wǎng)絡(luò)gnn構(gòu)建推薦器,聯(lián)合學(xué)習(xí)知識(shí)圖譜和用戶-項(xiàng)目交互的信息,以生成項(xiàng)目和用戶的表示,并對(duì)用戶推薦進(jìn)行預(yù)測(cè)。
22、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序/指令,其特征在于:該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)一種基于反事實(shí)推理的社交網(wǎng)絡(luò)知識(shí)感知推薦方法的步驟。
23、一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,其特征在于:該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)一種基于反事實(shí)推理的社交網(wǎng)絡(luò)知識(shí)感知推薦方法的步驟。
24、本發(fā)明的有益效果在于:
25、本發(fā)明能夠在知識(shí)感知推薦模型中加入反事實(shí)推理方法,減輕虛假相關(guān)性對(duì)模型效果的影響,達(dá)到提高模型性能的目標(biāo)。