本發(fā)明涉及電解液預(yù)測分析,具體來說,涉及一種面向電解液庫倫效率預(yù)測的定制化模型構(gòu)建方法。
背景技術(shù):
1、新能源電池的發(fā)現(xiàn)與優(yōu)化對緩解氣候變化影響和推動可持續(xù)發(fā)展至關(guān)重要,因為它們具有在所有經(jīng)濟領(lǐng)域加速去碳化的巨大潛力,提高庫侖效率(coulombicefficiency,ce)是采用高能量密度的新能源電池的關(guān)鍵?,F(xiàn)代新能源電池通常使用由一種或多種有機溶劑和鹽添加劑組成的液態(tài)電解液,其配方對庫侖效率有重大影響,然而,電解液成分和比例的組合極其龐大,搜索空間約為1018,且缺乏公認的數(shù)學(xué)分析解決方案,這種復(fù)雜性使得傳統(tǒng)的實驗方法難以全面探索所有可能的配方,化學(xué)研究人員不得不通過耗時的實驗逐一驗證,這不僅效率低下,而且成本高昂;因此,為了大幅減輕研究人員的工作量、加速新型高性能新能源電池的開發(fā)進程,亟需開發(fā)能在大量電解液配方中準(zhǔn)確預(yù)測庫侖效率的創(chuàng)新技術(shù),從而為電池技術(shù)的快速迭代和優(yōu)化提供強有力的支持,推動整個新能源產(chǎn)業(yè)的發(fā)展。
2、傳統(tǒng)的電解液庫侖效率預(yù)測技術(shù)主要基于機器學(xué)習(xí)方法,通過回歸等監(jiān)督學(xué)習(xí)模型來實現(xiàn),這些模型將電解液成分的選擇性特征(如氧化還原電位、介電常數(shù)、離子電導(dǎo)率和元素組成)作為輸入,輸出預(yù)測的庫侖效率。近年來,大型語言模型在理解復(fù)雜化學(xué)表征方面取得了顯著進展,目前較為有效的技術(shù)方案通常采用兩階段框架:首先在大型無標(biāo)注數(shù)據(jù)集上進行預(yù)訓(xùn)練,然后在特定下游任務(wù)上進行微調(diào);例如,多模態(tài)分子形態(tài)轉(zhuǎn)換器(multimodal-molformer)在預(yù)訓(xùn)練階段利用從無標(biāo)注語料庫中學(xué)到的大量化學(xué)信息,并允許將簡化分子輸入線性表示法(simplifiedmolecular?input?line?entrysystem,smiles)格式的多個分子作為輸入,以預(yù)測電解液的庫侖效率。
3、然而,現(xiàn)有技術(shù)方案仍存在一些局限性。首先,回歸監(jiān)督學(xué)習(xí)模型在預(yù)測過程中需要智能地選擇輸入特征和計算方法,這可能導(dǎo)致模型預(yù)測的誤差傳播問題,例如忽略了化學(xué)分子的結(jié)構(gòu)信息,使得模型無法充分捕捉分子結(jié)構(gòu)與性能之間的關(guān)鍵關(guān)系;其次,雖然多模態(tài)分子形態(tài)轉(zhuǎn)換器能夠通過改變電解液成分的順序來擴充數(shù)據(jù)集,將樣本數(shù)從147個增加到27266個,但有限的多樣性可能導(dǎo)致訓(xùn)練過程中的過度擬合,且該模型的預(yù)測性能仍有待提高,在測試集上的均方根誤差(rootmean?squareerror,rmse)僅為0.195,這表明模型在實際應(yīng)用中可能存在較大的預(yù)測偏差;這些問題凸顯了開發(fā)更精確、魯棒的電解液庫侖效率預(yù)測模型的必要性。
4、針對相關(guān)技術(shù)中的問題,目前尚未提出有效的解決方案。
技術(shù)實現(xiàn)思路
1、(一)解決的技術(shù)問題
2、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了面向電解液庫倫效率預(yù)測的定制化模型構(gòu)建方法,具備只需要有限的實驗數(shù)據(jù)就能教會模型產(chǎn)生高質(zhì)量的輸出,能夠在大量電解液配方中預(yù)測庫倫效率,大大減輕工作人員的工作量的優(yōu)點,進而解決現(xiàn)有模型預(yù)測存在誤差傳播,忽略化學(xué)分子的結(jié)構(gòu)信息、有限的樣本多樣性可能導(dǎo)致模型訓(xùn)練過程中的過度擬合,且模型的預(yù)測性能仍有待提高的問題。
3、(二)技術(shù)方案
4、為實現(xiàn)上述只需要有限的實驗數(shù)據(jù)就能教會模型產(chǎn)生高質(zhì)量的輸出,在大量電解液配方中預(yù)測庫倫效率,大大減輕工作人員的工作量的優(yōu)點,本發(fā)明采用的具體技術(shù)方案如下:
5、一種面向電解液庫倫效率預(yù)測的定制化模型構(gòu)建方法,包括以下步驟:
6、s1、基于原始電解液數(shù)據(jù)集,獲取摩爾百分比,并轉(zhuǎn)換電解液中所有配方名稱,得到標(biāo)準(zhǔn)化電解液成分數(shù)據(jù);
7、s2、利用化學(xué)語料庫,預(yù)訓(xùn)練分子形態(tài)模型,并輸入標(biāo)準(zhǔn)化電解液成分數(shù)據(jù),輸出電解液中每種成分的化學(xué)特征;
8、s3、基于電解液中每種成分的化學(xué)特征,利用摩爾百分比加權(quán)求和,并結(jié)合數(shù)學(xué)理論神經(jīng)網(wǎng)絡(luò),生成庫侖效率預(yù)測模型。
9、進一步的,原始電解液數(shù)據(jù)集包括每種電解液的溶劑體積與鹽摩爾度,標(biāo)準(zhǔn)化電解液成分數(shù)據(jù)包括電解液配方中所有化學(xué)分子的元素組成與結(jié)構(gòu)信息。
10、進一步的,基于原始電解液數(shù)據(jù)集,獲取摩爾百分比,并轉(zhuǎn)換電解液中所有配方名稱,得到標(biāo)準(zhǔn)化的電解液成分數(shù)據(jù)包括以下步驟:
11、s11、利用化學(xué)計量學(xué)原理,將溶劑體積與鹽摩爾度轉(zhuǎn)換為摩爾百分比;
12、s12、基于簡化分子輸入線性表示規(guī)則,轉(zhuǎn)換電解液配方中所有化學(xué)分子名稱,得到映射格式名稱;
13、s13、根據(jù)摩爾百分比與映射格式名稱,建立標(biāo)準(zhǔn)化電解液成分數(shù)據(jù)。
14、進一步的,化學(xué)語料庫包括公共化學(xué)數(shù)據(jù)庫與鋅數(shù)據(jù)庫,預(yù)訓(xùn)練分子形態(tài)模型包括利用自注意力機制優(yōu)化相對位置編碼。
15、進一步的,利用化學(xué)語料庫,預(yù)訓(xùn)練分子形態(tài)模型,并輸入標(biāo)準(zhǔn)化電解液成分數(shù)據(jù),輸出電解液中每種成分的化學(xué)特征包括以下步驟:
16、s21、利用公共化學(xué)數(shù)據(jù)庫與鋅數(shù)據(jù)庫中的未標(biāo)注分子序列,預(yù)訓(xùn)練分子形態(tài)器模型;
17、s22、基于預(yù)訓(xùn)練后的分子形態(tài)器模型,輸入標(biāo)準(zhǔn)化電解液成分數(shù)據(jù);
18、s23、根據(jù)輸入的標(biāo)準(zhǔn)化電解液成分數(shù)據(jù),提取電解液中每種成分的化學(xué)特征并輸出。
19、進一步的,基于電解液中每種成分的化學(xué)特征,利用摩爾百分比加權(quán)求和,并結(jié)合數(shù)學(xué)理論神經(jīng)網(wǎng)絡(luò),生成庫侖效率預(yù)測模型包括以下步驟:
20、s31、基于電解液中每種成分的化學(xué)特征和摩爾百分比,利用加權(quán)求和方法,生成電解液的特征向量;
21、s32、根據(jù)電解液的特征向量,利用數(shù)學(xué)理論神經(jīng)網(wǎng)絡(luò),建立庫侖效率預(yù)測模型;
22、s33、利用剪枝技術(shù)和函數(shù)擬合方法,優(yōu)化庫侖效率預(yù)測模型。
23、進一步的,基于電解液中每種成分的化學(xué)特征和摩爾百分比,利用加權(quán)求和方法,生成電解液的特征向量的表達式為:
24、
25、式中,x表示電解液的整體特征向量;ei表示電解液中第i種成分的分子向量;n表示電解液成分的數(shù)量;pi表示電解液中第i種成分所對應(yīng)的摩爾百分比。
26、進一步的,根據(jù)電解液的特征向量,利用數(shù)學(xué)理論神經(jīng)網(wǎng)絡(luò),建立庫侖效率預(yù)測模型包括以下步驟:
27、s321、根據(jù)電解液的特征向量,利用線性層,得到降維后的輸入向量;
28、s322、基于多層數(shù)學(xué)理論神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),構(gòu)建庫侖效率預(yù)測模型;
29、s323、基于庫侖效率預(yù)測模型,輸入降維后的輸入向量,輸出庫侖效率預(yù)測結(jié)果。
30、進一步的,基于庫侖效率預(yù)測模型,輸入降維后的輸入向量,輸出庫侖效率預(yù)測結(jié)果的表達式為:
31、
32、式中,ce表示庫侖效率的預(yù)測結(jié)果;фj表示第j層數(shù)學(xué)理論神經(jīng)網(wǎng)絡(luò)對應(yīng)的函數(shù)矩陣;l表示多層數(shù)學(xué)理論神經(jīng)網(wǎng)絡(luò)的總層數(shù);°表示函數(shù)復(fù)合,即把一個函數(shù)的輸出作為下一個函數(shù)的輸入;σ1表示線性層的激活函數(shù);w1表示線性層的權(quán)重矩陣;x表示電解液的整體特征向量。
33、進一步的,利用剪枝技術(shù)和函數(shù)擬合方法,優(yōu)化庫侖效率預(yù)測模型包括以下步驟:
34、s331、利用剪枝技術(shù),優(yōu)化庫侖效率預(yù)測模型的網(wǎng)絡(luò)結(jié)構(gòu);
35、s332、基于剪枝后庫侖效率預(yù)測模型的網(wǎng)絡(luò)結(jié)構(gòu),利用一元函數(shù)組合方法,擬合多維連續(xù)函數(shù);
36、s333、利用對數(shù)轉(zhuǎn)換,調(diào)整庫侖效率預(yù)測模型輸出的庫侖效率預(yù)測結(jié)果。
37、(三)有益效果
38、與現(xiàn)有技術(shù)相比,本發(fā)明提供了面向電解液庫倫效率預(yù)測的定制化模型構(gòu)建方法,具備以下有益效果:
39、(1)本發(fā)明在預(yù)測電解液庫侖效率方面展現(xiàn)出顯著的優(yōu)勢,與傳統(tǒng)機器學(xué)習(xí)模型相比,本發(fā)明的均方根誤差降低了約80%,這一巨大提升源于其對化學(xué)分子結(jié)構(gòu)信息的全面考慮,而非僅依賴于元素組成等簡單特征;這種深入的特征提取能力使得本發(fā)明能夠捕捉到同分異構(gòu)體中元素幾何排列等微妙差異,從而更準(zhǔn)確地預(yù)測電解液特性和電池性能。
40、(2)在深度學(xué)習(xí)模型的對比中,本發(fā)明實現(xiàn)了最先進的性能,相比其他模型至少提高了25.7%的準(zhǔn)確度;這一卓越表現(xiàn)歸功于多個創(chuàng)新點的結(jié)合,包括使用molformer對化學(xué)分子進行精確表示、采用配方級的加權(quán)平均池化,以及利用kan網(wǎng)絡(luò)在科學(xué)領(lǐng)域的優(yōu)勢;特別值得注意的是,本發(fā)明僅需對一百多個樣本進行微調(diào)就能實現(xiàn)高精度預(yù)測,而其他現(xiàn)有技術(shù)則需要大量數(shù)據(jù)擴增,這種高效性大大減少了化學(xué)研究人員在龐大的電解液搜索空間中進行實驗驗證的工作量。
41、(3)此外,本發(fā)明通過對kan網(wǎng)絡(luò)進行剪枝優(yōu)化,進一步提升了模型的效率和泛化能力,剪枝操作將中間層神經(jīng)元從30個減少到17個,有效去除了對預(yù)測影響較小的節(jié)點和連接,這不僅簡化了模型結(jié)構(gòu),減少了計算量,加快了推理速度,還降低了過擬合風(fēng)險,同時保持了模型的高性能;這種優(yōu)化使得本發(fā)明在實際應(yīng)用中更加高效和可靠,為電解液性能預(yù)測和優(yōu)化提供了強有力的工具支持。