融合多傳感器的地點(diǎn)識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種融合多傳感器的地點(diǎn)識別方法,屬于地點(diǎn)識別技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]近年來隨著移動互聯(lián)網(wǎng)的發(fā)展和人們生活水平的不斷提高,手機(jī)等移動設(shè)備已經(jīng)成為人們現(xiàn)代生活中不可或缺的一部分。目前手機(jī)等移動設(shè)備都具備較強(qiáng)的運(yùn)算能力,并且配備了豐富的傳感器,比如GPS、加速度傳感器、重力感應(yīng)器等,具有廣闊的應(yīng)用前景,基于移動設(shè)備的情景感知是其中一個重要的發(fā)展方向。移動互聯(lián)網(wǎng)應(yīng)用通過感知用戶情景,可以給用戶提供更豐富的個性化服務(wù),例如,中國專利公開號104504623A公開的一種根據(jù)動作感知進(jìn)行場景識別的方法,公開日為2015-04-08。而情景感知首先最需要解決的就是用戶顯著地點(diǎn)感知,即地點(diǎn)識別。目前常用的地點(diǎn)識別方法包括以下幾種:
[0003]I.基于Beacon的方法
[0004]基于Beacon的方法需要預(yù)先在固定地點(diǎn)安裝Beacon基站。當(dāng)用戶靠近Beacon基站時,移動設(shè)備能夠感應(yīng)到Beacon信號,從而獲取到用戶所在地點(diǎn)。這種方法需要額外硬件的投入,成本較高,能夠識別的地點(diǎn)也因此受到限制,不利于推廣應(yīng)用。
[0005]2.基于聚類的方法
[0006]手機(jī)等移動設(shè)備可以通過GPS或網(wǎng)絡(luò)定位技術(shù)自動記錄經(jīng)瑋度信息,采集得到軌跡數(shù)據(jù)。當(dāng)用戶在地點(diǎn)停留時,軌跡點(diǎn)會在地點(diǎn)附近比較密集?;谶@一事實(shí),可以通過K-均值聚類算法或DBSCAN算法來挖掘地點(diǎn)信息。這種方法不依賴額外的硬件,但是聚類算法沒有考慮軌跡數(shù)據(jù)的時序特征,并且由于手機(jī)采集經(jīng)瑋度信息受自身條件限制容易出現(xiàn)噪聲數(shù)據(jù),從而影響地點(diǎn)識別的準(zhǔn)確度。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的上述問題,提供一種融合多傳感器的地點(diǎn)識別方法。本發(fā)明不需要依賴額外的硬件,只需要采集移動設(shè)備自身配備的傳感器數(shù)據(jù),且能夠提高地點(diǎn)識別的準(zhǔn)確性。
[0008]為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0009]—種融合多傳感器的地點(diǎn)識別方法,其特征在于,包括以下步驟:
[0010]a、按照設(shè)定的采樣時間間隔采集經(jīng)瑋度信息以及傳感器數(shù)據(jù),同時記錄采樣時的時間戳,得到軌跡數(shù)據(jù)序列和原始傳感器數(shù)據(jù);
[0011]b、對軌跡數(shù)據(jù)序列進(jìn)行預(yù)處理,過濾軌跡數(shù)據(jù)序列中的速度異常點(diǎn);
[0012]C、對預(yù)處理后的軌跡數(shù)據(jù)序列進(jìn)行處理,得到用戶訪問地點(diǎn)集;
[0013]d、對原始傳感器數(shù)據(jù)進(jìn)行處理,得到用戶行為信息集;
[0014]e、融合用戶行為信息集和訪問地點(diǎn)集,得到用戶常駐地點(diǎn)集。
[0015]所述步驟a中,利用移動設(shè)備按照設(shè)定的采樣時間間隔,通過GPS或者網(wǎng)絡(luò)定位獲取設(shè)備的經(jīng)瑋度信息,采集加速度傳感器、陀螺儀、重力感應(yīng)器等傳感器信息,附近的WiFi熱點(diǎn)信息,將這些數(shù)據(jù)上報到服務(wù)器。
[0016]所述步驟a中,得到的軌跡數(shù)據(jù)序列L={li,12,…,In},其中Ii= (lati,longi,timei)表示經(jīng)瑋度和時間,原始傳感器數(shù)據(jù)S= {si, S2,..., Sn},其中Si = {typei,valuei,timei}表示傳感器的類型,傳感器的值和時間戳。
[0017]所述步驟b中,對軌跡數(shù)據(jù)序列進(jìn)行濾波,平滑等常用數(shù)值預(yù)處理,利用速度信息過濾軌跡數(shù)據(jù)中速度異常點(diǎn)。
[0018]所述步驟c中,采用多層次的聚類算法對軌跡數(shù)據(jù)序列進(jìn)行處理,得到用戶訪問地點(diǎn)集。
[0019]所述用戶訪問地點(diǎn)集包括訪問地點(diǎn)位置和在該訪問地點(diǎn)的時間段。
[0020]所述步驟c具體包括如下過程:
[0021]Cl、選取兩個參數(shù):停留點(diǎn)的最大距離間隔D和停留點(diǎn)的最小時間跨度T;
[0022]c2、采用基于時間序列的聚類算法處理軌跡數(shù)據(jù)序列,提取相鄰軌跡點(diǎn)距離小于D的軌跡子序列,軌跡子序列的時間跨度為尾軌跡點(diǎn)與頭軌跡點(diǎn)的時間間隔;當(dāng)軌跡子序列的時間跨度大于T時,選取軌跡子序列的中心位置作為停留地點(diǎn),得到用戶停留地點(diǎn)集;
[0023]c3、采用基于密度的聚類算法處理用戶停留地點(diǎn)集,得到用戶訪問地點(diǎn)集,訪問地點(diǎn)位置為聚類的停留地點(diǎn)的中心位置。
[0024]所述步驟d中,采用決策樹、SVM對原始傳感器數(shù)據(jù)分類,按照類別對用戶行為序列進(jìn)行分段。
[0025]所述步驟d具體包括如下過程:
[0026]dl、原始傳感器數(shù)據(jù)特征提取:原始傳感器數(shù)據(jù)數(shù)列S={S1,S2,-_,Sn},選取時域特征、頻域特征作為特征集;
[0027]d2、采用SVM算法進(jìn)行訓(xùn)練學(xué)習(xí)和分類;
[0028]d3、按照行為類別對行為進(jìn)行分段,A = {ai,a2,...,am},其中行為ai = {starti,encU,typei}表示同類別行為的開始時間,結(jié)束時間和類別。
[0029]所述步驟e中,采用啟發(fā)式方法融合用戶行為信息集和訪問地點(diǎn)集,當(dāng)用戶在同一行為的時間跨度中包含多個訪問地點(diǎn)時,合并這些訪問地點(diǎn),選取中心位置,得到用戶常駐地點(diǎn)集。
[0030]采用本發(fā)明的優(yōu)點(diǎn)在于:
[0031 ] 1、本發(fā)明不需要依賴額外的硬件,只需要采集移動設(shè)備自身配備的GPS、加速度傳感器、重力感應(yīng)器等傳感器數(shù)據(jù),大大降低了成本。
[0032]2、本發(fā)明采用多層次的聚類算法挖掘用戶訪問地點(diǎn)集,考慮了用戶軌跡序列的時序特征,再利用基于密度的聚類算法得到用戶訪問地點(diǎn)集,有效降低了由于設(shè)備上報的位置信息誤差造成的地點(diǎn)識別的干擾。
[0033]3、本發(fā)明基于多傳感器提取用戶行為信息集,融合用戶訪問地點(diǎn)集,得到用戶常駐地點(diǎn)集,能夠有效提高地點(diǎn)識別的準(zhǔn)確性。
【附圖說明】
[0034]圖1為本發(fā)明具體實(shí)施例系統(tǒng)結(jié)構(gòu)示意圖
[0035]圖2為本發(fā)明融合多傳感器的地點(diǎn)識別方法流程圖
[0036]圖3為本發(fā)明地點(diǎn)信息示意圖
【具體實(shí)施方式】
[0037]實(shí)施例1
[0038]—種融合多傳感器的地點(diǎn)識別方法,包括以下步驟:
[0039]a、按照設(shè)定的采樣時間間隔采集經(jīng)瑋度信息以及傳感器數(shù)據(jù),同時記錄采樣時的時間戳,得到軌跡數(shù)據(jù)序列和原始傳感器數(shù)據(jù);
[0040]b、對軌跡數(shù)據(jù)序列進(jìn)行預(yù)處理,過濾軌跡數(shù)據(jù)序列中的速度異常點(diǎn);
[0041]C、對預(yù)處理后的軌跡數(shù)據(jù)序列進(jìn)行處理,得到用戶訪問地點(diǎn)集;
[0042]d、對原始傳感器數(shù)據(jù)進(jìn)行處理,得到用戶行為信息集;
[0043]e、融合用戶行為信息集和訪問地點(diǎn)集,得到用戶常駐地點(diǎn)集。
[0044]所述步驟a中,利用移動設(shè)備按照設(shè)定的采樣時間間隔,通過GPS或者網(wǎng)絡(luò)定位獲取設(shè)備的經(jīng)瑋度信息,采集加速度傳感器、陀螺儀、重力感應(yīng)器等傳感器信息,附近的WiFi熱點(diǎn)信息,將這些數(shù)據(jù)上報到服務(wù)器。
[0045]所述步驟a中,得到的軌跡數(shù)據(jù)序列L={li,12,…,In},其中Ii= (lati,longi,timei)表示經(jīng)瑋度和時間,原始傳感器數(shù)據(jù)S= {si, S2,..., Sn},其中Si = {typei,valuei,timei}表示傳感器的類型,傳感器的值和時間戳。
[0046]所述步驟b中,對軌跡數(shù)據(jù)序列進(jìn)行濾波,平滑等常用數(shù)值預(yù)處理,利用速度信息過濾軌跡數(shù)據(jù)中速度異常點(diǎn)。
[0047]所述步驟c中,采用多層次的聚類算法對軌跡數(shù)據(jù)序列進(jìn)行處理,得到用戶訪問地點(diǎn)集。
[0048]所述用戶訪問地點(diǎn)集包括訪問地點(diǎn)位置和在該訪問地點(diǎn)的時間段。
[0049]所述步驟c具體包括如下過程:
[0050]Cl、選取兩個參數(shù):停留點(diǎn)的最大距離間隔D和停留點(diǎn)的最小時間跨度T;
[0051]c2、采用基于時間序列的聚類算法處理軌跡數(shù)據(jù)序列,提取相鄰軌跡點(diǎn)距離小于D的軌跡子序列,軌跡子序列的時間跨度為尾軌跡點(diǎn)與頭軌跡點(diǎn)的時間間隔;當(dāng)軌跡子序列的時間跨度大于T時,選取軌跡子序列的中心位置作為停留地點(diǎn),得到用戶停留地點(diǎn)集;
[0052]c3、采用基于密度的聚類算法處理用戶停留地點(diǎn)集,得到用戶訪問地點(diǎn)集,訪問地點(diǎn)位置為聚類的停留地點(diǎn)的中心位置。
[0053]所述步驟d中,采用決策樹、SVM對原始傳感器數(shù)據(jù)分類,按照類別對用戶行為序列進(jìn)行分段。
[0054]所述步驟d具體包括如下過程:
[0055]dl、原始傳感器數(shù)據(jù)特征提取:原始傳感器數(shù)據(jù)數(shù)列S={S1,S2,-_,Sn},選取時域特征、頻域特征作為特征集;
[0056]d2、采用SVM算法進(jìn)行訓(xùn)練學(xué)習(xí)和分類;
[0057]d3、按照行為類別對行為進(jìn)行分段,A = {ai,a2,...,am},其中行為ai = {starti,encU,typei}表示同類別行為的開始時間,結(jié)束時間和類別。
[0058]所述步驟e中,采用啟發(fā)式方法融合用戶行為信息集和訪問地點(diǎn)集,當(dāng)用戶在同一行為的時間跨度中包含多個訪問地點(diǎn)時,合并這些訪問地點(diǎn),選取中心位置,得到用戶常駐地點(diǎn)集。
[0059]實(shí)施例2
[0060]一種融合多傳感器的地點(diǎn)識別方法,包括以下步驟:
[0061]I)利用