本發(fā)明涉及信號處理技術(shù)領(lǐng)域,尤其涉及一種音頻數(shù)據(jù)的處理方法及裝置。
背景技術(shù):
近年來,智能終端已逐漸融入到人們的日常生活中,常見的如智能手機、平板電腦以及智能可穿戴設(shè)備等。當前的智能終端通常具備語音識別功能,而通過語音識別的信息輸入也已成為用戶常用的輸入方法,尤其是智能可穿戴設(shè)備,由于其具有的屏幕較小,更加突出語音識別輸入的優(yōu)勢。
然而,在運動類場景中,用戶因為運動量過大或運動時間過長出現(xiàn)喘氣比較急促的情況,此時用戶向智能終端輸入語音時往往不如正常狀態(tài)下那么標準,與語音識別中設(shè)定的標準語音存在差異,由此,智能終端對用戶運動狀態(tài)下輸入的音頻信息進行識別時所具有的識別準確率往往較低,從而影響了用戶與智能終端的信息交互。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例提供一種音頻數(shù)據(jù)的處理方法及裝置,以解決運動狀態(tài)下無法準確識別音頻數(shù)據(jù)的問題。
第一方面,本發(fā)明實施例提供了一種音頻數(shù)據(jù)的處理方法,包括:
獲取用戶的運動狀態(tài)信息;
根據(jù)所述運動狀態(tài)信息及預設(shè)的音頻處理庫,確定當前的目標音頻處理模型;
基于所述目標音頻處理模型處理用戶輸入的音頻數(shù)據(jù),并對處理后的音頻數(shù)據(jù)進行音頻識別。
第二方面,本發(fā)明實施例還提供了一種音頻數(shù)據(jù)的處理裝置,包括:
信息獲取模塊,用于獲取用戶的運動狀態(tài)信息;
處理模型確定模塊,用于根據(jù)所述運動狀態(tài)信息及預設(shè)的音頻處理庫,確定當前的目標音頻處理模型;
處理識別模塊,用于基于所述目標音頻處理模型處理用戶輸入的音頻數(shù)據(jù),并對處理后的音頻數(shù)據(jù)進行音頻識別。
上述音頻數(shù)據(jù)的處理方法及裝置,首先可以獲取用戶的運動狀態(tài)信息;然后根據(jù)運動狀態(tài)信息以及預設(shè)的音頻處理庫,確定當前的目標音頻處理模型;最終可通過目標處理模型處理用戶輸入的音頻數(shù)據(jù),以及對處理后的音頻數(shù)據(jù)進行音頻識別。本發(fā)明實施例通過采用上述技術(shù)方案,能夠在用戶處于運動狀態(tài)時處理用戶的音頻數(shù)據(jù),實現(xiàn)對用戶運動帶來的音頻差異的有效處理,從而準確有效的實現(xiàn)音頻數(shù)據(jù)的識別,達到提升智能終端音頻識別準確率的目的。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
圖1為本發(fā)明實施例一提供的一種音頻數(shù)據(jù)的處理方法的流程示意圖;
圖2為本發(fā)明實施例二提供的一種音頻數(shù)據(jù)的處理方法的流程示意圖;
圖3為本發(fā)明實施例三提供的一種音頻數(shù)據(jù)的處理裝置的結(jié)構(gòu)框圖。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明作進一步的詳細說明??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部內(nèi)容。
實施例一
圖1為本發(fā)明實施例一提供一種音頻數(shù)據(jù)的處理方法的流程示意圖。該方法適用于對用戶在運動狀態(tài)下輸入的語音數(shù)據(jù)進行識別處理的情況,其中,該方法可以由音頻數(shù)據(jù)的處理裝置執(zhí)行,且該裝置可由軟件和/或硬件實現(xiàn),一般可集成在智能終端中??梢岳斫獾氖?,本實施例的智能終端具體可指智能手機、平板電腦、智能手環(huán)以及智能手表等電子設(shè)備。
需要說明的是,本發(fā)明實施例可優(yōu)選適用于用戶運動狀態(tài)下與智能終端進行語音交互的應(yīng)用場景,但并不限定于該應(yīng)用場景。智能終端根據(jù)本發(fā)明實施例提供的音頻數(shù)據(jù)的處理方法,可以對用戶運動狀態(tài)輸入的語音數(shù)據(jù)進行處理,以優(yōu)化智能終端的語音識別性能。
如圖1所示,本發(fā)明實施例一提供的一種音頻數(shù)據(jù)的處理方法,包括如下操作:
s101、獲取用戶的運動狀態(tài)信息。
在本實施例中,可通過智能終端上的設(shè)定監(jiān)測器件確定用戶是否處于運動狀態(tài),并獲得用戶處于運動狀態(tài)下的運動狀態(tài)信息。示例性地,所述設(shè)定監(jiān)測器件可以是設(shè)置在可穿戴手表或手環(huán)以及智能手機等智能終端中的運動傳感器或重力感應(yīng)器等,其中,上述設(shè)定監(jiān)測器件通常與智能終端中的處理器或控制器相連。所述運動狀態(tài)信息具體可用于表示用戶的運動狀況,如用戶的運動類型、運動強度、運動時長、運動軌跡以及身體負載情況等。
具體地,本實施例可以根據(jù)設(shè)定監(jiān)測器件監(jiān)測用戶的運動幅度或運動節(jié)奏等,由此可確定用戶在設(shè)定時間段內(nèi)的運動規(guī)律,從而可根據(jù)所確定的運動規(guī)律獲得用戶的運動模式或運動類型等信息,以作為用戶的運動狀態(tài)信息。可以理解的是,本實施例中運動狀態(tài)信息的獲取可以是實時的,也可以是周期性的(如間隔2~3秒進行一次信息獲取)。
s102、根據(jù)所述運動狀態(tài)信息及預設(shè)的音頻處理庫,確定當前的目標音頻處理模型。
在本實施例中,所述音頻處理庫具體可理解為記錄了運動狀態(tài)信息與所對應(yīng)音頻處理模型的映射關(guān)系表,其中,所述音頻處理庫中的映射關(guān)系可根據(jù)音頻處理結(jié)果的歷史值或經(jīng)驗值設(shè)定。
在本實施例中,根據(jù)所獲取的運動狀態(tài)信息,可以在所述音頻處理庫中獲得與之對應(yīng)的目標音頻處理模型,理由在于,本實施例中運動狀態(tài)信息不同時,用戶輸入音頻數(shù)據(jù)的狀態(tài)就不同,此時需要根據(jù)不同的音頻處理模型處理用戶不同運動狀態(tài)下輸入的音頻數(shù)據(jù)。
需要說明的是,本實施例可通過樣本的訓練學習獲得正常狀態(tài)下處于音頻數(shù)據(jù)所需的標準音頻處理模型,如果對標準處理模型中的參數(shù)進行不同程度的調(diào)節(jié),則可以獲取具有不同處理性能的音頻處理模型,以作為不同的目標音頻處理模型處理不同運動狀態(tài)信息下輸入的音頻數(shù)據(jù)。
s103、基于所述目標音頻處理模型處理用戶輸入的音頻數(shù)據(jù),并對處理后的音頻數(shù)據(jù)進行音頻識別。
在本實施例中,所述音頻數(shù)據(jù)具體可以是用戶直接輸入的語音數(shù)據(jù),也可以是提前錄入的語音數(shù)據(jù)等。需要理解的是,如果是當前輸入的語音數(shù)據(jù),則采用當前所獲取運動狀態(tài)信息對應(yīng)的目標音頻處理模型;如果是預先錄入的語音數(shù)據(jù),則應(yīng)該根據(jù)語音數(shù)據(jù)錄入時用戶的運動狀態(tài)信息確定目標音頻數(shù)據(jù)模型,此時,可認為預先錄入語音數(shù)據(jù)時,同樣保存了用戶當時的運動狀態(tài)信息。
本步驟在根據(jù)運動狀態(tài)信息確定對應(yīng)的目標音頻處理模型后,可以將所獲取的音頻數(shù)據(jù)作為目標音頻處理模型的輸入信息,最終可輸出處理后的音頻數(shù)據(jù)。之后,本步驟還可以對處理后的音頻數(shù)據(jù)輸入相應(yīng)的音頻識別模型,最終實現(xiàn)音頻數(shù)據(jù)的優(yōu)化識別,從而提高音頻數(shù)據(jù)識別的準確率。
在本實施例中,對音頻數(shù)據(jù)的處理可以是對音頻數(shù)據(jù)中噪音的過濾或?qū)σ纛l數(shù)據(jù)中存在間斷的音頻數(shù)據(jù)進行音頻補償?shù)忍幚聿僮鳎梢岳斫獾氖?,本實施例對音頻數(shù)據(jù)進行什么樣的處理操作,具體根據(jù)所選取的目標音頻處理模型進行。
本發(fā)明實施例一提供的一種音頻數(shù)據(jù)的處理方法,首先可以獲取用戶的運動狀態(tài)信息;然后根據(jù)運動狀態(tài)信息以及預設(shè)的音頻處理庫,確定當前的目標音頻處理模型;最終可通過目標處理模型處理用戶輸入的音頻數(shù)據(jù),以及對處理后的音頻數(shù)據(jù)進行音頻識別。利用該方法,能夠在用戶處于運動狀態(tài)時處理用戶的音頻數(shù)據(jù),實現(xiàn)對用戶運動帶來的音頻差異的有效處理,從而準確有效的實現(xiàn)音頻數(shù)據(jù)的識別,達到提升智能終端音頻識別準確率的目的。
實施例二
圖2為本發(fā)明實施例二提供的一種音頻數(shù)據(jù)的處理方法的流程示意圖。本發(fā)明實施例二以上述實施例為基礎(chǔ)進行優(yōu)化,在本實施例中,將獲取用戶的運動狀態(tài)信息,進一步具體化為:基于智能終端的運動傳感器監(jiān)測用戶的運動幅度、運動節(jié)奏以及運動時長,確定用戶的運動類型信息;根據(jù)所述運動時長以及檢測的用戶心率值,確定用戶的身體機能信息;將所述運動類型信息和身體機能信息確定為用戶的運動狀態(tài)信息。
進一步地,本實施例設(shè)定所述運動狀態(tài)信息優(yōu)化包括了:運動類型信息和身體機能信息;相應(yīng)的,本實施例將根據(jù)所述運動狀態(tài)信息及預設(shè)的音頻處理庫,確定當前的目標音頻處理模型,進一步優(yōu)化為:如果所述身體機能信息處于設(shè)定正常范圍,則在所述音頻處理庫中查找對應(yīng)于所述運動類型信息的第一調(diào)整參數(shù);否則,在所述音頻處理庫中查找對應(yīng)于所述身體機能信息的第二調(diào)整參數(shù);基于所述第一調(diào)整參數(shù)或第二調(diào)整參數(shù)調(diào)整標準音頻處理模型,形成當前的目標音頻處理模型。
在上述優(yōu)化的基礎(chǔ)上,本實施將基于所述目標音頻處理模型處理用戶輸入的音頻數(shù)據(jù),進一步優(yōu)化為:基于所述目標音頻處理模型,對所述音頻數(shù)據(jù)中的噪聲數(shù)據(jù)進行過濾,或者,對所述音頻數(shù)據(jù)中的丟失數(shù)據(jù)進行補償。
此外,本實施例還進一步優(yōu)化包括了:根據(jù)識別出的音頻信息,生成相應(yīng)的操作指令。
如圖2所示,本發(fā)明實施例二提供的一種音頻數(shù)據(jù)的處理方法,具體包括如下操作:
需要說明的是,本實施例優(yōu)選的設(shè)定所述運動狀態(tài)信息包括用戶的運動類型信息和身體機能信息。其中,所述運動類型信息具體可用于表示用戶的實際運動狀況;所述身體機能信息具體可用于表示用戶運動過程中的身體負載情況。
s201、基于智能終端的運動傳感器監(jiān)測用戶的運動幅度、運動節(jié)奏以及運動時長,確定用戶的運動類型信息。
具體地,本步驟可以通過設(shè)置于智能終端中的運動傳感器(如加速度傳感器、陀螺儀等)監(jiān)測用戶是否處于運動狀態(tài),并可確定用戶運動過程中的運動軌跡、運動幅度以及運動節(jié)奏等,以在設(shè)定時間內(nèi)分析確定用戶的運動規(guī)律進而確定用戶的運動類型,如,當確定用戶的運動幅度均勻波動且不超過設(shè)定范圍,同時用戶的運動軌跡在不斷增加,則可確定用戶的運動類型為跑步;又如,當確定用戶的運動節(jié)奏在設(shè)定時間內(nèi)上下交替,同時幾乎沒有形成運動軌跡,則可確定用戶的運動類型為跳繩,上述確定的運動類型均可作為用戶的運動類型信息。
可以理解的是,當用戶處于運動狀態(tài)尤其進行幅度較大或節(jié)奏較快的運動且進行語音輸入時,很容易出現(xiàn)聲音忽高忽低的情況,進而影響了智能終端對所輸入語音數(shù)據(jù)的正確識別。
本實施例還可根據(jù)智能終端的計時工具確定用戶的運動時長,所述運動時長不僅可用于分析確定用戶的運動類型信息,后續(xù)還可用于確定用戶的運動強度,由此判定用戶是否處于疲勞運動狀態(tài),以確定用戶的身體機能信息。
s202、根據(jù)所述運動時長以及檢測的用戶心率值,確定用戶的身體機能信息。
具體地,當所述運動時長超過一定值且無論用戶的心率值是否超過標準心率值時,均可認為用戶處于疲勞運動狀態(tài),可以表明用戶當前的身體機能已超負載,此時用戶很容易出現(xiàn)喘氣以及說話斷斷續(xù)續(xù)的情況,該種情況同樣影響智能終端對用戶語音數(shù)據(jù)的識別。
同時,當運動時長較低時,如果用戶的運動強度較大,可能會出現(xiàn)心率值超過標準值的情況,此時也可認為用戶的身體機能超過正常負載,也有可能會出現(xiàn)喘氣或說話斷斷續(xù)續(xù)的情況。本實施例可以通過上述操作確定用戶的身體機能是否處于正常范圍,并由此作為用戶的身體機能信息。
s203、將所述運動類型信息和身體機能信息確定為用戶的運動狀態(tài)信息。
可以理解的是,上述確定的運動類型信息以及身體機能信息可看作用戶的運動狀態(tài)信息。
s204、確定所述身體機能信息是否處于正常范圍,若是,則執(zhí)行s205;若否,則執(zhí)行s206。
在本實施例中,首先考慮運動狀態(tài)信息中的身體機能信息是否處于正常范圍,即,優(yōu)選的根據(jù)身體機能信息的判定結(jié)果確定處理音頻數(shù)據(jù)所需的目標音頻處理模型,之后再考慮根據(jù)用戶的運動類型信息進行目標音頻處理模型的確定。
具體地,對身體機能信息的判定可描述為:在用戶的運動時長以及心率值均處于相應(yīng)的標準值時確定用戶的身體機能信息為身體機能正常,即,認為所述身體機能信息處于正常范圍,此時,可執(zhí)行本實施例的s205;同樣,本實施例可以在用戶的運動時長或者心率值中的一個不符合相應(yīng)的標準值時,確定用戶的身體機能信息為身體機能超負載,即,認為所述身體機能信息超過正常范圍,此時,需要執(zhí)行本實施例的s206。
s205、在所述音頻處理庫中查找對應(yīng)于所述運動類型信息的第一調(diào)整參數(shù),之后執(zhí)行s207。
在本實施例中,執(zhí)行本步驟的條件為:運動狀態(tài)信息中的身體機能信息處于正常范圍內(nèi),此時主要基于運動狀態(tài)信息中的運動類型信息進行目標音頻處理模型的確定。需要說明的是,本實施例優(yōu)選的在所述音頻處理庫中分別記錄了各運動類型信息和各身體機能信息對應(yīng)的調(diào)整參數(shù),該調(diào)整參數(shù)具體可用于確定所需的目標音頻處理模型。
因此,本步驟不能根據(jù)運動類型信息直接在音頻處理庫中找到相應(yīng)的目標音頻處理模型,而是首先在音頻處理庫中找到與當前的運動類型信息相匹配的第一調(diào)整參數(shù)。示例性地,確定用戶的運動類型信息為跑步時,在音頻處理庫中查找跑步對應(yīng)的調(diào)整參數(shù)并記為第一調(diào)整參數(shù)。
s206、在所述音頻處理庫中查找對應(yīng)于所述身體機能信息的第二調(diào)整參數(shù),之后執(zhí)行s207。
同樣,本實施例中執(zhí)行本步驟的條件為:運動狀態(tài)信息中的身體機能信息超過正常范圍,此時需要根據(jù)運動狀態(tài)信息中的身體機能信息進行目標音頻處理模型的確定??梢岳斫獾氖?,本步驟不能根據(jù)身體機能信息直接在音頻處理庫中找到相應(yīng)的目標音頻處理模型,而是在所述音頻處理庫中找到與當前的身體機能信息相匹配的第二調(diào)整參數(shù)。
在本實施例中,所述身體機能信息優(yōu)選的以所述運動時長結(jié)合心率值的形式表示。具體地,在所述音頻處理庫中確定所述第二調(diào)整參數(shù)的過程可描述為:確定所述運動時長與標準運動時長的時長差,同時確定所述心率差與所述標準心率值的心率差;確定所述時長差以及所述心率差所屬的取值區(qū)間;將對應(yīng)于所述取值區(qū)間的調(diào)整參數(shù)確定為所述身體機能信息的第二調(diào)整參數(shù)。
可以理解的是,在所述音頻處理庫中,根據(jù)時長差以及心率差可能存在的取值,設(shè)定有多個取值區(qū)間,且不同取值區(qū)間對應(yīng)設(shè)定有相應(yīng)的調(diào)整參數(shù),上述所設(shè)定的調(diào)整參數(shù)均有可能作為所述身體機能信息的第二調(diào)整參數(shù)。
s207、基于所述第一調(diào)整參數(shù)或第二調(diào)整參數(shù)調(diào)整標準音頻處理模型,形成當前的目標音頻處理模型。
在本實施例中,所述標準音頻處理模型具體可理解為根據(jù)樣本集訓練學習構(gòu)建的用于處理音頻數(shù)據(jù)的音頻處理模型,一般地,所述標準音頻處理模型具體可用于處理用戶非運動狀態(tài)下輸入的音頻數(shù)據(jù)。
具體地,基于上述s205確定了第一調(diào)整參數(shù)或根據(jù)s206確定了第二調(diào)整參數(shù)后,本步驟可以根據(jù)所確定的調(diào)整參數(shù)調(diào)整所述標準音頻處理模型,最終獲得與所述第一調(diào)整參數(shù)或第二調(diào)整參數(shù)對應(yīng)的目標音頻處理模型。
s208、基于所述目標音頻處理模型,對所述音頻數(shù)據(jù)中的噪聲數(shù)據(jù)進行過濾,或者,對所述音頻數(shù)據(jù)中的丟失數(shù)據(jù)進行補償。
本實施例中,在根據(jù)確定的調(diào)整參數(shù)調(diào)整形成目標音頻處理模型后,可對輸入目標音頻處理模型的音頻數(shù)據(jù)進行噪聲數(shù)據(jù)的過濾操作,或者,對所輸入的音頻數(shù)據(jù)進行丟失數(shù)據(jù)的補償操作。可以理解的是,本步驟可以根據(jù)具體形成的目標音頻處理模型確定待執(zhí)行的處理操作,即,本步驟對音頻數(shù)據(jù)進行的處理操作在基于s207確定目標音頻處理模型時已相應(yīng)確定。
示例性地,本實施例上述步驟確定用戶的身體機能信息不符合正常范圍時,可認為身體機能信息對用戶語音輸入的影響較大,該種情況下用戶通常存在頻繁喘氣的可能,進而可認為用戶所輸入的語音數(shù)據(jù)中混雜著較多的喘氣聲,上述喘氣聲相當于語音數(shù)據(jù)中的噪聲數(shù)據(jù),此時,可以根據(jù)s206中確定的第二調(diào)整參數(shù)調(diào)整形成相應(yīng)的目標音頻處理模型,且本步驟可根據(jù)該目標音頻處理模型對輸入的語音數(shù)據(jù)進行噪聲數(shù)據(jù)的過濾操作。需要說明的是,本實施例中的第二調(diào)整參數(shù)與音頻數(shù)據(jù)處理時噪聲數(shù)據(jù)的過濾程度存在關(guān)聯(lián),該種關(guān)聯(lián)可以是正比例關(guān)聯(lián)。
同樣,本實施例上述步驟確定用戶的身體機能信息處于正常范圍時,可認為運動類型信息對用戶語音輸入的影響較大,該種情況下用戶通常根據(jù)運動幅度或節(jié)奏存在聲音忽高忽低的可能,進而可認為用戶所輸入的語音數(shù)據(jù)中存在部分語音數(shù)據(jù)的缺失,上述確定的語音數(shù)據(jù)相當于語音數(shù)據(jù)中的丟失數(shù)據(jù),此時,可以根據(jù)s205中確定的第一調(diào)整參數(shù)形成相應(yīng)的目標音頻處理模型,且本步驟可根據(jù)該目標音頻處理模型對輸入的語音數(shù)據(jù)進行丟失數(shù)據(jù)的補償操作。同樣可以理解的是,本實施例中的第一調(diào)整參數(shù)與音頻數(shù)據(jù)處理時丟失數(shù)據(jù)的補償程度存在關(guān)聯(lián),該種關(guān)聯(lián)同樣可以是正比例關(guān)聯(lián)。
s209、對處理后的音頻數(shù)據(jù)進行音頻識別,并根據(jù)識別出的音頻信息,生成相應(yīng)的操作指令。
基于上述步驟完成音頻數(shù)據(jù)處理后,可以通過音頻數(shù)據(jù)識別模型對處理后的音頻數(shù)據(jù)進行識別,同時可以根據(jù)識別出的音頻信息,結(jié)合預設(shè)的指令對照表,生成相應(yīng)的操作指令。本實施例可以根據(jù)所述操作指令實現(xiàn)用戶與智能終端的信息交互。
本發(fā)明實施例二提供的一種音頻數(shù)據(jù)的處理方法,具體化了運動狀態(tài)信息的獲取操作,同時具體化了目標音頻處理模型的確定操作以及對音頻數(shù)據(jù)的處理操作,此外還具體增加了指令的生成操作。利用該方法,能夠根據(jù)運動傳感器確定用戶的運動類型以及結(jié)合心率確定用戶運動時的身體機能信息,從而確定音頻數(shù)據(jù)處理所需的處理模型并實現(xiàn)音頻數(shù)據(jù)的處理,以實現(xiàn)對用戶運動狀態(tài)下所輸入音頻數(shù)據(jù)的優(yōu)化,進而提升智能終端對用戶運動狀態(tài)下所輸入音頻數(shù)據(jù)進行識別時的準確率。
實施例三
圖3為本發(fā)明實施例三提供的一種音頻數(shù)據(jù)的處理裝置的結(jié)構(gòu)框圖,該裝置適用于對用戶在運動狀態(tài)下輸入的語音數(shù)據(jù)進行識別處理的情況,且該裝置可由軟件和/或硬件實現(xiàn),并一般可集成在智能終端。如圖3所示,該裝置包括:信息獲取模塊31、處理模型確定模塊32以及處理識別模塊33。
其中,信息獲取模塊31,用于獲取用戶的運動狀態(tài)信息。
處理模型確定模塊32,用于根據(jù)所述運動狀態(tài)信息及預設(shè)的音頻處理庫,確定當前的目標音頻處理模型。
處理識別模塊33,用于基于所述目標音頻處理模型處理用戶輸入的音頻數(shù)據(jù),并對處理后的音頻數(shù)據(jù)進行音頻識別。
在本實施例中,該裝置首先通過信息獲取模塊31獲取用戶的運動狀態(tài)信息;然后通過處理模型確定模塊32根據(jù)運動狀態(tài)信息及預設(shè)的音頻處理庫,確定當前的目標音頻處理模型;最終通過處理識別模塊33基于目標音頻處理模型處理用戶輸入的音頻數(shù)據(jù),并對處理后的音頻數(shù)據(jù)進行音頻識別。
本發(fā)明實施例三提供的音頻數(shù)據(jù)的處理裝置可執(zhí)行本發(fā)明任意實施例提供的音頻數(shù)據(jù)的處理方法,具備執(zhí)行音頻數(shù)據(jù)的處理方法相應(yīng)的功能模塊和有益效果。利用該裝置,能夠在用戶處于運動狀態(tài)時處理用戶的音頻數(shù)據(jù),實現(xiàn)對用戶運動帶來的音頻差異的有效處理,從而準確有效的實現(xiàn)音頻數(shù)據(jù)的識別,達到提升智能終端音頻識別準確率的目的。
進一步地,信息獲取模塊31,具體可用于:基于智能終端的運動傳感器監(jiān)測用戶的運動幅度、運動節(jié)奏以及運動時長,確定用戶的運動類型信息;根據(jù)所述運動時長以及檢測的用戶心率值,確定用戶的身體機能信息;將所述運動類型信息和身體機能信息確定為用戶的運動狀態(tài)信息。
此外,所述運動狀態(tài)信息包括運動類型信息和身體機能信息;相應(yīng)的,處理模型確定模塊32,具體用于:當所述身體機能信息處于設(shè)定正常范圍時,在所述音頻處理庫中查找對應(yīng)于所述運動類型信息的第一調(diào)整參數(shù);否則,在所述音頻處理庫中查找對應(yīng)于所述身體機能信息的第二調(diào)整參數(shù);基于所述第一調(diào)整參數(shù)或第二調(diào)整參數(shù)調(diào)整標準音頻處理模型,形成當前的目標音頻處理模型。
在上述優(yōu)化的基礎(chǔ)上,識別處理模塊33,具體用于:基于所述目標音頻處理模型,對所述音頻數(shù)據(jù)中的噪聲數(shù)據(jù)進行過濾,或者,對所述音頻數(shù)據(jù)中的丟失數(shù)據(jù)進行補償;對處理后的音頻數(shù)據(jù)進行音頻識別。
進一步地,該裝置還包括:指令生成模塊34,用于根據(jù)識別出的音頻信息,生成相應(yīng)的操作指令。
注意,上述僅為本發(fā)明的較佳實施例及所運用技術(shù)原理。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這里所述的特定實施例,對本領(lǐng)域技術(shù)人員來說能夠進行各種明顯的變化、重新調(diào)整和替代而不會脫離本發(fā)明的保護范圍。因此,雖然通過以上實施例對本發(fā)明進行了較為詳細的說明,但是本發(fā)明不僅僅限于以上實施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。