两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于對(duì)便攜式裝置內(nèi)的音頻信號(hào)的響度進(jìn)行非破壞性標(biāo)準(zhǔn)化的系統(tǒng)和方法

文檔序號(hào):7525125閱讀:231來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):用于對(duì)便攜式裝置內(nèi)的音頻信號(hào)的響度進(jìn)行非破壞性標(biāo)準(zhǔn)化的系統(tǒng)和方法
技術(shù)領(lǐng)域
本申請(qǐng)總體涉及對(duì)音頻信號(hào)的編碼和解碼,并且更具體地,涉及可用于針對(duì)較寬范圍的回放裝置和收聽(tīng)環(huán)境對(duì)音頻信號(hào)進(jìn)行編碼和解碼的技術(shù)。
背景技術(shù)
手持式和其它類(lèi)型的便攜式裝置的日益普及已經(jīng)對(duì)用于在這些裝置上回放的媒 體內(nèi)容的創(chuàng)作者和分發(fā)者產(chǎn)生了新的機(jī)會(huì)和挑戰(zhàn),同樣也已經(jīng)對(duì)裝置的設(shè)計(jì)者和制造者產(chǎn)生了新的機(jī)會(huì)和挑戰(zhàn)。許多便攜式裝置能夠回放廣泛的媒體內(nèi)容類(lèi)型和格式,包括通常與用于HDTV (高清電視)、Blu-ray (藍(lán)光)或DVD (數(shù)字多功能盤(pán))的高質(zhì)量、寬帶寬和寬動(dòng)態(tài)范圍的音頻內(nèi)容相關(guān)聯(lián)的那些媒體內(nèi)容類(lèi)型和格式。便攜式裝置可用于在其自身的內(nèi)部聲換能器上或者在諸如耳機(jī)的外部換能器上回放該類(lèi)型的音頻內(nèi)容;然而,這些便攜式裝置通常無(wú)法在變化的媒體格式和內(nèi)容類(lèi)型中以一致的響度和可理解度來(lái)再現(xiàn)該內(nèi)容。

發(fā)明內(nèi)容
本發(fā)明涉及提供用于對(duì)音頻信號(hào)進(jìn)行編碼和解碼、以在包括手持式和其它類(lèi)型的便攜式裝置的多種裝置上進(jìn)行回放的改進(jìn)方法。所附獨(dú)立權(quán)利要求中闡述了本發(fā)明的各個(gè)方面。本發(fā)明的各種特征及其優(yōu)選實(shí)施例可通過(guò)參考以下論述和附圖而得到更好的理解,在附圖中,相同的附圖標(biāo)記在多幅圖中指的是相同的元件。附圖和以下論述的內(nèi)容僅作為示例來(lái)闡述,并且不應(yīng)理解為表示對(duì)本發(fā)明的范圍的限制。


圖I是回放裝置的示意框圖。圖2是編碼裝置的示意框圖。圖3至圖5是轉(zhuǎn)碼裝置的示意框圖。圖6是可用于實(shí)現(xiàn)本發(fā)明的各個(gè)方面的裝置的示意框圖。
具體實(shí)施例方式A.介紹本發(fā)明涉及用于對(duì)音頻信息進(jìn)行編碼和解碼,以在具有挑戰(zhàn)性的收聽(tīng)環(huán)境(諸如手持式和其它類(lèi)型的便攜式裝置的用戶所遇到的收聽(tīng)環(huán)境)中進(jìn)行回放。諸如以下所描述的公開(kāi)標(biāo)準(zhǔn)描述了音頻編碼和解碼的一些示例由高級(jí)電視業(yè)務(wù)顧問(wèn)委員會(huì)有限公司(Advanced Television Systems Committee, Inc.)在 2005 年 6 月 14 日公布的 “DigitalAudio Compression Standard (AC-3, E-AC-3) ”,修訂 B,文檔 A/52B (此處稱(chēng)為 “ATSC 標(biāo)準(zhǔn)”),以及由國(guó)際標(biāo)準(zhǔn)組織(ISO)公布的IS0/IEC 13818-7,高級(jí)音頻編碼(AAC)(此處稱(chēng)為“MPEG-2 AAC標(biāo)準(zhǔn)”)和IS0/IEC 14496-3,子部分4 (此處稱(chēng)為“MPEG-4音頻標(biāo)準(zhǔn)”)。只是作為示例而給出了遵照這些標(biāo)準(zhǔn)的編碼和解碼處理。本發(fā)明的原理也可用于遵照其它標(biāo)準(zhǔn)的編碼系統(tǒng)。發(fā)明人發(fā)現(xiàn),遵照一些編碼標(biāo)準(zhǔn)的裝置的可用特征通常不足以用于手持式和其它類(lèi)型的便攜式裝置的典型的應(yīng)用和收聽(tīng)環(huán)境。當(dāng)這些類(lèi)型的裝置被用于對(duì)遵照這些標(biāo)準(zhǔn)的編碼輸入信號(hào)的音頻內(nèi)容進(jìn)行解碼時(shí),所解碼的音頻內(nèi)容通常以如下響度水平被再現(xiàn)該響度水平顯著低于通過(guò)對(duì)專(zhuān)門(mén)為在這些裝置上回放而準(zhǔn)備的編碼輸入信號(hào)進(jìn)行解碼而獲得的音頻內(nèi)容的響度水平。遵照例如ATSC標(biāo)準(zhǔn)的編碼輸入信號(hào)(此處稱(chēng)為“遵照ATSC的編碼信號(hào)”)包含編碼音頻信息以及用于描述該信息可以如何解碼的元數(shù)據(jù)。一些元數(shù)據(jù)參數(shù)標(biāo)識(shí)動(dòng)態(tài)范圍壓 縮簡(jiǎn)檔,該動(dòng)態(tài)范圍壓縮簡(jiǎn)檔指定當(dāng)對(duì)編碼音頻信息進(jìn)行解碼時(shí)可如何對(duì)音頻信息的動(dòng)態(tài)范圍進(jìn)行壓縮??梢员3纸獯a信號(hào)的完全動(dòng)態(tài)范圍,或者可以在解碼時(shí)以不同的程度來(lái)對(duì)其進(jìn)行壓縮,以滿足不同應(yīng)用和收聽(tīng)環(huán)境的要求。其它元數(shù)據(jù)標(biāo)識(shí)編碼音頻信息的響度的某種度量,諸如編碼信號(hào)中的對(duì)話的水平或平均節(jié)目水平。該元數(shù)據(jù)可被解碼器用于調(diào)整解碼信號(hào)的幅度,以在回放期間實(shí)現(xiàn)指定的響度或參考再現(xiàn)水平。在一些應(yīng)用中,可以指定或假設(shè)一個(gè)或多個(gè)參考再現(xiàn)水平,而在其它應(yīng)用中,用戶可對(duì)參考再現(xiàn)水平的設(shè)置進(jìn)行控制。例如,用于對(duì)遵照ATSC的編碼信號(hào)進(jìn)行編碼和解碼的編碼處理假設(shè)要以兩個(gè)參考再現(xiàn)水平之一回放對(duì)話。一個(gè)水平是比限幅水平低31dB,其中限幅水平是最大的可能數(shù)字值或滿量程(FS)值,這個(gè)比限幅水平低31dB的水平在這里標(biāo)記為-31dBFS。使用該水平的解碼模式有時(shí)稱(chēng)為“線模式(Line Mode)”,并且旨在用于適合較寬動(dòng)態(tài)范圍的應(yīng)用和環(huán)境中。另一水平被設(shè)置為_(kāi)20dBFS。使用該第二水平的解碼模式有時(shí)稱(chēng)為“RF模式”,其旨在用在如在通過(guò)對(duì)射頻(RF)信號(hào)調(diào)制而進(jìn)行廣播時(shí)所遇到的應(yīng)用和環(huán)境中,其中需要較窄的動(dòng)態(tài)范圍以避免過(guò)調(diào)制。對(duì)于另一示例,遵照MPEG-2 AAC標(biāo)準(zhǔn)和MPEG-4音頻標(biāo)準(zhǔn)的編碼信號(hào)包括用于標(biāo)識(shí)編碼音頻信息的平均響度水平的元數(shù)據(jù)。對(duì)遵照MPEG-2 AAC和MPEG-4音頻的編碼信號(hào)進(jìn)行解碼的處理可允許收聽(tīng)者指定期望的回放水平。解碼器使用該期望的回放水平和平均響度元數(shù)據(jù)來(lái)調(diào)整解碼信號(hào)的幅度,以實(shí)現(xiàn)期望的回放水平。當(dāng)手持式和其它類(lèi)型的便攜式裝置被用于根據(jù)這些元數(shù)據(jù)參數(shù)來(lái)對(duì)遵照ATSC、遵照MPEG-2 AAC以及遵照MPEG-4音頻的編碼信號(hào)的音頻內(nèi)容進(jìn)行解碼和回放時(shí),動(dòng)態(tài)范圍和響度水平通常是不適合的,這是由于這些類(lèi)型的裝置所遇到的不利的收聽(tīng)環(huán)境或者由于因在這些裝置中使用的較低操作電壓而導(dǎo)致的電限制。遵照其它標(biāo)準(zhǔn)的編碼信號(hào)使用類(lèi)似類(lèi)型的元數(shù)據(jù),并且可包括用于指定期望的回放響度水平的規(guī)定。對(duì)這些信號(hào)進(jìn)行解碼的便攜式裝置通常遇到相同的問(wèn)題。本發(fā)明可用于改進(jìn)手持式和便攜式裝置的用戶的收聽(tīng)體驗(yàn),而不需要專(zhuān)門(mén)為這些裝置準(zhǔn)備的內(nèi)容。
B.裝置概述圖I是包括本發(fā)明的各個(gè)方面的一種類(lèi)型的接收器/解碼器裝置10的示意框圖。裝置10從信號(hào)路徑11接收編碼輸入信號(hào),在反格式化器12中應(yīng)用適當(dāng)?shù)奶幚硪詮妮斎胄盘?hào)提取編碼音頻信息和相關(guān)聯(lián)的元數(shù)據(jù),將編碼音頻信息傳遞到解碼器14并且沿信號(hào)路徑13傳遞元數(shù)據(jù)。編碼音頻信息包括表示聽(tīng)覺(jué)刺激的譜內(nèi)容的編碼子帶信號(hào),并且元數(shù)據(jù)指定多種參數(shù)的值,這多種參數(shù)包括一個(gè)或多個(gè)解碼控制參數(shù)以及用于根據(jù)動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮的一個(gè)或多個(gè)參數(shù)。術(shù)語(yǔ)“動(dòng)態(tài)范圍壓縮簡(jiǎn)檔”指的是諸如增益因子、壓縮進(jìn)行(compress attack)次數(shù)和壓縮釋放(compress release)次數(shù)的特征,這些特征定義了動(dòng)態(tài)范圍壓縮器的操作特性。解碼器14對(duì)編碼音頻信息應(yīng)用解碼處理以獲得解碼子帶信號(hào),該解碼子帶信號(hào)被傳遞到動(dòng)態(tài)范圍控制16??身憫?yīng)于從信號(hào)路徑13接收的解碼控制參數(shù)來(lái)調(diào)節(jié)解碼處理 的操作和功能??捎糜谡{(diào)節(jié)解碼處理的操作和功能的解碼控制參數(shù)的示例是用于標(biāo)識(shí)音頻信道的數(shù)量和配置的參數(shù),其中該音頻信道由編碼音頻信息表示。動(dòng)態(tài)范圍控制16可選地調(diào)整解碼音頻信息的動(dòng)態(tài)范圍。該調(diào)整可響應(yīng)于從信號(hào)路徑13和/或從控制信號(hào)接收的元數(shù)據(jù)而被啟動(dòng)或關(guān)閉以及調(diào)節(jié),其中可響應(yīng)于來(lái)自收聽(tīng)者的輸入來(lái)提供該控制信號(hào)。例如,可響應(yīng)于收聽(tīng)者操作開(kāi)關(guān)或者選擇用于裝置10的操作選項(xiàng)來(lái)提供控制信號(hào)。
在遵照例如ATSC標(biāo)準(zhǔn)、MPEG-2 AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn)的實(shí)施中,編碼輸入信號(hào)包括以段或幀的序列布置的編碼音頻信息。各個(gè)幀包含如下編碼子帶信號(hào)這些編碼子帶信號(hào)表示具有其完全動(dòng)態(tài)范圍的音頻信號(hào)的譜分量。動(dòng)態(tài)范圍控制16可不采取動(dòng)作,這允許以最大的動(dòng)態(tài)范圍量來(lái)回放音頻信號(hào),或者動(dòng)態(tài)范圍控制16可修改解碼子帶信號(hào),以按照不同的程度來(lái)壓縮動(dòng)態(tài)范圍。合成濾波器組18對(duì)解碼子帶信號(hào)應(yīng)用可由動(dòng)態(tài)范圍控制16調(diào)整的一組合成濾波器,并且在其輸出處提供可以是數(shù)字或模擬信號(hào)的時(shí)域音頻信號(hào)。增益-限制器20在本發(fā)明的一些實(shí)施中用于調(diào)整時(shí)域音頻信號(hào)的幅度。增益-限制器20的輸出沿著路徑21傳遞,以用于隨后由聲換能器進(jìn)行呈現(xiàn)。圖2是包括本發(fā)明的各個(gè)方面的編碼器/發(fā)送器裝置30的示意框圖。裝置30從信號(hào)路徑31接收表示聽(tīng)覺(jué)刺激的音頻輸入信號(hào)。裝置30對(duì)音頻信號(hào)應(yīng)用一組分析濾波器,以獲得作為輸入音頻信號(hào)的頻域表示的子帶信號(hào)或者表示輸入音頻信號(hào)的一組帶限信號(hào)。元數(shù)據(jù)計(jì)算器34對(duì)音頻輸入信號(hào)和/或從音頻輸入信號(hào)獲得的一個(gè)或多個(gè)信號(hào)(諸如來(lái)自分析濾波器組32的子帶信號(hào)或音頻輸入信號(hào)的變型形式)進(jìn)行分析,以計(jì)算指定多種參數(shù)的值的元數(shù)據(jù),這多種參數(shù)包括編碼控制參數(shù)、一個(gè)或多個(gè)解碼控制參數(shù)以及用于根據(jù)動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮的一個(gè)或多個(gè)參數(shù)。元數(shù)據(jù)計(jì)算器34可對(duì)時(shí)域信號(hào)、頻域信號(hào)或者時(shí)域和頻域信號(hào)的組合進(jìn)行分析。也可響應(yīng)于從路徑33接收的一個(gè)或多個(gè)元數(shù)據(jù)參數(shù)來(lái)調(diào)節(jié)由元數(shù)據(jù)計(jì)算器34執(zhí)行的計(jì)算。編碼器36對(duì)分析濾波器組32的輸出應(yīng)用編碼處理,以獲得包括編碼子帶信號(hào)的編碼音頻信息,該編碼音頻信息被傳遞到格式化器38??身憫?yīng)于從路徑33接收的編碼控制參數(shù)來(lái)調(diào)節(jié)編碼處理。編碼處理還可生成沿著路徑33的其它解碼控制參數(shù),以供在裝置10中執(zhí)行的處理用于對(duì)編碼音頻信息進(jìn)行解碼。格式化器38將編碼音頻信息和元數(shù)據(jù)中的至少一些元數(shù)據(jù)匯編成為具有適合于傳輸或存儲(chǔ)的格式的編碼輸出信號(hào),該元數(shù)據(jù)包括一個(gè)或多個(gè)解碼控制參數(shù)以及用于指定動(dòng)態(tài)范圍壓縮的一個(gè)或多個(gè)參數(shù)。在遵照例如ATSC標(biāo)準(zhǔn)、MPEG-2 AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn)的實(shí)施中,編碼輸出信號(hào)包括以段或幀的序列布置的編碼音頻信息。各個(gè)幀包含如下編碼子帶信號(hào)這些編碼子帶信號(hào)表示具有其完全動(dòng)態(tài)范圍的音頻信號(hào)的譜分量,并且具有用于以參考再現(xiàn)水平進(jìn)行回放的幅度。反格式化器12、解碼器14、合成濾波器組18、分析濾波器組32、編碼器36以及格式化器38在設(shè)計(jì)和操作方面可以是傳統(tǒng)的。一些示例包括遵照上述公開(kāi)標(biāo)準(zhǔn)的相應(yīng)部件。在這些標(biāo)準(zhǔn)中指定或提出的部件的實(shí)施適合用于本發(fā)明,但并非必需這些部件。這些部件的特定實(shí)施都不是必須的。圖3至圖5是包括上述裝置10和裝置30中的一些部件的轉(zhuǎn)碼器裝置40的不同實(shí)施的示意框圖。這些部件與它們的對(duì)應(yīng)部件基本上相同地工作。圖3所示的裝置40能夠?qū)穆窂?1接收的編碼輸入信號(hào)轉(zhuǎn)碼成遵照相同編碼標(biāo)準(zhǔn)的變型形式。在該實(shí)施中,裝置40從信號(hào)路徑11接收編碼輸入信號(hào),在反格式化器12中應(yīng)用適當(dāng)?shù)奶幚硪詮木幋a輸入信號(hào)提取第一編碼音頻信息和相關(guān)聯(lián)的元數(shù)據(jù),將第一編碼音頻信息傳遞到解碼器14和格式化器38,并且沿著信號(hào)路徑43傳遞元數(shù)據(jù)。第一編碼音頻信息包括表示聽(tīng)覺(jué)刺激的譜內(nèi)容的編碼子帶信號(hào),并且元數(shù)據(jù)指定多種參數(shù)的值,這多種參數(shù)包括一個(gè)或多個(gè)解碼控制參數(shù)以及用于根據(jù)第一動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮的一個(gè)或多個(gè)參數(shù)。解碼器14對(duì)第一編碼音頻信息應(yīng)用解碼處理以獲得解碼子帶信號(hào)??身憫?yīng)于從信號(hào)路徑43接收的一個(gè)或多個(gè)解碼控制參數(shù)來(lái)調(diào)節(jié)解碼處理的操作和功能。子帶信號(hào)可以是聽(tīng)覺(jué)刺激的頻域表示或者表示聽(tīng)覺(jué)刺激的一組帶限信號(hào)。元數(shù)據(jù)計(jì)算器44對(duì)解碼子帶信號(hào)和/或從解碼子帶信號(hào)得到的一個(gè)或多個(gè)信號(hào)進(jìn)行分析,以計(jì)算用于根據(jù)第二動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮的一個(gè)或多個(gè)參數(shù)值。例如,可通過(guò)對(duì)解碼子帶信號(hào)應(yīng)用合成濾波器組18來(lái)得到一個(gè)或多個(gè)信號(hào)??身憫?yīng)于從路徑43接收的元數(shù)據(jù)來(lái)調(diào)節(jié)由元數(shù)據(jù)計(jì)算器44執(zhí)行的計(jì)算。如果合成濾波器組18的輸出不需要用于元數(shù)據(jù)計(jì)算,則可從該實(shí)施中省略合成濾波器組18。 圖4中示出了裝置40的另一實(shí)施。該實(shí)施與圖3所示的實(shí)施類(lèi)似,但是包括編碼器36。包括編碼器36允許裝置40將遵照第一編碼標(biāo)準(zhǔn)的、從路徑11接收的編碼輸入信號(hào)轉(zhuǎn)碼成遵照第二編碼標(biāo)準(zhǔn)的編碼輸出信號(hào),該第二編碼標(biāo)準(zhǔn)可與第一編碼標(biāo)準(zhǔn)相同或不同,只要兩個(gè)編碼標(biāo)準(zhǔn)的子帶信號(hào)兼容即可。這可在該實(shí)施中通過(guò)使編碼器36對(duì)子帶信號(hào)應(yīng)用編碼處理以獲得遵照第二編碼標(biāo)準(zhǔn)的第二編碼音頻信息來(lái)實(shí)現(xiàn)。第二編碼音頻信息被傳遞到格式化器38。可響應(yīng)于從路徑43接收的元數(shù)據(jù)來(lái)調(diào)節(jié)編碼處理。編碼處理還可生成沿著路徑43的其它元數(shù)據(jù),以供在裝置10中執(zhí)行的處理用于對(duì)編碼音頻信息解碼。格式化器38將從路徑43接收的元數(shù)據(jù)和其接收的編碼音頻信息匯編成具有適合于傳輸或存儲(chǔ)的格式的編碼輸出信號(hào)。圖5中示出了裝置40的又一實(shí)現(xiàn)。該實(shí)現(xiàn)包括合成濾波器組18,該合成濾波器組18被應(yīng)用于解碼子帶信號(hào),以獲得編碼音頻信息的時(shí)域或?qū)拵П硎尽0ê铣蔀V波器組18和分析濾波器組32允許裝置40在基本上任意編碼標(biāo)準(zhǔn)選擇之間進(jìn)行轉(zhuǎn)碼。合成濾波器組18的輸出被傳遞到分析濾波器組32,分析濾波器組32生成子帶信號(hào),以供編碼器36進(jìn)行編碼。編碼器36對(duì)分析濾波器組32的輸出應(yīng)用編碼處理,以獲得第二編碼音頻信息,該第二編碼音頻信息被傳遞到格式化器38。編碼處理還可生成沿著路徑43的其它元數(shù)據(jù),以供在裝置10中執(zhí)行的處理用于對(duì)編碼音頻信息解碼。元數(shù)據(jù)計(jì)算器44可根據(jù)其對(duì)從解碼器14接收的子帶信號(hào)、合成濾波器組18的輸出以及分析濾波器組32的輸出中的任意或全部的分析來(lái)計(jì)算元數(shù)據(jù)參數(shù)值。以下更詳細(xì)地描述裝置10和裝置30的一些方面。這些描述適用于裝置40的相應(yīng)特征。這些方面是按照遵照上述ATSC標(biāo)準(zhǔn)的方法和裝置的特征和特性來(lái)描述的。這些具體特征和特性僅作為示例來(lái)討論。這些實(shí)施中的根本原理直接適用于遵照其它標(biāo)準(zhǔn)的方法和裝置。C.接收器/解碼器上述回放問(wèn)題可通過(guò)使用下述三種不同技術(shù)中的一種或多種來(lái)解決。第一技術(shù)使用增益限制并且可通過(guò)僅在裝置10中的特征來(lái)實(shí)施。第二技術(shù)和第三技術(shù)使用動(dòng)態(tài)范圍壓縮,并且其實(shí)施需要在裝置10和裝置30兩者中的特征。 I.增益-限制器第一技術(shù)以RF模式而不是以線模式來(lái)操作裝置10,以使得其利用動(dòng)態(tài)范圍控制16對(duì)遵照ATSC的編碼輸入信號(hào)進(jìn)行解碼,動(dòng)態(tài)范圍控制16提供較高的動(dòng)態(tài)范圍壓縮水平和較高的參考再現(xiàn)水平。增益-限制器20提供額外的增益,從而將有效參考再現(xiàn)水平提高到從-14dBFS到-8dBFS的值。經(jīng)驗(yàn)結(jié)果表明等于-lldBFS的參考水平對(duì)于很多應(yīng)用給出良好結(jié)果。增益-限制器20還應(yīng)用限制操作,以防止放大的數(shù)字信號(hào)超過(guò)0dBFS。限制器的操作特性可以影響再現(xiàn)音頻的感知質(zhì)量,但是沒(méi)有特定限制器對(duì)本發(fā)明而言是必須的。限制器可基本上以任意可能期望的方式來(lái)實(shí)施。優(yōu)選地,限制器被設(shè)計(jì)成提供“軟”限制功能而非“硬”限幅功能。2.差分壓縮值第二技術(shù)允許裝置10在動(dòng)態(tài)范圍控制16中應(yīng)用一個(gè)或多個(gè)修改的動(dòng)態(tài)范圍壓縮參數(shù)。反格式化器12從編碼輸入信號(hào)獲得差分動(dòng)態(tài)范圍壓縮(DRC)參數(shù)值,并且沿著路徑13將差分參數(shù)值與傳統(tǒng)的DRC參數(shù)值一起傳遞到動(dòng)態(tài)范圍控制16。動(dòng)態(tài)范圍控制16通過(guò)對(duì)傳統(tǒng)的DRC參數(shù)值和對(duì)應(yīng)的差分DRC參數(shù)值進(jìn)行算術(shù)組合來(lái)計(jì)算所需的一個(gè)或多個(gè)DRC參數(shù)值。在該情形中不需要使用增益-限制器20。由生成編碼輸入信號(hào)的編碼器/發(fā)送器裝置30在編碼輸入信號(hào)中提供差分DRC參數(shù)值。這在以下進(jìn)行描述。如果編碼輸入信號(hào)不包含這些差分DRC值,則裝置10可以使用根據(jù)上述第一技術(shù)的增益-限制器20。3.獨(dú)特壓縮簡(jiǎn)檔第三技術(shù)允許裝置10在動(dòng)態(tài)范圍控制16中應(yīng)用根據(jù)新動(dòng)態(tài)范圍壓縮簡(jiǎn)檔的動(dòng)態(tài)范圍壓縮。反格式化器12從編碼輸入信號(hào)獲得新簡(jiǎn)檔的一個(gè)或多個(gè)DRC參數(shù)值,并且沿路徑13將它們傳遞到動(dòng)態(tài)范圍控制16。在該情形中不需要使用增益-限制器20。由生成編碼輸入信號(hào)的編碼器/發(fā)送器裝置30在編碼輸入信號(hào)中提供新動(dòng)態(tài)范圍壓縮簡(jiǎn)檔的DRC參數(shù)值。這在以下進(jìn)行描述。
如果編碼輸入信號(hào)不包含新DRC簡(jiǎn)檔的一個(gè)或多個(gè)DRC參數(shù)值,則裝置10可以使用根據(jù)上述第一技術(shù)的增益-限制器20。D.編碼器/發(fā)送器I.差分壓縮值在裝置10中通過(guò)使用從編碼輸入信號(hào)提取的差分DRC參數(shù)值來(lái)實(shí)施上述第二技術(shù)的處理。這些差分參數(shù)值由生成編碼信號(hào)的裝置30來(lái)提供。裝置30提供一組差分DRC參數(shù)值,這組差分DRC參數(shù)值表示將存在于編碼信號(hào)中的一組DRC參數(shù)值與新DRC簡(jiǎn)檔的一組對(duì)應(yīng)的基本參數(shù)值之間的差,并且是防止解碼音頻信號(hào)樣本超過(guò)0dBFS以實(shí)現(xiàn)較高的參考再現(xiàn)水平所需的。用于計(jì)算DRC參數(shù)值的特定方法都不是本發(fā)明必須的。在由高級(jí)電視業(yè)務(wù)顧問(wèn)委員會(huì)有限公司(AdvancedTelevision Systems Committee, Inc.)在 2009 年 11 月 4 日公布的 “ATSC RecommendedPractice:Techniques for Estalishiing an Maintaining Audio Loudness for Digital Television”,文檔A/85 (尤其是在第9節(jié)和附錄F)中以及在Robinson等人的“DynamicRange Control via Metadata”,預(yù)印號(hào) 5028,107th AES convention,紐約,1999 年 9 月中公開(kāi)了遵照ATSC標(biāo)準(zhǔn)的用于計(jì)算參數(shù)值的公知方法。如果編碼輸出信號(hào)遵照ATSC標(biāo)準(zhǔn)、MPEG-2 AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn),則參考再現(xiàn)水平增加到從-14dBFS到-8dBFS的值。經(jīng)驗(yàn)結(jié)果表明等于-lldBFS的參考水平對(duì)于很多應(yīng)用給出良好結(jié)果。對(duì)于遵照ATSC的編碼輸出信號(hào),元數(shù)據(jù)計(jì)算器34計(jì)算對(duì)于該標(biāo)準(zhǔn)中指定的對(duì)應(yīng)的基本參數(shù)“compr”的差分參數(shù)值。格式化器38可將差分參數(shù)值匯編成各個(gè)編碼信號(hào)幀的標(biāo)記為“addbsi”(額外比特流信息)和/或“auxdata”(輔助數(shù)據(jù))的部分。如果差分參數(shù)值被匯編成“addbsi ”部分或“auxdata”部分,則編碼信號(hào)將與所有遵照ATSC的解碼器兼容。不能識(shí)別差分參數(shù)值的那些解碼器仍然可以通過(guò)忽略“addbsi”和“auxdata”部分而正確地對(duì)編碼信號(hào)幀進(jìn)行處理和解碼。參考以上引用的A/52b文獻(xiàn)文檔以得到更多細(xì)節(jié)。對(duì)于遵照MPEG-2 AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn)的編碼輸出信號(hào),格式化器38可將差分參數(shù)值匯編成各個(gè)編碼信號(hào)幀的在兩個(gè)標(biāo)準(zhǔn)中被標(biāo)記為“Fill_Element”或“Data_StreanuElement”的部分。如果差分參數(shù)值被匯編成這些部分之一,則編碼信號(hào)將與所有遵照MPEG-2 AAC標(biāo)準(zhǔn)和MPEG-4音頻標(biāo)準(zhǔn)的解碼器兼容。參考以上引用的IS0/IEC 13818-7和IS0/IEC 14496-3文檔以得到更多細(xì)節(jié)。可計(jì)算差分參數(shù)值,并以大于、等于或小于對(duì)應(yīng)的基本參數(shù)值在編碼信號(hào)中的速率的速率來(lái)將差分參數(shù)值插入到編碼信號(hào)中。差分值的速率可變化。用于表示先前的差分值是否應(yīng)該再次使用的標(biāo)志或比特也可包括在編碼信號(hào)中。2.獨(dú)特壓縮簡(jiǎn)檔在裝置10中通過(guò)使用從編碼輸入信號(hào)提取的、新動(dòng)態(tài)范圍壓縮簡(jiǎn)檔的DRC參數(shù)值來(lái)實(shí)施上述第三技術(shù)的處理。這些參數(shù)值由生成編碼信號(hào)的裝置30來(lái)提供。裝置30通過(guò)計(jì)算如下參數(shù)值來(lái)得到新DRC簡(jiǎn)檔的DRC參數(shù)值這些參數(shù)值是防止解碼音頻信號(hào)樣本超過(guò)0dBFS以得到較高的參考再現(xiàn)水平所需的。如果編碼輸出信號(hào)遵照ATSC標(biāo)準(zhǔn)、MPEG-2 AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn),則元數(shù)據(jù)計(jì)算器34基于參考再現(xiàn)水平增加到從-14dBFS到-8dBFS的值這一假設(shè)來(lái)計(jì)算DRC壓縮值。經(jīng)驗(yàn)結(jié)果表明等于-lldBFS的參考水平對(duì)于很多應(yīng)用給出良好結(jié)果。格式化器38可將DRC簡(jiǎn)檔的參數(shù)值匯編成各個(gè)編碼信號(hào)幀的如上所述的用于差分參數(shù)的部分。幀的這些部分的使用允許編碼信號(hào)與遵照各個(gè)標(biāo)準(zhǔn)的所有解碼器兼容。 E.實(shí)現(xiàn) 包括本發(fā)明的各個(gè)方面的裝置可以以多種方式來(lái)實(shí)現(xiàn),這些方式包括用于由計(jì)算機(jī)或某種其它裝置執(zhí)行的軟件,該其他裝置包括耦合到與通用計(jì)算機(jī)中發(fā)現(xiàn)的部件類(lèi)似的部件的更專(zhuān)用的部件(諸如數(shù)字信號(hào)處理器(DSP)電路)。圖6是可用于實(shí)施本發(fā)明的方面的裝置70的示意框圖。處理器72提供計(jì)算資源。RAM 73是被處理器72用于進(jìn)行處理的系統(tǒng)隨機(jī)存取存儲(chǔ)器(RAM)。ROM 74表示某種形式的持久存儲(chǔ)裝置(諸如只讀存儲(chǔ)器(ROM)),其用于存儲(chǔ)操作裝置70所需的程序并且可以用于執(zhí)行本發(fā)明的各個(gè)方面。I/O控制75表示用于利用通信信道76、77接收輸入信號(hào)和發(fā)送輸出信號(hào)的接口電路。在所示出的實(shí)施例中,所有主要的系統(tǒng)部件均連接到總線71,總線71可表示多于一個(gè)物理或邏輯總線;然而,總線架構(gòu)不是實(shí)現(xiàn)本發(fā)明必須的。
在由通用計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)的實(shí)施例中,可包括額外的部件,用于與諸如鍵盤(pán)或鼠標(biāo)和顯示器的裝置接口,以及用于控制具有存儲(chǔ)介質(zhì)(諸如磁帶或磁盤(pán)、或者光學(xué)介質(zhì))的存儲(chǔ)裝置78。存儲(chǔ)介質(zhì)可用于記錄用于操作系統(tǒng)、用途以及應(yīng)用的指令的程序,并且可包括實(shí)施本發(fā)明的各個(gè)方面的程序。實(shí)踐本發(fā)明的各個(gè)方面所需的功能可以由以多種方式實(shí)施的部件來(lái)執(zhí)行,這些部件包括分立邏輯部件、集成電路、一個(gè)或多個(gè)ASIC和/或程序控制處理器。這些部件實(shí)現(xiàn)的方式對(duì)本發(fā)明并不重要。本發(fā)明的軟件實(shí)施可通過(guò)多種機(jī)器可讀介質(zhì)(諸如貫穿包括從超聲頻率到紫外線頻率的頻譜的調(diào)制通信信道或基帶)或者使用基本上任何記錄技術(shù)表達(dá)信息的存儲(chǔ)介質(zhì)(包括磁帶、卡或盤(pán)、光卡或光盤(pán)、以及包括紙的介質(zhì)上的可檢測(cè)標(biāo)記)來(lái)表達(dá)。
權(quán)利要求
1.一種用于對(duì)編碼輸入信號(hào)進(jìn)行解碼以生成音頻輸出信號(hào)的方法,其中,所述方法包括 接收包括編碼音頻信息和相關(guān)聯(lián)的元數(shù)據(jù)的所述編碼輸入信號(hào),所述相關(guān)聯(lián)的元數(shù)據(jù)包括一個(gè)或多個(gè)解碼控制參數(shù)以及一個(gè)或多個(gè)第一參數(shù),所述一個(gè)或多個(gè)第一參數(shù)根據(jù)第一動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮,并且所述相關(guān)聯(lián)的元數(shù)據(jù)可選地包括一個(gè)或多個(gè)第二參數(shù),所述一個(gè)或多個(gè)第二參數(shù)根據(jù)第二動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮,其中,所述一個(gè)或多個(gè)第一參數(shù)具有下述值根據(jù)生成所述編碼音頻信息的編碼處理而設(shè)置所述值,以表示具有用于以第一參考再現(xiàn)水平進(jìn)行回放的、不超過(guò)限幅水平的幅度的聽(tīng)覺(jué)刺激;并且其中,所述一個(gè)或多個(gè)第二參數(shù)具有下述值根據(jù)生成所述編碼音頻信息的編碼處理而設(shè)置所述值,以表示具有用于以第二參考再現(xiàn)水平進(jìn)行回放的、不超過(guò)所述限幅水平的幅度的所述聽(tīng)覺(jué)刺激,所述第二參考再現(xiàn)水平高于所述第一參考再現(xiàn)水平;對(duì)所述編碼音頻信息應(yīng)用解碼處理,以獲得表示所述聽(tīng)覺(jué)刺激的譜內(nèi)容的子帶信號(hào),其中,響應(yīng)于所述一個(gè)或多個(gè)解碼控制參數(shù)來(lái)調(diào)節(jié)所述解碼處理; 修改所述子帶信號(hào),以獲得具有改變的動(dòng)態(tài)范圍特性的修改子帶信號(hào),其中,如果所述元數(shù)據(jù)包括所述一個(gè)或多個(gè)第二參數(shù),則響應(yīng)于所述一個(gè)或多個(gè)第二參數(shù)來(lái)調(diào)節(jié)所述修改,或者如果所述元數(shù)據(jù)不包括所述一個(gè)或多個(gè)第二參數(shù),則響應(yīng)于所述一個(gè)或多個(gè)第一參數(shù)來(lái)調(diào)節(jié)所述修改; 對(duì)所述修改子帶信號(hào)應(yīng)用合成濾波器組,以獲得時(shí)域音頻信號(hào);以及如果所述元數(shù)據(jù)不包括所述一個(gè)或多個(gè)第二參數(shù),則響應(yīng)于所述元數(shù)據(jù)而對(duì)所述時(shí)域音頻信號(hào)施加增益并應(yīng)用限制器,其中,所述增益的施加修改所述時(shí)域音頻信號(hào),以獲得具有用于以所述第二參考再現(xiàn)水平進(jìn)行回放的幅度的所述音頻輸出信號(hào),并且其中,所述限制器的應(yīng)用防止所述音頻輸出信號(hào)的幅度超過(guò)所述限幅水平。
2.根據(jù)權(quán)利要求I所述的方法,其中,所述一個(gè)或多個(gè)第二參數(shù)表示所述第一動(dòng)態(tài)范圍壓縮簡(jiǎn)檔和所述第二動(dòng)態(tài)范圍壓縮簡(jiǎn)檔的對(duì)應(yīng)參數(shù)之間的差。
3.根據(jù)權(quán)利要求I或2所述的方法,其中,所述編碼輸入信號(hào)遵照ATSC標(biāo)準(zhǔn)、MPEG-2AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn),所述第一參考再現(xiàn)水平對(duì)應(yīng)于低于所述限幅水平20dB的幅度,并且所述第二參考再現(xiàn)水平對(duì)應(yīng)于低于所述限幅水平IldB的幅度。
4.一種用于對(duì)表示聽(tīng)覺(jué)刺激的音頻輸入信號(hào)進(jìn)行編碼的方法,其中,所述方法包括 接收所述音頻輸入信號(hào); 對(duì)所述音頻輸入信號(hào)應(yīng)用分析濾波器組,以生成表示所述音頻輸入信號(hào)的譜內(nèi)容的子帶信號(hào); 分析從所述音頻輸入信號(hào)得到的一個(gè)或多個(gè)信號(hào),以計(jì)算元數(shù)據(jù),所述元數(shù)據(jù)包括一個(gè)或多個(gè)第一參數(shù)以及一個(gè)或多個(gè)第二參數(shù),所述一個(gè)或多個(gè)第一參數(shù)根據(jù)第一動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮,而所述一個(gè)或多個(gè)第二參數(shù)根據(jù)第二動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮,其中,所述一個(gè)或多個(gè)第一參數(shù)具有下述值所述值被設(shè)置為表示具有用于以第一參考再現(xiàn)水平進(jìn)行回放的、不超過(guò)限幅水平的幅度的所述聽(tīng)覺(jué)刺激,并且其中,所述一個(gè)或多個(gè)第二參數(shù)具有下述值所述值被設(shè)置為表示具有用于以第二參考再現(xiàn)水平進(jìn)行回放的、不超過(guò)所述限幅水平的幅度的所述聽(tīng)覺(jué)刺激;對(duì)所述子帶信號(hào)應(yīng)用編碼處理,以獲得編碼音頻信息;以及將所述編碼音頻信息和所述元數(shù)據(jù)匯編成具有適合于傳輸或存儲(chǔ)的格式的編碼輸出信號(hào),其中,所述一個(gè)或多個(gè)第二參數(shù)表示所述第一動(dòng)態(tài)范圍壓縮簡(jiǎn)檔和所述第二動(dòng)態(tài)范圍壓縮簡(jiǎn)檔的對(duì)應(yīng)參數(shù)之間的差。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述編碼輸出信號(hào)遵照ATSC標(biāo)準(zhǔn)、MPEG-2AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn),所述第一參考再現(xiàn)水平對(duì)應(yīng)于低于所述限幅水平20dB的幅度,并且所述第二參考再現(xiàn)水平對(duì)應(yīng)于低于所述限幅水平IldB的幅度。
6.一種用于對(duì)編碼輸入信號(hào)進(jìn)行轉(zhuǎn)碼以生成編碼輸出信號(hào)的方法,其中,所述方法包括 接收包括第一編碼音頻信息和相關(guān)聯(lián)的元數(shù)據(jù)的所述編碼輸入信號(hào),所述相關(guān)聯(lián)的元數(shù)據(jù)包括一個(gè)或多個(gè)解碼控制參數(shù)以及一個(gè)或多個(gè)第一參數(shù),所述一個(gè)或多個(gè)第一參數(shù)根據(jù)第一動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮,其中,所述一個(gè)或多個(gè)第一參數(shù)具有下述值根據(jù)生成所述第一編碼音頻信息的第一編碼處理而設(shè)置所述值,以表示具有用于以第 一參考再現(xiàn)水平進(jìn)行回放的、不超過(guò)限幅水平的幅度的聽(tīng)覺(jué)刺激; 對(duì)所述第一編碼音頻信息應(yīng)用解碼處理,以獲得表示所述聽(tīng)覺(jué)刺激的譜內(nèi)容的子帶信號(hào),其中,響應(yīng)于所述一個(gè)或多個(gè)解碼控制參數(shù)來(lái)調(diào)節(jié)所述解碼處理; 分析從所述子帶信號(hào)獲得的一個(gè)或多個(gè)信號(hào),以計(jì)算一個(gè)或多個(gè)第二參數(shù),所述一個(gè)或多個(gè)第二參數(shù)根據(jù)第二動(dòng)態(tài)范圍壓縮簡(jiǎn)檔來(lái)指定動(dòng)態(tài)范圍壓縮,其中,所述一個(gè)或多個(gè)第二參數(shù)具有下述值所述值被設(shè)置為表示具有用于以第二參考再現(xiàn)水平進(jìn)行回放的、不超過(guò)所述限幅水平的幅度的所述聽(tīng)覺(jué)刺激;以及 將第二編碼音頻信息、所述一個(gè)或多個(gè)第一參數(shù)以及所述一個(gè)或多個(gè)第二參數(shù)匯編成具有適合于傳輸或存儲(chǔ)的格式的編碼輸出信號(hào),其中,所述第二編碼音頻信息是所述子帶信號(hào)的編碼表不。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述一個(gè)或多個(gè)第二參數(shù)表示所述第一動(dòng)態(tài)范圍壓縮簡(jiǎn)檔和所述第二動(dòng)態(tài)范圍壓縮簡(jiǎn)檔的對(duì)應(yīng)參數(shù)之間的差。
8.根據(jù)權(quán)利要求6或7所述的方法,包括對(duì)所述子帶信號(hào)應(yīng)用合成濾波器組以獲得所述一個(gè)或多個(gè)信號(hào),其中所述一個(gè)或多個(gè)信號(hào)被分析以計(jì)算指定動(dòng)態(tài)范圍壓縮的所述一個(gè)或多個(gè)第二參數(shù)。
9.根據(jù)權(quán)利要求6至8中任一項(xiàng)所述的方法,包括對(duì)所述子帶信號(hào)應(yīng)用第二編碼處理,以生成所述第二編碼音頻信息。
10.根據(jù)權(quán)利要求6至8中任一項(xiàng)所述的方法,其中,所述第二編碼音頻信息是所述第一編碼首頻彳目息。
11.根據(jù)權(quán)利要求6至10中任一項(xiàng)所述的方法,其中,所述編碼輸入信號(hào)遵照ATSC標(biāo)準(zhǔn)、MPEG-2 AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn),并且所述第一參考再現(xiàn)水平對(duì)應(yīng)于低于所述限幅水平20dB的幅度。
12.根據(jù)權(quán)利要求6至10中任一項(xiàng)所述的方法,其中,所述編碼輸出信號(hào)遵照ATSC標(biāo)準(zhǔn)、MPEG-2 AAC標(biāo)準(zhǔn)或MPEG-4音頻標(biāo)準(zhǔn),并且所述第二參考再現(xiàn)水平對(duì)應(yīng)于低于所述限幅水平IldB的幅度。
13.一種設(shè)備,包括用于執(zhí)行根據(jù)權(quán)利要求I至12中任一項(xiàng)所述的方法的步驟的裝置。
14.一種用于記錄指令程序的存儲(chǔ)介質(zhì),所述指令程序能夠由裝置執(zhí)行,以執(zhí)行根據(jù)權(quán)利要求I至12中任一項(xiàng)所述的方法的 步驟。
全文摘要
許多便攜式回放裝置無(wú)法以一致的響度和可理解度對(duì)具有寬帶寬和寬動(dòng)態(tài)范圍的編碼音頻內(nèi)容進(jìn)行解碼和回放,除非編碼音頻內(nèi)容是專(zhuān)門(mén)為這些裝置準(zhǔn)備的??梢酝ㄟ^(guò)使編碼內(nèi)容包括一些元數(shù)據(jù)來(lái)克服該問(wèn)題,該元數(shù)據(jù)根據(jù)相對(duì)于另一已知壓縮簡(jiǎn)檔的差分值或絕對(duì)值來(lái)指定適當(dāng)?shù)膭?dòng)態(tài)范圍壓縮簡(jiǎn)檔?;胤叛b置還可自適應(yīng)地對(duì)回放音頻施加增益和限制。公開(kāi)了在編碼器、轉(zhuǎn)碼器和解碼器中的實(shí)現(xiàn)。
文檔編號(hào)H03G7/00GK102754151SQ201180009098
公開(kāi)日2012年10月24日 申請(qǐng)日期2011年2月3日 優(yōu)先權(quán)日2010年2月11日
發(fā)明者哈拉爾德·H·蒙特, 杰弗里·C·里德米勒, 梅爾廷·沃爾特斯, 米夏埃爾·舒格 申請(qǐng)人:杜比國(guó)際公司, 杜比實(shí)驗(yàn)室特許公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
海丰县| 盐边县| 施秉县| 荔波县| 十堰市| 德惠市| 二连浩特市| 合水县| 公主岭市| 靖远县| 阳朔县| 五寨县| 铜川市| 长兴县| 靖边县| 南京市| 都匀市| 永顺县| 阿荣旗| 乳山市| 罗江县| 屏东县| 克什克腾旗| 察雅县| 元江| 瓦房店市| 含山县| 荆州市| 灌阳县| 修文县| 奎屯市| 成安县| 青浦区| 仲巴县| 丹凤县| 江孜县| 墨竹工卡县| 高台县| 门头沟区| 桓台县| 江山市|