Hlukomer - Úvod do potlačenia hluku
Po pochopení základných rozdielov medzi potlačením hluku (potlačením okolitého hluku reproduktorov, aby ho vzdialení poslucháči jasne počuli) a aktívnym potlačením hluku (kompenzáciou vlastného okolitého hluku poslucháča), sa zamerajme na to, ako dosiahnuť potlačenie hluku.
Jednou z metód je použitie viacerých mikrofónov na potlačenie údajov. Zhromažďovanie údajov z viacerých miest povedie k tomu, že zariadenia budú prijímať podobné (ale stále rozdielne) signály. Hlasový signál prijímaný mikrofónom v blízkosti hovoriacej populácie je výrazne silnejší ako signál sekundárneho mikrofónu. Dva mikrofóny budú prijímať nehlasový zvuk na pozadí s podobnou silou signálu. Odčítajte informácie o zvuku zhromaždené mikrofónom so silným hlasom a sekundárnym mikrofónom a zostávajúcu väčšinu tvoria hlasové informácie. Čím väčšia je vzdialenosť medzi mikrofónmi, tým väčší je rozdiel v signáloch medzi bližšími a vzdialenými mikrofónmi, čo uľahčuje použitie tohto jednoduchého algoritmu na potlačenie šumu. Keď však nehovoríte alebo keď očakávate, že sa hlasové údaje časom zmenia (napríklad keď kráčate alebo beháte a váš telefón sa stále trasie), účinnosť tejto metódy sa zníži. Potlačenie šumu pomocou viacerých mikrofónov je určite spoľahlivé, existujú však nevýhody dodatočného hardvéru a spracovania.
Takže, čo keby bol len jeden mikrofón? Ak sa na overenie/porovnanie nepoužijú ďalšie zdroje zvuku, riešenie s jedným mikrofónom sa bude spoliehať na pochopenie charakteristík prijímaného šumu a ich odfiltrovanie. Súvisí to s vyššie uvedenými definíciami ustáleného a nestacionárneho hluku. Šum v ustálenom stave možno efektívne odfiltrovať pomocou algoritmov DSP, zatiaľ čo nestacionárny šum predstavuje výzvu, hlboké neurónové siete (DNN) môžu pomôcť vyriešiť problém.
Táto metóda vyžaduje súbor údajov na trénovanie siete. Tento súbor údajov pozostáva z rôzneho (ustáleného a nestacionárneho) šumu a čistej reči, čím sa vytvára syntetizovaný vzor šumu reči. Zaveďte množinu údajov ako vstup do DNN a odošlite ju čistým hlasom. Tým sa vytvorí model neurónovej siete, ktorý eliminuje šum a bude mať na výstupe iba čistú reč.
Dokonca aj s vyškolenými DNN stále existujú určité výzvy a ukazovatele, ktoré je potrebné zvážiť. Ak chcete bežať v reálnom čase s nízkou latenciou, potrebujete silný výpočtový výkon alebo menšie DNN. Čím viac parametrov v DNN, tým pomalšia je jeho rýchlosť. Vzorkovacia frekvencia zvuku má podobný vplyv na potlačenie zvuku. Vyššia vzorkovacia frekvencia znamená, že DNN musí spracovať viac parametrov, ale na druhej strane dosiahne vyššiu kvalitu výstupu. Úzkopásmová hlasová komunikácia je ideálnou voľbou na potlačenie hluku v reálnom čase.
