2024. október 18., péntek
Lukács névnapja

Madárdalok felismerése gépi tanulás segítségével

2022-01-28 14:41 | Nézettség: 436
A madarak szinte mindenütt ott vannak körülöttünk, és pusztán azáltal, hogy hallgatjuk őket, sok mindent megtudhatunk a környezetünkről. A Google új, gép tanuláson alapuló módszerével segíti az ökológusok munkáját a madárhangok felismerésében és osztályozásában.

Az ökológusok a madarakat a táplálékrendszerek és az erdők egészségének megértéséhez használják – például, ha egy erdőben több harkály van, az azt jelenti, hogy sok a holtfa. Mivel a madarak énekkel és hívásokkal kommunikálnak, iletve jelzik a területüket, a leghatékonyabb, ha hang alapján azonosítjuk őket. A szakértők hatékonyabban ismerik fel a madarakat hangjuk, mint külső jellegzetességeik alapján.
 
Az utóbbi években elterjedt hangrögzítő eszközök segítségével több ezer órányi hang vehető fel az erdőkben, amelynek segítségével jobban megérthetővé válnak az ökoszisztémák és a kritikus élőhelyek. A hangadatok manuális felülvizsgálata azonban nagyon időigényes, és a madárdalok szakértőiből igencsak kevés van. Egy gépi tanuláson (ML) alapuló megközelítés azonban nagymértékben csökkentheti az élőhely megértéséhez szükséges szakértői felülvizsgálat mennyiségét.
 
Az azonban, hogy a gépi tanulás által osztályozhatók legyenek a különböző madárhangok, több okból is kihívást jelenthet - ilyen például az egyszerre éneklő madarak a “hajnali kórus” idején, vagy például a beszűrődő szél és rovarok hangja. Ennek eredményeképpen a meglévő madárhang-osztályozó modellek nehezen tudják azonosítani a csendes, távoli és egymást átfedő hangokat. Ezek a nehéz esetek kritikusak az ökológusok számára, akik automatizált rendszerek segítségével akarják azonosítani a veszélyeztetett vagy invazív fajokat.
 
A hangfelvételek automatikus szétválasztására és az egyes fajok osztályozásának megkönnyítésére a Google egy új, felügyelet nélküli módszert javasolt az "Unsupervised Sound Separation Using Mixture Invariant Training" című tanulmányában, amely a MixIT névre hallgat. A elkülönített hangok bevonása az osztályozásba javítja a pontosságot és az osztályozás minőségét is. A Google elérhetővé tette a madárdalok elkülönítési modelljeinek forráskódját is a GitHubon.

Videó - Mi az a GitHub?

Kép és a videó forrása: https://www.youtube.com/watch?v=w3jLJU7DT5E