Siri a „suttogó”

Ez lehetne egy futurisztikus jövőbeni sci-fi film címe is, melyben egy robot fülébe instrukciókat suttognak. De számunkra ez talán a valóság is lehet…

Az Apple fejlesztői azon kezdtek el dolgozni, hogy suttogva is beszélgethessünk a virtuális személyi asszisztenssel. Most azon gondolkozhatunk, hogy ennek mi értelme is van. De ha jobban belegondolunk vannak olyan élethelyzetek, amikor ez a funkció kimondottan előnyös lehet. Például, ha könyvtárban vagy múzeumban kérdeznél valamit Siri-től, vagy ha nem akarod, hogy az egész busz azt hallgassa, hogy a telefonoddal próbálsz alkudozni, ami nem hajlandó átkapcsolni a következő számra. Esetleg ha a párod már alszik, de te mondjuk még lekapcsoltatnád Sirivel az előszoba világítását. Nyilván nem olyan dolog, amire minden nap szükség van, de azért ha meg tudják oldani, akkor miért ne.

Az Apple 2016-ban adta be a szabadalmi igényt és nemrég publikálták az úgynevezett “digitális asszisztens, ami képes suttogva válaszolni” funkciót.

Jelenleg még kezdeti szakaszban vannak a fejlesztéssel, hiszen a suttogást sem automatikusan felismerni, sem produkálni nem olyan könnyű. Az Apple elképzelése szerint a beszédhang-hullámok amplitúdóját (hangerő) és frekvenciamintázatát (valószínűleg a beszéddallamra gondolnak itt) elemeznék, ezekből a paraméterekből ítélve állapítanák meg, hogy a felhasználó suttog-e. Ha sikerül megoldaniuk a mérnököknek, akkor a tervek szerint Siri is halkan válaszolna körülbelül olyan hangerővel, mint ahogy a tulajdonos kérdezett. Ehhez viszont kelleni fog majd egy “suttogás beszédmodul” is az asszisztens beszédszintetizátorába, ugyanis suttogni nem csak annyit tesz, hogy halkabban beszélünk.

Az emberi suttogás egy elég speciális hangképzési mód. Normális beszédnél a hangszalagok három állásban lehetnek: zöngeállás (zöngés mássalhangzók és magánhangzók), légzőállás (zöngétlen mássalhangzók), h-állás (h hang kiejtése).

Amikor viszont suttogunk, akkor egyik normális hangszalagállás sincs használatban, hanem felveszünk egy negyedik, “erre a célra kialakított”, suttogóállást. Ilyenkor a hangszalagok teljesen összezárnak, és az “őket vezérlő” kannaporcok közt keletkezik rés. Épp emiatt teljesen megváltozik a beszéd akusztikai szerkezete. Épp ezért a suttogott beszédet rettenetesen nehéz technológia szempontjából detektálni.

 

Forrás:

theverge.com/

9to5mac.com/

digitaltrends.com/

iphonehacks.com/

 

 

400 Total Views 1 Views Today
Share on FacebookTweet about this on TwitterShare on Google+

hozzászólás