Wykorzystajmy lepiej mikrofony w smartfonach

Wykorzystajmy lepiej mikrofony w smartfonach

Pewnego dnia pracowałem nad plikiem, gdy mój iPhone wyskoczył z komunikatem: „Rozpoznano dźwięk, który może być dzwonkiem”. Rzeczywiście, właśnie zadzwonił dzwonek do drzwi.

To jedna z nowych kolekcji powiadomień o dostępności dla osób niedosłyszących. Apple wdrożyło ostatnio wiele z nich i Android Google'a zrobił to samo.

W rzeczywistości iPhone ma sporo dźwięków, których jest wyszkolony do słuchania: alarmy przeciwpożarowe, syreny, czujniki dymu, koty i psy, urządzenia (choć nie jestem pewien, które urządzenia), klaksony samochodowe, dzwonki do drzwi, trzaskanie drzwiami itp. potłuczone szkło, czajniki, bieżąca woda, płaczące, kaszlące i krzyczące dzieci. Powinieneś także wyłączyć polecenia głosowe „Hej, Siri”, jeśli słyszysz inne dźwięki. Nie wiadomo, dlaczego tak jest; jeśli telefon już nasłuchuje, dlaczego po prostu nie umieścić polecenia „Hej Siri” na liście elementów do słuchania?

Ale co by było, gdyby to rozpoznawanie dźwięku można było zmodyfikować w celu wykonywania podstawowych zadań obliczeniowych i operacyjnych? Pomyśl o tym jako o opcji dostosowania telefonu do dźwięków charakterystycznych dla Twojej firmy. Tak jak w klasycznym przykładzie uczenia maszynowego, czy telefon może usłyszeć dźwięk w miejscu pracy i powiedzieć: „Wygląda na to, że komponent XYZ tej ogromnej maszyny się przegrzewa”.

A może ta funkcja może być jeszcze bardziej przydatna, na przykład wykrywać, kiedy dana osoba schodzi korytarzem. „Uwaga! Nadchodzi Ken z działu prawnego. Ukryj się teraz”. A może mógłbyś umieścić telefon w pobliżu otwartego okna, aby usłyszeć dźwięk podjeżdżającego samochodu szefa?

Może również stać się złym narzędziem administracyjnym, ostrzegającym kogoś, jeśli przez określony czas nie zostaną wykryte żadne kliknięcia na klawiaturze. Co powiesz na przydatny identyfikator? Jeśli identyfikator dzwoniącego nie ma znaczenia, czy można go zaprogramować z głosami wszystkich użytkowników, aby mógł zgłaszać nazwę dzwoniącego? (Wersja diabelska polegałaby na identyfikacji pracowników dzwoniących na anonimową infolinię.)

Przenieś to na wyższy poziom, a smartfon będzie można dostosować tak, aby rozpoznawał żądane dźwięki, co pomoże w biznesie. Wiemy już, że systemy do wideokonferencji zawsze słuchają, nawet jeśli wyciszyłeś mikrofon, ale co by było, gdyby Twój telefon pomógł zidentyfikować, kto tak naprawdę mówi? Niektóre systemy oferują to teraz, ale nie jest to uniwersalne i nawet nie działa spójnie z systemami, które twierdzą, że je mają.

Czy spotkałeś kiedyś w pracy gadułę? Co by było, gdyby Twój telefon mógł słyszeć i przesyłać do słuchawek wyraźniejszy, wolniejszy dźwięk? Tak, możesz także wyświetlić na ekranie transkrypcję w czasie rzeczywistym, ale trudno jest patrzeć na ten ekran przez cały czas i pozostać niezauważonym. Wskazania słuchacza są bardziej dyskretne.

Następnie zawsze pojawiają się alerty „wykrywania głosu” w czasie rzeczywistym. Wyobraź sobie, że rozmawiasz ze swoim przełożonym i słyszysz: „To chyba kłamstwo”. Może to pomóc podczas prezentacji na tablicy lub słuchaczy, którzy słyszą głośne westchnienia lub ziewania prowadzące do komunikatu ostrzegawczego: „Koniec. Stracisz je. Jasne, dobry mówca powinien to wiedzieć, ale jeśli mówca koncentruje się na skomplikowanym temacie, może nie zdawać sobie sprawy, że słuchacze są rozproszeni.

Ponieważ Apple, Google i inne firmy pracują nad udoskonaleniem naprawdę przydatnych i przydatnych funkcji ułatwień dostępu, jasne jest, że za pomocą tych urządzeń można zrobić o wiele więcej.

Prawa autorskie © 2022 IDG Communications, Inc.