Kiedyś pracowałem nad plikiem, kiedy mój iPhone wyskoczył z komunikatem: „Rozpoznano dźwięk, który może być dzwonkiem”. Rzeczywiście, właśnie zadzwonił dzwonek do drzwi.

To jedna z nowej kolekcji powiadomień o ułatwieniach dostępu dla osób niedosłyszących. Firma Apple wdrożyła ostatnio wiele z nich, a Android Google poszedł w ich ślady.

W rzeczywistości iPhone ma sporo dźwięków, których jest wyszkolony do nasłuchiwania: alarmy przeciwpożarowe, syreny, czujniki dymu, koty i psy, urządzenia (chociaż nie jestem pewien, które urządzenia), klaksony samochodowe, dzwonki do drzwi, trzaski do drzwi itp. potłuczone szkło, czajniki, bieżąca woda, płacz dzieci, kaszel i krzyki. Powinieneś także wyłączyć polecenia głosowe „Hej Siri”, jeśli słuchasz innych dźwięków. Nie wiadomo, dlaczego tak się dzieje; jeśli telefon już nasłuchuje, dlaczego po prostu nie dodać polecenia „Hej Siri” na liście elementów do odsłuchania?

Ale co by było, gdyby to rozpoznawanie dźwięku można było zmodyfikować w celu wykonywania podstawowych zadań obliczeniowych i operacyjnych? Pomyśl o tym jako o opcji dostosowania telefonu, aby słyszeć dźwięki charakterystyczne dla Twojej firmy. Tak jak w klasycznym przykładzie uczenia maszynowego, telefon mógłby usłyszeć dźwięk w miejscu pracy i powiedzieć: „Wygląda na to, że komponent XYZ tej ogromnej maszyny się przegrzewa”.

A może ta funkcja może być jeszcze bardziej przydatna, na przykład wykrywać, kiedy konkretna osoba idzie korytarzem. "Alarm! Podchodzi Ken z działu prawnego. Ukryj teraz." A może mógłbyś umieścić telefon w pobliżu otwartego okna, aby słyszeć odgłos zbliżającego się samochodu szefa?

Może również stać się narzędziem do zarządzania złem, ostrzegającym kogoś, jeśli przez określony czas nie zostaną wykryte żadne kliknięcia klawiatury. Co powiesz na przydatny identyfikator? Jeśli identyfikator dzwoniącego jest nieistotny, czy można go zaprogramować głosami wszystkich użytkowników, aby mógł zgłaszać nazwę dzwoniącego? (Diaboliczna wersja polegałaby na zidentyfikowaniu pracowników, którzy dzwonią pod anonimową linię napiwków).

Podnieś to o krok, a smartfon można dostosować, aby identyfikować dźwięki, które chcesz, aby pomóc firmie. Wiemy już, że systemy do wideokonferencji zawsze nasłuchują, nawet gdy wyciszysz mikrofon, ale co, jeśli Twój telefon pomoże zidentyfikować, kto naprawdę mówi? Niektóre systemy oferują to teraz, ale nie jest to uniwersalne i nawet nie działa konsekwentnie z systemami, które twierdzą, że to mają.

Czy spotkałeś kiedyś rozmówcę w pracy? Co by było, gdyby Twój telefon mógł słuchać i przesyłać wolniejszą, czystszą interpretację do zestawu słuchawkowego? Tak, może również wyświetlać na ekranie transkrypcję w czasie rzeczywistym, ale trudno jest cały czas patrzeć na ten ekran i pozostać niezauważonym. Monity słuchacza są bardziej dyskretne.

Następnie zawsze dostępne są alerty „wykrywania głosu” w czasie rzeczywistym. Wyobraź sobie, że rozmawiasz ze swoim przełożonym i słyszysz: „To prawdopodobnie kłamstwo”. Może to pomóc podczas prezentacji dla zarządu lub publiczności, słysząc głośne westchnienia lub ziewanie, prowadzące do komunikatu ostrzegawczego: „Zakończ. Tracisz je. Jasne, dobry mówca powinien o tym wiedzieć, ale jeśli mówca koncentruje się na skomplikowanym temacie, może nie zdawać sobie sprawy, że publiczność jest rozproszona.

Ponieważ Apple, Google i inni starają się udoskonalić niektóre naprawdę przydatne i przydatne funkcje ułatwień dostępu, jasne jest, że za pomocą tych urządzeń można zrobić znacznie więcej.

Prawa autorskie © 2022 IDG Communications, Inc.

Udostępnij to