Meta uczy sztuczną inteligencję kłamać i planować

Meta uczy sztuczną inteligencję kłamać i planować

Meta wyszkoliła agenta AI do grania w grę planszową, która polega na rozmawianiu z innymi graczami w celu przekonania ich do wspierania ich strategii, a następnie ich zdradzaniu.

Firma, która jest właścicielem Facebooka, Instagrama i WhatsApp, twierdzi, że jej sztuczna inteligencja Cicero może mieć szerokie zastosowania w najbliższej przyszłości, w tym rozwój inteligentniejszych wirtualnych asystentów z połączonym wykorzystaniem technologii, takich jak przetwarzanie języka naturalnego (NLP) i rozumowanie strategiczne. do wpisu na blogu opublikowanego przez firmę.

W artykule badawczym w czasopiśmie naukowym Science Meta powiedział, że jego sztuczna inteligencja Cicero osiągnęła wydajność na poziomie człowieka w grze strategicznej Diplomacy w lidze online, w której rozegrał 40 meczów przeciwko 82 ludziom, zajmując miejsce wśród 10% najlepszych graczy. który rozegrał więcej niż jedną grę.

W Dyplomacji siedmiu graczy walczy ze sobą o kontrolę nad mapą Europy. Każda runda rozpoczyna się negocjacjami między graczami w celu uzyskania poparcia dla ich planów i kończy się równoczesną próbą wykonania ich ruchów. Bez wsparcia innych graczy wiele z tych ruchów zakończy się niepowodzeniem.

Gra stanowiła wyzwanie dla agenta AI, powiedział Meta, ponieważ wygrana wymagała od niego zrozumienia, czy jego przeciwnicy blefują lub opracowują strategię w określony sposób, aby wygrać grę. Sztuczna inteligencja musiała rozszerzyć pewien poziom empatii podczas gry, aby nawiązać współpracę z innymi graczami, czego AI nie musiała robić, grając w gry takie jak szachy przeciwko ludzkim przeciwnikom.

Przez lata agenci sztucznej inteligencji stali się lepsi w grach strategicznych: w 1997 roku oprogramowanie IBM Deep Blue pokonało mistrza świata w szachach Gary'ego Kasparowa, aw 2016 roku AlphaGo firmy DeepMind pokonało najlepszego gracza w Go, Lee Sedola. Facebook opracował również inny silnik sztucznej inteligencji, który może przewyższyć ludzi w pokerze.

rozumowanie strategiczne

Cicero opiera się na dwóch głównych komponentach technologicznych: rozumowaniu strategicznym i przetwarzaniu języka naturalnego (NLP). Podczas gdy silnik wnioskowania strategicznego przewiduje ruchy innych graczy i wykorzystuje te informacje do tworzenia własnej strategii, silnik przetwarzania języka naturalnego generuje wiadomości i analizuje odpowiedzi w rozmowach z innymi graczami, aby negocjować i zawrzeć umowę - wyjaśniają naukowcy.

Aby pomóc agentowi AI w generowaniu odpowiednich konwersacji, badacze rozpoczęli od modelu generowania języka naturalnego zawierającego 2700 miliarda parametrów, wstępnie wyszkolonego w tekście internetowym, i udoskonalili go za pomocą konwersacji między ludzkimi graczami w ponad 40 000 gier webDiplomacy.net.

„Opracowaliśmy techniki automatycznego dodawania adnotacji do wiadomości w danych treningowych z odpowiednimi planowanymi ruchami w grze, dzięki czemu w momencie wnioskowania możemy kontrolować generowanie dialogu w celu omówienia konkretnych działań pożądanych przez agenta i jego rozmówców. powiedzieli badacze. powiedział w bardziej szczegółowym raporcie. post na blogu.

Meta udostępniła kod Cicero innym badaczom, aby mogli wykorzystać możliwości agenta AI.

Ponadto firma stworzyła portal do zapraszania propozycji badawczych w dziedzinie współpracy człowiek-AI poprzez NLP, wykorzystując dyplomację jako centralną koncepcję.

projekty długoterminowe

Duże firmy technologiczne, takie jak Microsoft, Google, Amazon, konkurują ze sobą, aby opracować inteligentniejszych, samodzielnych wirtualnych asystentów do obsługi różnych przypadków użycia biznesowego, od centrów obsługi telefonicznej po agentów AI, którzy mogą przeprowadzać analizę nastrojów i uczyć indywidualne nowe przyzwyczajenia. Oczekuje się, że globalny rynek przetwarzania języka naturalnego (NLP), który obejmuje tych asystentów, wzrośnie z 26,4 mld euro w 2022 r. do 161,8 mld euro do 2029 r., wynika z raportu Fortune Business Insights.

Badacze Meta zdawali się sugerować, że sukces Cycerona w dyplomacji wyparł umiejętności innych dostępnych obecnie wirtualnych asystentów, stwierdzając w poście na blogu: „Na przykład dzisiejsi asystenci AI mogą wykonywać proste zadania typu pytania i odpowiedzi. raport. Ale co by było, gdybyś mógł przeprowadzić długoterminową rozmowę, której celem byłoby nauczenie Cię nowej umiejętności? »

Jest to eksploracja narzędzi takich jak Google Duplex, Amazon Alexa, Microsoft Xiaoice i Apple Siri. Ale Cyceron też nie jest przygotowany do długich rozmów, bo jego rozumowanie jest ściśle krótkoterminowe. Jak ujęli to badacze Meta w artykule Science: „Strategicznie Cyceron rozumował dialog wyłącznie pod kątem działań gracza w bieżącej rundzie. Nie modelował, w jaki sposób jego dialog może wpłynąć na relacje z innymi graczami w trakcie gry”.

Prawa autorskie © 2022 IDG Communications, Inc.