Chiński startup Meng Xiaoyi twierdzi, że właśnie zrobił ogromny krok w stronę rozwiązania tej zagadki. Firma zaprezentowała PettiChat – niewielkie urządzenie przypinane do obroży, które według producenta potrafi „tłumaczyć” szczekanie psów i miauczenie kotów na ludzki język z dokładnością przekraczającą 92 procent. Rzecz jasna urządzenie błyskawicznie przyciągnęło uwagę mediów i właścicieli zwierząt. Tysiące osób miały już zamówić je w przedsprzedaży, a sieć zapełniły filmiki przedstawiające psy domagające się spaceru i koty proszące o smakołyki.
Wizja takiego urządzenia robi wrażenie nie tylko dlatego, że człowiek od dawna marzył o rozmowie ze zwierzętami. Fascynujące jest również to, jak bardzo współczesna sztuczna inteligencja zaczyna wkraczać w sfery, które jeszcze kilka lat temu wydawały się czystą fantastyką.
Psia wieża Babel
PettiChat nie jest zwykłym „tłumaczem szczekania”, jakimi rynek próbował już kiedyś zainteresować klientów. Wcześniejsze urządzenia przypominały raczej elektroniczne zabawki – reagowały na ton dźwięku i generowały przypadkowe komunikaty. Tym razem technologia jest znacznie bardziej zaawansowana. Sercem systemu jest nowoczesny model sztucznej inteligencji Qwen, opracowany przez specjalistów współpracujących z chińskim koncernem Alibaba. Według producenta urządzenie działa w sposób multimodalny, co oznacza, że nie analizuje wyłącznie dźwięków.
Miniaturowe urządzenie ważące zaledwie 27 gramów wyposażono w specjalne czujniki monitorujące ruchy zwierzęcia. System analizuje więc nie tylko samo szczekanie czy miauczenie, lecz także mikroruchy ciała, ustawienie głowy, dynamikę ogona albo uszu. Gdy zwierzę wydaje dźwięk, system analizuje jego częstotliwość, natężenie, dodatkowe tony składające się na brzmienie oraz czas trwania, a następnie zestawia te dane z zachowaniem zwierzęcia. Wszystko trafia do chmury obliczeniowej, gdzie sztuczna inteligencja próbuje przypisać sygnały do określonych stanów emocjonalnych. Po około 1,2 sekundy właściciel dostaje komunikat w aplikacji.
Brzmi imponująco. Problem w tym, że między analizą emocji a prawdziwym „tłumaczeniem języka zwierząt” istnieje ogromna różnica.
Algorytm emocji
Producent twierdzi, że algorytm został „wytrenowany” na bazie obejmującej ponad 1,5 miliona próbek audio oraz tysiące godzin nagrań dokumentujących zachowania zwierząt w różnych sytuacjach – podczas zabawy, izolacji, oczekiwania na jedzenie, w stresie czy w bólu. W procesie oznaczania danych mieli uczestniczyć weterynarze i behawioryści. Według deklaracji firmy skuteczność rozpoznawania emocji sięga od 92,3 do 94,6 procent.
Właśnie te liczby budzą jednak największy sceptycyzm naukowców. Wyniki nie zostały dotąd opublikowane w recenzowanych czasopismach naukowych ani poddane niezależnej weryfikacji. To bardzo ważne, ponieważ laboratoryjne warunki testowe często mają niewiele wspólnego z codziennością. W domu algorytm musi zmierzyć się z telewizorem grającym w tle, szczekaniem innych psów, hałasem ulicy czy dziećmi biegającymi po mieszkaniu. Każdy dodatkowy dźwięk obniża skuteczność systemów klasyfikacyjnych.
I właśnie tutaj kończy się efektowny marketing, a zaczyna znacznie bardziej skomplikowana rzeczywistość zwierzęcej natury.
Współczesna nauka nie ma wątpliwości: psy i koty nie posługują się językiem w ludzkim znaczeniu tego słowa. Nie budują zdań, nie tworzą abstrakcyjnych pojęć ani nie prowadzą rozmów przypominających ludzką komunikację. Zwierzęta sygnalizują przede wszystkim emocje, poziom pobudzenia oraz podstawowe potrzeby – strach, ekscytację, frustrację, chęć zabawy, głód czy dyskomfort.
Oznacza to, że PettiChat tak naprawdę nie „tłumaczy” zwierzęcych wypowiedzi jak translator języków obcych. System analizuje dźwięki i zachowanie psa lub kota, a następnie przypisuje je do określonych emocji albo potrzeb – takich jak stres, ekscytacja, głód czy chęć zabawy. Komunikaty wyświetlane w aplikacji – „Chcę wyjść na spacer”, „Boję się tego dźwięku” czy „Zostaw mnie w spokoju” – są więc bardziej swobodną interpretacją stworzoną przez programistów niż dosłownym przekładem zwierzęcego „języka”. Innymi słowy, aplikacja nie prowadzi prawdziwej rozmowy ze zwierzęciem, lecz zamienia jego zachowanie na komunikaty bardziej zrozumiałe dla człowieka.
Kot nie filozofuje
Mimo to sam pomysł działa na wyobraźnię niemal magicznie. Być może dlatego, że psy i koty od dawna przestały być wyłącznie domowymi zwierzętami. Dla milionów ludzi stały się członkami rodziny. Śpią w łóżkach, jeżdżą na wakacje, mają własne profile w mediach społecznościowych i obchodzą urodziny. Rynek produktów dla zwierząt urósł do gigantycznych rozmiarów właśnie dlatego, że współczesny człowiek coraz częściej traktuje pupila jak emocjonalnego partnera.
PettiChat idealnie wpisuje się w ten trend. Tak naprawdę nie sprzedaje wyłącznie technologii, ale marzenie o przełamaniu międzygatunkowej bariery.
Internet błyskawicznie podzielił się na dwa obozy. Jedni są zachwyceni perspektywą lepszego rozumienia swoich pupili, inni reagują ironią. W mediach społecznościowych pojawiły się żarty, że koty prawdopodobnie przez większość dnia mówiłyby jedynie: „Nakarm mnie”, „Nie dotykaj mnie” albo „To mieszkanie należy do mnie”. Ktoś inny zauważył, że pięcioprocentowy margines błędu oznacza, iż urządzenie może kiedyś błędnie przetłumaczyć zwykłe miauknięcie na filozoficzne rozważania o sensie istnienia.
Dowcipy są zabawne, ale pokazują coś ważnego: ludzie intuicyjnie wyczuwają, że tłumaczenie zwierzęcych emocji na ludzkie zdania zawsze będzie pewnym uproszczeniem.
Weterynarze i behawioryści ostrzegają również przed innym problemem – zbyt dużym zaufaniem do aplikacji. Jeśli zwierzę zacznie wykazywać subtelne objawy choroby, a system błędnie zinterpretuje je jako „zmęczenie” lub „potrzebę odpoczynku”, właściciel może zbyt późno zgłosić się do kliniki weterynaryjnej. Szczególnie niebezpieczne bywają choroby rozwijające się powoli, jak niewydolność nerek u kotów czy przewlekły ból stawów u starszych psów.
Dlatego naukowcy podkreślają, że podobne technologie powinny być traktowane wyłącznie jako narzędzia pomocnicze. Żaden algorytm nie zastąpi doświadczenia właściciela, który zna codzienne zachowania swojego zwierzęcia, ani wiedzy lekarza weterynarii.
Między nauką a magią
A jednak byłoby błędem całkowicie lekceważyć takie projekty. Sztuczna inteligencja rzeczywiście zaczyna odgrywać coraz większą rolę w badaniu komunikacji zwierząt. Naukowcy od lat próbują rozszyfrować odgłosy wielorybów, słoni czy delfinów. Szczególnie fascynujące pozostają właśnie delfiny – niezwykle inteligentne stworzenia żyjące w skomplikowanych strukturach społecznych.
Firma Google DeepMind rozwija obecnie model DolphinGemma, trenowany na gigantycznej bazie dźwięków gromadzonych przez Wild Dolphin Project. Badacze mają nadzieję, że AI wykryje subtelne wzory komunikacyjne nierozpoznawalne przez człowieka. Być może po raz pierwszy uda się ustalić, czy delfiny posiadają coś przypominającego słownictwo lub powtarzalne struktury komunikacyjne.
To już nie jest futurystyczna zabawka z internetowego sklepu, lecz bardzo poważny kierunek badań naukowych. Możliwe więc, że przyszłość rzeczywiście przyniesie technologie pozwalające lepiej rozumieć emocje zwierząt. Być może weterynarze szybciej wykryją cierpienie psa, a właściciel kota wcześniej zauważy przewlekły stres swojego pupila. Byłaby to ogromna zmiana w opiece nad zwierzętami.
Najprawdopodobniej jednak przyszłość nie będzie wyglądała jak film, w którym pies prowadzi z człowiekiem pełnoprawną rozmowę. Sztuczna inteligencja nie nauczy nas rozmawiać ze zwierzętami jak z ludźmi. Może natomiast pomóc lepiej dostrzegać ich emocje, potrzeby i sygnały ostrzegawcze. A to samo w sobie byłoby już małą rewolucją.
Monika Pawlak

