🐴 Auto z głową konia, path dependence i pułapka kroków pośrednich

O mikro-robotach na raka, bezwodnym prysznicu i napędzane wiatrem eko-statki.

Jun 16, 2024

Drodzy,

Na przełomie wieków, Uriah Smith, kaznodzieja i wynalazca z Battle Creek w Michigan, zauważył, że konie bały się samochodów, co prowadziło do wypadków.

Horsey Horseless - 1899 U.S. Patent image 1 — „Horsey Horseless”, ogromna drewniana głowa konia przymocowana do aut, aby nie straszyć koni.

Aby temu zaradzić, w 1899 roku stworzył „Horsey Horseless” - ogromną drewnianą głowę konia, którą można było przymocować do przodu samochodu. Smith zakładał, że wyglądający jak koń pojazd złagodzi lęk żywych koni, ponadto głowa miała także dodatkową funkcję jako zbiornik paliwa.

Pięć lat później, Henry Hayes z Denver opatentował podobne urządzenie, które miało sprawiać wrażenie, że samochód jest ciągnięty przez konia, z wbudowaną lampą olejową i rogiem.

Dla nas dziś brzmi to absurdalnie jak z filmu Poor Things (2023), ale to jeden z klasycznych przykładów path dependence i pułpaki kroków pośrednich, o których dziś krótko.

💡 1. Autonomous Agents jako work around
🦀 2. Path dependence, czyli mikro-roboty na raka
👨‍🦰 3. Antropomorfizmy w budowie domu: drony, zmechanizowany murarz i prefabrykat
🤨 4. Moravec i odwieczny Innovator’s Dilemma
⛵ 5. Wtórny path dependence i “wymyślanie ponownie autobusa”

Czas potrzebny na przeczytanie: 4 min 53 sekund.

💡 1. Autonomous Agents jako work around

W jednym z poprzednich wydań pisałem o interesujących mnie kierunkach, wśród których były naturalnie autonomous AI agents. W odróżnieniu od zwykłego prompta AI Agents działają w niezależnie tzn. podajemy cel / początkowy prompt i model sam generuje listę zadań i kroków w formie wewnętrznego monologu, które realizuje, aby osiągnąć swój cel.

Chłodzę jednak nieustannie swoją fascynację, że mogą one służyć jako przejściowe rozwiązania w sytuacjach, gdzie standardowe modele LLM jeszcze niedomagają tzn. są do jakiegoś stopnia work aroundem do zadań wymagających dostępu do zewnętrznych danych i dynamicznej interakcji z różnymi źródłami informacji.

Np. “napisz mi analizę sytuacji rynkowej Tesli” wymaga użycia wyszukiwarki i tooli via LangChain, ale multi-multimodalny model LLM z funkcją “text-to-done” pewnie zmniejszyłby potrzebę bazowania na rozbudowanych agentach; tak jak przed multimodalnym modelem obsługującym dźwięk, obraz, tekst potrzebny był agent-orkiestrator, który zepnie te trzy, tak teraz rozwiązuje to jeden endpoint.

Nie, nie twierdzę, że AI Agents to fad - wręcz przeciwnie, przyszłość bot-to-bot jest mi niezwykle bliska. Natomiast traktuję je jako przyczynek do refleksji o pułpace kroków pośrednich albo inaczej path dependence (zależność od ścieżki?), czyli koncept jak decyzje podjęte w przeszłości wpływają na bieżące i przyszłe decyzje oraz wyniki, ograniczając dostępne opcje (np. arbitralnie przyjęta klawiatura QWERTY).

🦀 2. Path dependence, czyli mikro-roboty na raka

Path Dependency - Meaning, Theory, Example, How it Works?

Przykład: Opisany w tym artykule Environmentally Adaptive Shape-Morphing Microrobots for Localized Cancer Cell Treatment (2021) mikro-robot porusza się wewnątrz ciała, aby dostarczyć lek bezpośrednio do miejsca docelowego zajętego przez komórki rakowe.

Brzmi innowacyjnie, ale przypadek mikrorobotów w leczeniu raka jest przykładem, gdzie ekscytacja związana z ich potencjałem maskować może luki w naszym fundamentalnym zrozumieniu i leczeniu raka tzn. braku dostatecznie dobrze dopasowanego leku albo cofnięcia się krok dalej w stronę immunoterapii, czyli wzmocnienia własnego systemu odpornościowego do niszczenia komórek rakowych.

👨‍🦰 3. Antropomorfizmy w budowie domu: drony, zmechanizowany murarz i prefabrykat

Te prekoncepcje i utrwalone paradygmaty często prowadzą nas więc do suboptymalnych rozwiązań, które mylnie uważamy za innowacyjne.

Przykładem jest antropomorfizm i fascynacja tworzeniem humanoidalnych robotów przez co nieraz tkwimy wyobrażeniowo w staraniach tworzenia robotów naśladujących nasze nieefektywne działania np. kładzenie cegieł i budowa domu.

Przykładowy ciąg myślowy:

Człowiek kładzie cegły – tradycyjna metoda, która jest czasochłonna i kosztowna.
Drony kładą cegły – innowacja, która jednak wciąż naśladuje mniej efektywne ludzkie działania.
Humanoid kładzie cegły – budowa robotów humanoidalnych, które powielają nieefektywne metody pracy człowieka.

Tymczasem może bardziej optymalne jest wyjście poza paradygmat i np. zastosowanie budowy domów z prefabrykatów, czy zamiast wołu użyć niewystępujące w przyrodzie… koło.

Może być zdjęciem przedstawiającym 5 osób i tekst

🤨 4. Moravec i odwieczny Innovator’s Dilemma

Oczywiście, jest tu znacznie więcej subtelności, bo nieraz pierwotna metoda może być najlepsza, co dobrze opisuje paradoks Moraveca, o którym pisałem wcześniej:

[Paradoks Moraveca wskazuje, że] obliczeniowy koszt funkcji poznawczych i przetwarzania podstawowych bodźców sensorycznych jest często bardziej energochłonny niż abstrakcyjne myślenie.
Innymi słowy komputerowi łatwiej pomnożyć miliardy macierzy niż wbić równo gwóźdź, a to może jakoś ilustruje różnice między nauką a techniką czy technologią, które nie muszą iść w parze: znajomość rachunku różniczkowego niekoniecznie uczyni nas lepszym piłkarzem, a i dobry piłkarz potrafi trafiać do bramki (technika i technologia) bez matury z fizyki (nauka). 1:0 dla ciała.

Zamiast zatrudniać humanoida do pokrojenia marchewki, wciąż optymalniejsze jest użycie siekaczki. Stąd path dependence bliskie jest nieraz koncepcyjnie The Innovator’s Dilemma Claytona Christensena, czyli sytuacji, gdy wiodące firmy na rynku nie potrafią reagować na pojawiające się innowacje, ponieważ te innowacje z początku są mniej atrakcyjne dla ich głównych klientów lub podkopują ich główny biznes (“cash cow”), więc skupiają się na ulepszaniu swoich obecnych produktów i usług, aby zaspokoić potrzeby najbardziej wymagających klientów (klasyczny case Kodaka, choć w jego upadku nie chodziło tylko o innowacje).

Niemniej, w kontekście humanoidów nigdy nie lekceważmy wartości emocjonalnej i efektu “wow” jakim byłby człekokształtny robot w kuchni.

⛵ 5. Wtórny path dependence i “wymyślanie ponownie autobusa”

Ciekawym zjawiskiem jest ta fiksacja na innowacji, która prowadzi nieraz do absurdalnych powrotów wzdłuż ścieżki wyznaczonej przez nowe paradygmaty. Przykłady takiego wtórnego path dependence dobrze dokumentuje grupa Did Silicon Valley Reinvent the Bus Again?:

“an innovative, cost-effective Uber alternative where multiple users share a ride, optimizing urban mobility” (transport publiczny)
“a groundbreaking zero-emission refrigeration solution that operates without electricity year-round” (piwnica)
“a cutting-edge, eco-friendly sea transportation system harnessing the power of wind” (żaglowiec)

Myślę, że sztuką wciąż będzie znalezienie balansu między zasadnym “auta w miejsce szybszych koni” a “mechaniczne konie” w klasycznym pytaniu:

zmieniasz paradygmat (prysznic → eliminacja potrzeby prysznica przez tabletki modyfikujące potliwość) czy
czynisz x100 tańszym, szybszym (prysznic → soniczne oczyszczanie emitujące ultradźwięki o wysokiej częstotliwości, które rozbijają cząsteczki brudu i oleju na skórze, usuwając je bez potrzeby użycia wody).

Tak, tu rodzi się pewnie znów pokusa na system holograficzny… tworzący iluzję prysznica z falami dźwiękowymi symulującymi uczucie wody i mydła.

Miłej niedzieli,

Kamil Stanuch

PS. Jak oceniasz dzisiejszy mail?