📝 5 notatek i wykresów o spadku liczby godzin, cognitive surplus i "trzech jeźdźcach"

Infinite context, Github for agents, Text-to-Action.

Jun 09, 2024

Drodzy,

W dzisiejszym wydaniu kilka obszarów, które nagromadziły mi się w notatniku pod egidą “szwarc mydło i powidło”. A jeszcze podczas Infoshare byłem gościem Greg Albrecht Podcast, który możecie posłuchać tutaj. Dzięki Grzesiek za zaproszenie!

👨‍🏭 1. Cognitive surplus i co oznacza spadek liczby godziny pracy z 3000 do 1600 rocznie?
🤖 2. Roboty, zręczność i robotyczny opensource
🍦 3. Lody w Indiach: lekcja z kontroli kluczowych zasobów
🐎 4. Trzej jeźdźcy konfliktu
📝 5. Wypiski z 20-min wywiadu z Eric Schmidtem, ex-CEO Google: Infinite context, Github for agents, Text-to-Action

Czas potrzebny na przeczytanie: 6 min 53 sekund.

👨‍🏭 1. Cognitive surplus i co oznacza spadek liczby godziny pracy z 3000 do 1600 rocznie?

Debata nad 4-dniowym tygodniem pracy to bardziej papierek lakmusowy i studnia, wokół której ogniskują się postawy klasowe i projekcje lęków, oczekiwań od “stajemy produktywniejsi i możemy sobie pozwolić na zmniejszenie wymiaru godzin” do lokalnych obaw o utracie przewagi konkurencyjnej (“firmy przeniosą się do Azji”) i bardziej zniuansowanych w kontekście stosunkowo niskiej produktywności w Polsce (“pracujemy dużo, ale niewydajnie” choć miara stosunku ilości godzin do PKB bywa złudna, czego przykładem jest Irlandia stanowiąca “podatkowe proxy” dla większych firm).

Kilka przemyśleń, wniosków i i hipotez:

Od 1870 do 2017 średnia liczba przepracowanych godzin spadła z średnio 3000 do 1600 rocznie. Oczywiste przyczyny to postęp technologiczny i automatyzacja, ale nie można też zapomnieć o zmianach prawnych i regulacjach np. W 1833 roku wprowadzono w Wielkiej Brytanii tzw. The Factories Act, który ograniczał liczbę godzin pracy dzieci w wieku 9-12 lat do 48h w tygodniu, co wywoływało wówczas również sprzeciwy, ale pociągnęło za sobą poprawę warunków pracy.
(przy okazji notatek z Vaclava Smila wracam do tej naszej wiary, że do rozwoju ludzkości przyczynił się głównie komputer, atom i spektakularne innowacje, ale może w większym stopniu były to tabletka antykoncepcyjna i “innowacje prawne” jak prawa kobiet i aktywizacja zawodowa połowy populacji, czy pralka niosąca ulgę w przyziemnym codziennym problemie?)
Trzeba też dodać, że spadek liczby przepracowanych godzin był związany z przejściem z gospodarki opartej na rolnictwie i przemyśle do gospodarki usługowej (większa elastyczność godzin pracy).
Rozrywka, cognitive surplus i leisure economy? Końcówka XIX wieku to też narodziny rozrywki i leisure, którego będzie coraz więcej, więc równolegle do nadchodzącej fali produktywności/automatyzacji i zmniejszenia czasu pracy obstawiałbym, że rewersem będzie jeszcze więcej entertainment. Więcej czasu wolnego to więcej tzw. cognitive surplus z teorii Clay’a Shirky’ego, nadwyżki poznawczej, którą od XIX wieku przy coraz większej produktywności i ilości wolnego czasu próbujemy zapełnić rozrywką: w XIX wieku była to fala pijaństwa gin craze, po II wojnie telewizja, dziś Internet, więc można obstawiać, że zapotrzebowanie na rozrywkę i media będzie rosnąć.

(czytaj: równolegle do narzędzi zwiększających produktywność inwestowałbym w te “zjadacze produktywności”, czyli rozrywkę, media

Osobiście bliższa mi jest hipoteza, że skrócony czas pracy wywrze presję na przedsiębiorstwach do optymalizacji i automatyzacji jak anegdotyczny przykład z 500+ i podniesieniem minimalnej krajowej: “nie stać nas było już na ludzi do kuchni za 5 zł/h, więc kupiliśmy automatyczną obieraczkę i zmywarkę”. Podobnie jak starzejąca się populacja może dać podobny bodzieć (polecam raport Ubędzie 5,5 mln Polaków. 6 rekomendacji, by uniknąć stagflacji).

🤖 2. Roboty, zręczność i robotyczny opensource

Fascynujące jak VC stopniowo przekierowali zainteresowanie z umiłowania ekonomii skali software’u i SaaS do trudnego, ciężko skalowalnego hardware’u. Z fascynacją obserwuję wyczekiwania na “ChatGPT moment for robotics”, czyli masową demokratyzację robotyki na wzór oprogramowania i LLM’ów przez modularyzację.

W notatkach z tegorocznego SXSW 2024 pisałem sporo o temacie robotyki i co tydzień widzę stado jaskółek na niebie. Kilka przemyśleń:

Nie jestem (jeszcze) przekonany do humanoidalnych robotów. Humanoidalne roboty jak Unitree G1 Humanoid Agent za $16,000 to już obietnica ekwiwalentu auta (BYD zaprezentowało hybrydę za $13,000, która może przejechać 2,000 km), natomiast odnoszę wrażenie, że humanoidy nie są najoptymalniejszą formą, ale może antropomorficzne roboty są dla nas jakimś fantazmatycznym Graalem, który może musimy osiągnąć, żeby pójść dalej i zostawić za sobą dolinę niesamowitości?
Obstawiam dexterity i robotic open source. Sporo na SXSW i w głównym nurcie natomiast słyszę o dexterity (“zręczności”) w robotyce i tu swoim laickim okiem upatruję najwięcej zastosowań w średnim horyzoncie.
Wprawdzie Tesla zgłosiła patent do systemów i metod dla robotycznej ręki i kablowo napędzanych palców skonfigurowanych do naśladowania ludzkich rąk i palców, ale zauważmy, że imponujące rozwiązania nie wymagają tego czynnika antropomorficznego. Robot od Sony ćwiczący szycie na ziarnie kukurydzy czy biomechatroniczne ramie przenoszące jajka pewnie w zupełności odpowiadają na potrzeby i mogą być 10x łatwiejsze w budowie i implementacji.
Open source. Open source w robotyce nie jest czymś zupełnie nowym (np. Annnin Robotics), ale perspektywa zbudowania sobie własnego robota to wciąż bariera hardware’owa (tu może odpowiedzieć na ten problem dostępność druku 3D czy mikrokontrolerów) i software’owa tj. zaprogramowanie robota, żeby był “inteligentny”. Ciekawym pomostem do “ChatGPT moment” może być opisany ostatnio przez Jima Fan z NVIDIA projekt RoboCasa:

RoboCasa to w skrócie narzędzie symulacyjne do treningu robotów, zdolnych do wykonywania codziennych zadań w realistycznych środowiskach domowych. Rozwiązanie wykorzystuje LLM, modele dyfuzyjne i text-do-3D, aby tworzyć zróżnicowane wnętrza (np. kuchnie) i posiada już 2500 obiektów 3D w ponad 150 kategoriach (np. noże, jajka, pomidory), na których roboty uczą się ośmiu podstawowywch umiejętności takich jak podnoszenie i odkładanie przedmiotów, otwieranie drzwi, czy obracanie gałek.

Innymi słowy: możemy generować setki losowych scenariuszy (np. przygotuj zapiekankę i odgrzej ją później w mikrofali), na których robot uczy się w symulacji.

🍦 3. Lody w Indiach: lekcja z kontroli kluczowych zasobów

Z przeszło 1.44 mld mieszkańców i populacją większą od Chin, uważam że warto coraz bliżej przyglądać się Indiom i ich rynkowi. Tu w ramach ciekawostki i odskoczni, krótki wątek na Twitterze o producentach lodów w Indiach. Indyjski rynek lodów jest wyceniany na około 200 miliardów rupii (około $2-3 mld), z czego pięciu głównych graczy, w tym Amul, posiada prawie 50% udziału w rynku. Oczekuje się, że rynek ten podwoi swoją wartość w ciągu najbliższych 2-3 lat, ale z analizy wynika, że:

Rentowność w tej branży w dużej mierze zależy od posiadania kontroli nad łańcuchem dostaw mleka. Nie da się zbudować w Indiach dochodowego biznesu lodziarskiego bez posiadania łańcucha dostaw.
Firmy, które otrzymały finansowanie VC w tej branży wciąż są nierentowne:
Innymi słowy: można wnioskować, że większość tych dochodowych firm to farmy mleczne, których produktem ubocznym są lody. Cenniejsza lekcja (hipoteza) to, że czasem it’s not about product, it’s about your supply.

🐎 4. Trzej jeźdźcy konfliktu

Z “miękkich” przemyśleń zawsze blisko mi były rozważania wokół konfliktu i negocjacji. Przy całej złożoności powodów konfliktów (np. walka o zasoby, różnice kulturowe) najchętniej przyglądam się tym pozornie irracjonalnym przesłankom konfliktu, kiedy nie do końca czujemy, co wywołuje nasze emocje.

Z moich subiektywnych odczuć to nierzadko trzy podskórne triggery:

“to jest niezgodne z moimi wartościami” - wartości są niesprowadzalne do reguł ekonomii czy matematyki np. czy wązniejsze jest dobro jednostki (zachód) czy ogółu (wschód)? Zawsze zalecam odpowiedzenie co “irracjonalnego” jest dla Ciebie ważne w tej sytuacji? [Jeśli ktoś wywołuje w nas irytację swoim zachowaniem i nie wiemy skąd ta irytacja warto sobie pomyśleć, co będzie przeciwieństwem tego zachowania - być może tam gdzieś ogniskuje się źródło naszych wartości lub aspiracji]
“to niezgodne z moim interesem”. To chyba oczywiste, ale często ukrywanie swojego jasnego interesu prowadzi do napięć. Zaczynam więc coraz chętniej pytać “jak na tym zarobisz i jak Ci pomogę pomóc, żebyśmy oboje skorzystali”.
“to nie jest sprawiedliwe”. Myślę, że definicja sprawiedliwości to jeden z kluczowym markerów na mapie negocjacji, bo wiąże się znów z systemem wartosci. “Każdemu według potrzeb” (socjalizm albo “mamy łożyć na nierobów?”) czy “każdemu według zasług” (wolnorynkowy merytokratyzm “mamy zostawić potrzebujących i mniej sprawnych?”) są w obu przypadkach zasadne i w skrajnościach prowadzą do absurdów.

📝 5. Wypiski z 20-min wywiadu z Eric Schmidtem, ex-CEO Google: Infinite context, Github for agents, Text-to-Action

Polecam ten krótki wywiad z Ericem Schmidtem, ex-CEO Google nie tylko ze względu na jego predykcje, ale przede wszystkim pokaz wprawności i jasności myśli przy zachowaniu wnikliwości technologicznej (może “once engineer, always engineer”?).

Trzy kierunki, które Schmidt teraz obserwuje i są dla niego kluczowe:
- Infinity long context (“take the answer, feed it again and through the chain of thought reasoning in 5 years be able to generate 1,000 steps recipe to solve important problems”) - mam wrażenie, że w pogoni za nowymi paradygmatami zapominamy czasem jak przełomowe wciąż są “faster” (Groq i +40,000 tokenów inputu na sec) i “bigger” (1 mln tokens context od Google).
- Milion of Agents and Github for Agents. Tu patrzę z zaciekawieniem na obszary jak szeroko pojęta infrastruktura pod komunikację Bot-2-Bot/Agent-2-Agent np. “APIfikacja” (możliwość by boty mogły wpinać się w dowolne aplikacje, systemy np. urzędy) czy kryptopłatności między AI Agentami (widzę use case pod blockchain i crypto, które nie wymaga 3rd parties, AI agents mogą tworzyć swoje crypto wallety i przeprowadzać między sobą transakcje).
- Text-to-Action (“Write me a piece of software that does something”) - wyobrażam sobie, że analogicznie do “alternative to… (software X)” będą może powstawać narzędzia BuildMeAFreeAlternative.com, gdzie podajemy link do jakiegoś standardowego oprogramowania (np. program do fakturowania) i dziesiątki agentów budują nam kopię. Ale tu pewnie zatoczymy koło z “buy software” → “build software” → ponownie do “buy software”, bo utrzymanie / support / rozwój będzie
“At some point, agents will start to work together. At some point, agents will develop their own language and that’s the point we should pull the plug. Literally unplug the computer”
“Gen AI is a problem for China because they have no free speech. What do you do to the system that generates something that is not allowed? Who do you jail? Engineer, training data, computer, user?”

Miłej niedzieli,

Kamil Stanuch

PS. Jak oceniasz dzisiejszy mail?