Přejít na obsah|Přejít k hlavnímu menu|Přejít k vyhledávání

edhouse-CookieGdpr-Policy-s
3313043
0
/cz/gdpr/
431650B6B

Zpět na Blog

Reviews

Bleskově od nápadu k aplikaci pomocí AI

Tech_blog

Když máte vizionářskou mysl a/nebo trochu ADHD, možná dojdete v životě ke zjištění, že většinu svých nápadů musíte prostě zahazovat, protože (zatím) neumíte stihnout všechno vyzkoušet nebo zrealizovat.

S příchodem AI se ale v IT extrémně snížila časová investice potřebná pro vytvoření funkčního prototypu aplikace (Proof of Concept) na základě nějakého nápadu, zapsaného „normální“ lidskou řečí.

Ajťáci mohli začít létat. Aerolinky? OpenAI, Anthropic, Microsoft, Google, Meta, …

Čas na vytvoření PoC se díky AI z mého pohledu zkrátil tak na 10–20 %. Odpadlo vyhledávání malých stavebních bloků na Stack Overflow a jejich implementace. Otevřela se možnost jít o abstrakci výš a slovy “psát” bloky několika modulů, tříd, komponent. S velkou časovou pákou, alespoň většinou.

Ze 40hodinového PoC „projektíku“ webové aplikace (FastAPI Python backend + React frontend), se stala záležitost na odpoledne. Někdy se naopak z očekávaných 20 minut na jednoduchý bash skript stalo tříhodinové peklo s laděním. Možná jste se taky dostali do situace, kdy vám AI s omluvou, leč s asertivní jistotou až zárukou, cyklicky nabízí řešení A nebo B, která jsou obě nefunkční. Tady pomůže jen “vystoupit a nastoupit”. Nicméně, začali jsme si s AI povídat a ona nám dávala (většinou) funkční kód ještě s tipy na vylepšení.

To, co přes dva roky provozujeme, se teď začalo nazývat Vibe Coding: povídáte si s AI, a přitom vlastně programujete aplikaci. Vzniklo mnoho nástrojů a workflow, a Ctrl+V. tedy můžeme zrealizovat naše IT nápady rychleji a jednodušeji. Líp se nám tvoří. Pojďme se podívat na dva projektíky, které vznikly právě díky lehkosti, kterou AI vnáší do života ajťáka

Prezentace ovládaná gesty

Myšlenka:

Aplikace umožňuje ovládat posun prezentace a zoom videostreamu z webkamery z picture-in-picture na fullscreen. Chtěl jsem si vyzkoušet nějakou open-source knihovnu napsanou v Pythonu na rozpoznávání gest. Zároveň cítím, že při všech těch online schůzkách a prezentacích je potřeba mít kontakt s publikem a být vidět, když říkáte něco důležitého.

Provedení:

Hodinka konverzace s ChatGPT (už ani nevím, co to bylo před těmi deseti týdny za verzi), pak úprava matematiky kolem rozpoznání gest – konkrétně z jaké oblasti obrazu webkamery se bere validní gesto, s přihlédnutím k různým vzdálenostem prezentujícího od webkamery. Tři pokusy na vygenerování obrázku s ChatGPT denně zdarma a na světě jsou digi koťátka do demo prezentace.

Co mi to přineslo: 

  • Ovládání prezentace gesty je cool. Palcem zpět, malíčkem dopředu, otevřenou dlaní obraz z kamery – co víc si přát. 
  • Mít k dispozici bezplatnou knihovnu pro rozpoznávání lidského těla je … 🤔Co se s tím dá ještě dělat? 
  • Občas se mi chtěně rozpoznalo gesto otevřené ruky, já se viděl na celé obrazovce a zpanikařil jsem. 
  • Člověk si při té gestikulaci občas připadá všelijak. 

Aplikace na počítání kliků

Myšlenka:

Někde jsem slyšel, že člověk musí něco dělat 10000 hodin, aby v tom byl dobrý. Nebo to třeba alespoň desettisíckrát zopakovat? Jak dlouho by trvalo udělat 10000 kliků? To by chtělo nějakou appku na na jejich počítání. 😊

Aplikace o jednom HTML souboru, která bude snadno portovatelná, protože je spustitelná v každém prohlížeči. Už jsem věděl, jak se jmenuje knihovna pro rozpoznávání pozice 33 bodů na těle (MediaPipe Pose Landmarker) a ChatGPT mi prozradil, že jde využít i v Javascriptu. No, tak abrakadabra, ať si to zapne webkameru a počítá mi to kliky! https://ai.google.dev/edge/mediapipe/solutions/vision/pose_landmarker

Provedení:

Celkem asi 2 hodiny konverzace s ChatGPT, pak úprava matematiky kolem rozpoznání vykonaného kliku, kterou navrhnul sám, tedy skoro.

Co mi to přineslo: 

  • Překvapení, jak vypadá matematická definice kliku v kódu. Není snadné dobře definovat pohyb lidského těla
  • Když už na to počítání kliků mám aplikaci měl bych začít skutečně klikovat 😊

A jak si já povídám s ChatGPT?

Když spolu programujeme, snažím se držet kód v jednom souboru, který po něm celý neustále vyžaduji. Pokud jeho odpověď nesplňuje moje očekávání, radši edituji prompt a zeptám se znovu, než abych ho prosil o opravu. Po maximálně deseti konverzačních přestřelkách beru s celým kódem do zaječích a otevírám novou konverzaci. To samé, pokud mi do kódu napíše “Put your implementation here” apod.

Ale hlavně, slušně! Je dobré používat “prosím” a “díky” a sem tam ho pochválit. Takhle vřelá slušnost se může zdát vůči studenému jazykovému modelu zbytečná, ale nikdy nevíte. Až jednou AI ovládne svět, bude se vám hodit, že máte v rejstříku – teda v databázi – slušné chování. 😊

Sdílet článek

Autor

František Částek

František ČástekAutor si do příště za domácí úkol připraví prompt pro vygenerování textu pro medailonek.

Edhouse newsletter

Získejte aktuální info ze světa Edhouse - novinky, setkávání, aktuální trendy softwarové i hardwarové.

Registrací vyjadřujete souhlas se zpracováním osobních údajů.

Děkujeme za váš zájem o odběr našeho newsletteru! Pro dokončení registrace je potřeba potvrdit vaše přihlášení. Na zadaný e-mail jsme vám právě zaslali potvrzovací odkaz. Klikněte prosím na tento odkaz, aby bylo vaše přihlášení dokončeno. Pokud e-mail nenajdete, zkontrolujte prosím složku nevyžádané pošty (spam) nebo složku hromadné pošty.