Parsing (parsování dat)
Proces analýzy a převodu textu nebo dat z jednoho formátu do strukturované podoby, se kterou může program pracovat.
Co je parsing?
Parsing (parsování) je proces, při kterém program přečte vstupní data (text, JSON, HTML, PDF) a rozloží je do strukturované podoby, se kterou může dále pracovat. Je to jako přeložit rukopis do čitelně napsaného textu s jasnou strukturou.
Příklady parsování v AI automatizaci
- Parsování JSON: Extrakce konkrétní hodnoty (e-mail, jméno) z API odpovědi
- Parsování HTML: Extrakce textu z webové stránky při web scrapingu
- Parsování PDF: Převod naskenovaného dokumentu na text pro RAG
- Parsování e-mailu: Extrakce objednávkových dat z příchozí zprávy
Parsování výstupu LLM
LLM modely mohou vracet strukturovaný výstup (JSON), který je pak potřeba parsovat pro předání dalšímu kroku automatizace. Moderní modely podporují structured outputs, které zaručují validní formát.