Awentail


A
W
E

Znalostní báze

Znalostní báze je způsob, jakým se váš AI asistent učí váš obsah. Nahrajte dokumenty, scrapujte weby a RAG engine Awentail se postará o zbytek.

Podporované formáty souborů

FormátPříponaPoznámky
PDF.pdfTextové PDF (skenované PDF s OCR bude brzy)
Word.docxPlná extrakce textu včetně tabulek
Prostý text.txtPřímé načtení obsahu
CSV.csvZpracování po řádcích

Nahrávání dokumentů

  1. Přejděte na záložku Znalostní báze vašeho asistenta
  2. Klikněte na Nahrát nebo přetáhněte soubory
  3. Awentail automaticky:
    • Extrahuje text z dokumentu
    • Rozdělí ho na optimalizované chunky (150 slov s překryvem 30 slov)
    • Vygeneruje vektorové embeddingy pomocí modelu OpenAI text-embedding-3-small
    • Uloží vektory do PostgreSQL s pgvector pro rychlé vyhledávání podobnosti

Můžete nahrát více souborů najednou. Každý soubor se zobrazí v seznamu dokumentů s názvem, velikostí a počtem chunků.

Scrapování webových stránek

Pro obsah, který je na webu:

  1. Přejděte na záložku Znalostní báze
  2. Klikněte na Scrapovat web
  3. Zadejte URL (např. https://example.com/pricing)
  4. Awentail stáhne stránku, extrahuje textový obsah (odstraní navigaci, patičku, skripty) a zaindexuje ho

Limity scrapování závisí na vašem plánu:

PlánScrapování za měsíc
Free
Starter1
Pro3
Business10

Jak funguje RAG

Když se návštěvník zeptá na otázku, Awentail použije přístup hybridního vyhledávání:

  1. Vektorové vyhledávání (70 % váha) — Najde sémanticky podobné chunky pomocí kosinové podobnosti embeddingů
  2. Klíčové vyhledávání (30 % váha) — Využívá PostgreSQL tsvector fulltextové vyhledávání pro přesné shody termínů
  3. LLM Reranking — Když je skóre nejlepšího výsledku pod 0,78, LLM přeřadí výsledky pro lepší přesnost

Tento hybridní přístup překonává čistě vektorové vyhledávání, zejména pro technický nebo oborově specifický obsah.

Správa dokumentů

Tip: Rozdělte velké dokumenty na zaměřená témata pro lepší přesnost vyhledávání. 5stránkový FAQ k produktu bude fungovat lépe než 200stránkový manuál.

Doporučené postupy