Znalostní báze
Znalostní báze je způsob, jakým se váš AI asistent učí váš obsah. Nahrajte dokumenty, scrapujte weby a RAG engine Awentail se postará o zbytek.
Podporované formáty souborů
| Formát | Přípona | Poznámky |
|---|---|---|
.pdf | Textové PDF (skenované PDF s OCR bude brzy) | |
| Word | .docx | Plná extrakce textu včetně tabulek |
| Prostý text | .txt | Přímé načtení obsahu |
| CSV | .csv | Zpracování po řádcích |
Nahrávání dokumentů
- Přejděte na záložku Znalostní báze vašeho asistenta
- Klikněte na Nahrát nebo přetáhněte soubory
- Awentail automaticky:
- Extrahuje text z dokumentu
- Rozdělí ho na optimalizované chunky (150 slov s překryvem 30 slov)
- Vygeneruje vektorové embeddingy pomocí modelu OpenAI
text-embedding-3-small - Uloží vektory do PostgreSQL s pgvector pro rychlé vyhledávání podobnosti
Můžete nahrát více souborů najednou. Každý soubor se zobrazí v seznamu dokumentů s názvem, velikostí a počtem chunků.
Scrapování webových stránek
Pro obsah, který je na webu:
- Přejděte na záložku Znalostní báze
- Klikněte na Scrapovat web
- Zadejte URL (např.
https://example.com/pricing) - Awentail stáhne stránku, extrahuje textový obsah (odstraní navigaci, patičku, skripty) a zaindexuje ho
Limity scrapování závisí na vašem plánu:
| Plán | Scrapování za měsíc |
|---|---|
| Free | — |
| Starter | 1 |
| Pro | 3 |
| Business | 10 |
Jak funguje RAG
Když se návštěvník zeptá na otázku, Awentail použije přístup hybridního vyhledávání:
- Vektorové vyhledávání (70 % váha) — Najde sémanticky podobné chunky pomocí kosinové podobnosti embeddingů
- Klíčové vyhledávání (30 % váha) — Využívá PostgreSQL
tsvectorfulltextové vyhledávání pro přesné shody termínů - LLM Reranking — Když je skóre nejlepšího výsledku pod 0,78, LLM přeřadí výsledky pro lepší přesnost
Tento hybridní přístup překonává čistě vektorové vyhledávání, zejména pro technický nebo oborově specifický obsah.
Správa dokumentů
- Zobrazení — Prohlédněte si všechny nahrané dokumenty s počty chunků
- Smazání — Odstraňte dokument a všechny jeho chunky/embeddingy
- Opětovné nahrání — Nahrajte novou verzi k nahrazení zastaralého obsahu
Tip: Rozdělte velké dokumenty na zaměřená témata pro lepší přesnost vyhledávání. 5stránkový FAQ k produktu bude fungovat lépe než 200stránkový manuál.
Doporučené postupy
- Udržujte obsah zaměřený — Nahrávejte dokumenty, které přímo souvisejí s tím, na co se budou návštěvníci ptát
- Pravidelně aktualizujte — Mažte zastaralé dokumenty a nahrávejte aktuální verze
- Používejte popisné názvy souborů — Pomůže vám to při správě znalostní báze
- Kombinujte zdroje — Nahrajte FAQ, produktovou dokumentaci, ceník a články podpory pro komplexní pokrytí