
RAG chatbot építése saját dokumentumokra: gyakorlati guide
Hogyan építs RAG chatbotot vállalati dokumentumokra úgy, hogy ne találjon ki dolgokat. Architektúra, stack-választás, költségbecslés és deploy.
Hol állnak a magyar KKV-k AI érettségben 2026-ban? Top 5 reális use case, tipikus költségbecslés, ROI-számítás és 3 valós példa anonimizálva.

Első 30 nap roadmap
Top 5 manuális, repetitív folyamat listázása (napi 1-2+ óra). Stakeholder-interjúk, ROI-becslés.
2-3 tanácsadóval / fejlesztő-céggel díjmentes discovery-call. Referenciák a KKV-szegmensben.
1-2 hetes fix árú prototípus a top use case-re. 50 valós példa eval-szet + accuracy-mérés.
PoC eval-szeten min. 75% accuracy → MVP-build 8-10 hét. Egyébként next use case-re lépés.
A „2025 az AI éve" hype lecsengett. 2026 a konszolidáció éve: a KKV-k nem azzal foglalkoznak, hogy „AI-zunk-e", hanem hogy „melyik use case éri meg". Ez a cikk a magyar KKV-piacon nézi körül a tényleges helyzetet — érettségi szint, top use case-ek, költségek, ROI, és mit ne csinálj.
Az itt szereplő számok és arányok a Corevanix-projektek és a tágabb hazai partneri körünk tapasztalataiból összegyűjtött tendenciák — nem reprezentatív statisztika, hanem operatív szintű terepismeret. Egy 2026 Q1-es belső review-ból dolgozunk, 8+ ügyfél-projekt anonimizált adataival.
A magyar KKV-szektor jelenleg három szegmensre bomlik az AI-érettség alapján:
A ChatGPT-t a marketing-csapat használja landing oldal-szövegek finomítására, néha email-fogalmazásra. Strukturált AI-projektünk nincs. A vezetés kíváncsi, de óvatos — több cikket olvasott a hype-ról és a kudarcokról is, és nem siet beruházni.
Tipikus jelmondat a managing director-tól: „Tudom, hogy itt az AI, de nem akarom elcsesztem a pénzt — várok, amíg tisztábban látni, mire jó."
Egy konkrét use case-en futott PoC vagy MVP. Tipikusan: lead-classifier, chatbot, doc-summarizer. Production-státusz vegyes — sok PoC nem ér el termelésig. A „demo szépen ment, de élesben crashek" forgatókönyv gyakori.
A 2025-ös hype-hullám sok B-csoportos céget hagyott „félig kész" projektben — vagy a partnert kell cserélni, vagy a scope-ot kell letisztázni, vagy mindkettő.
Beüzemelt, mérhető ROI-jú AI-rendszerek. Ezek többségében IT-erős cégek (saját fejlesztői csapat), néhányukat tanácsadó támogatja. Tipikusan: lead-asszisztens + dokumentum-extractor + belső chatbot kombinációja, 3-6 különböző AI-pipeline egyszerre.
A trend egyértelmű: az A → B átmenet gyorsul 2026-ban (a politikai-gazdasági nyomás miatt is — versenyképesség, költség-optimalizáció), a B → C lassabb és kockázatosabb.
Néhány konkrét tényező, amit a discovery-ben kérdezünk:
Megjegyzés: Egyik csoport sem „rossz" pozíció. A csoport-A cégek gyakran okosan várnak — a B-csoportos „PoC-szemét" elkerülésével. A versenyhátrány viszont 2027-re érezhető lehet azoknál, akik 2026-ban még mindig A-csoportban vannak.
Nem minden AI-trend jó KKV-nak. Az alábbi 5-ön bizonyítottan van ROI a magyar piacon. A számok 8+ projekt tapasztalataiból átlagoltak.
Mi ez: Bejövő űrlap / email → automatikus kategorizálás (technikai / kereskedelmi / panasz / spam), sürgősségi score, vázolt follow-up email. A sales-csapat csak a kész vázlatot finomhangolja és küldi.
Tipikus eredmény: Sales-csapatra napi 30-60 perc megtakarítás / fő. Lead-response idő 18 → 4 órás javulás. <90 perces response arány 12% → 41%.
Tipikus költség: 1.5-3M Ft + havi 50-100k Ft üzemeltetés. ROI 6-12 hónap.
Mire NE használd: Ha a sales-csapat 1 fő, és a napi 20 lead-et 15 perc alatt kezeli — a setup-cost nem térül meg.
Részletes case study: Lead asszisztens AI autóipari KKV-nak.
Mi ez: Számla, szerződés, jegyzőkönyv, fuvarlevél → strukturált adat (kinyert mezők) → CRM / ERP / Excel. PDF-feldolgozás OCR-rel, utána LLM az adatszerkezet kinyerésére.
Tipikus eredmény: Backoffice-csapatra napi 1-3 óra megtakarítás. Hibás adat-átvitel 70-85%-os csökkenés. Riport-készítés idő-eltolódás 1-2 napról real-time-ra.
Tipikus költség: 2-5M Ft + havi 80-150k Ft (token-cost). ROI 4-8 hónap (gyorsabb mint a lead-asszisztens, mert a megtakarított idő közvetlenebb).
Mire NE használd: Ha a dokumentum-volumen heti 10 alatt van — a setup-cost túl magas a megtakarításhoz képest.
Mi ez: Belső dokumentumok (procedúrák, szabályzatok, knowledge base) → chatbot, ami forrás-link-kel válaszol. A HR / IT / pénzügy gyakori kérdéseit lekapja a senior-ok időtáblájáról.
Tipikus eredmény: HR / IT support csapatra napi 1-2 óra megtakarítás. Onboarding-idő új belépőkre 30-40%-kal rövidebb (gyorsabb info-access).
Tipikus költség: 2.5-5M Ft + havi 100-200k Ft. ROI 8-14 hónap.
Mire NE használd: Ha a belső dokumentum-corpus 50 oldal alatti — egyszerűbb sima keyword-search.
Részletes implementációs guide: RAG chatbot építése.
Mi ez: Webshop / SaaS termék-FAQ chatbot. A support-tickek 30-40%-a auto-zárul, plus emelt szintű tickeket kategorizál és a megfelelő supporter-hez routol.
Tipikus eredmény: Support-tickek 30-40% auto-zárása. Average first-response time 4-6 óráról 30 másodpercre. CSAT változatlan vagy minimal romlás.
Tipikus költség: 2-4M Ft + havi 80-200k Ft. ROI 6-10 hónap.
Mire NE használd: Ha a termékkatalógus és a használati körülmény túl komplex (B2B-szoftver enterprise-fókusszal) — a chatbot frusztrálja a felhasználót.
Mi ez: Hosszú email-szálak summary → action items → javasolt válaszok. Sales / account management csapatra. A „14-szálas email-thread összefoglalása 30 másodpercben" use case.
Tipikus eredmény: Account manager / senior sales-csapatra napi 30-45 perc megtakarítás. Email-overlook (elfelejtett ticket) csökkenés.
Tipikus költség: 1-2M Ft + havi 30-80k Ft. ROI 6-9 hónap.
Mire NE használd: Ha a sales-flow Slack-első és email-másodlagos — a megtakarítás kisebb.
Néhány AI-use case, amit nem javasolunk KKV-knak 2026-ban (még):
Egy közepes komplexitású AI-projekt (pl. lead-asszisztens) cost-breakdown 2026 Q1 árakon:
| Tétel | Költség (Ft) | Megjegyzés |
|---|---|---|
| Discovery (1-2 hét, fix díjas) | 200-400k | Folyamat-mapping, eval-szet, scope |
| Build (6-10 hét, T&M vagy fix) | 1.5-3M | Frontend + workflow + AI-integráció |
| Hyper-care (30 nap) | benne van a build-ben | Heti monitoring, finomhangolás |
| Havi üzemeltetés (mi, post-hyper-care) | 50-150k | Prompt-finomhangolás, eval-szet karbantartás |
| LLM API token-cost (OpenAI/Anthropic) | 30-150k / hó | Forgalom-függő |
| Vector DB / infra hosting | 10-50k / hó | Supabase / self-hosted Postgres |
| 3rd party tool-ok (CRM, SMS, monitoring) | 5-30k / hó | Provider-függő |
Belépő nettó projekt-cost: 1.7-3.4M Ft.
Évi operating cost: 1-4M Ft.
Miért nem fix árazás 2.5M Ft mindenre?
Egy lead-asszisztens projektnél, ahol a sales-csapat 4 fő:
Megtakarított idő:
30 perc / fő / nap × 4 fő × 220 munkanap = 440 óra / év
Sales-óra értéke (terhelt összes-költség):
12-18k Ft / óra (átlag 15k)
Direkt időmegtakarítás:
440 × 15k = 6.6M Ft / év
Projekt-cost:
3M Ft build + 1.5M Ft / év operating = 4.5M Ft (year 1)
Year 1 ROI (direkt time savings only):
(6.6M - 4.5M) / 4.5M = 46%
Year 2+ ROI:
(6.6M - 1.5M) / 1.5M = 340%
Ez csak a direkt időmegtakarítás. Plus, gyakran van revenue-impact is:
A lead-response idő gyorsulása (18 óra → 4 óra) konverzió-növekedést hozhat. A discovery-mérés alapján:
Ez konzervatív becslés. A revenue-impact gyakran 2-5x a direkt time-savings-en.
Egy közepes projekten:
Tipp: A ROI-becslés a discovery része. Ne fogadj el projektet ROI-becslés nélkül — a number megléte forces a partnert, hogy konkrét mérhető célokat tűzzön ki, nem absztrakt „digitalizálunk" mondatokat.
4 hónapos projekt, ~3M Ft build-cost, ~125k Ft / hó operating. Lead-response 18 óráról 4 órára, sales-csapat napi 35-40 perc megtakarítás. Year 1 ROI: ~80%.
Részletes case study: Lead asszisztens AI autóipari KKV-nak.
3 hónapos projekt, ~2.5M Ft build-cost, ~150k Ft / hó operating. Napi 50-80 fuvarlevél OCR + LLM extraction → ERP. Backoffice-csapatra napi 2-3 óra megtakarítás. ROI year 1: ~120%.
A projekt kihívása: a fuvarlevél-formátumok 12 különböző layout-ot tartalmaztak (különböző szállító-cégek). Eval-szet 200 elemes, 12 templátum szerint balansolva.
2.5 hónapos projekt, ~2.2M Ft build-cost, ~110k Ft / hó operating. Belső termék-doc-okra (300+ oldal). Support-tickek 32%-a auto-zárul, CSAT változatlan (nem romlott — fontos: nem javult, de a support-csapat időmegtakarítás kompenzálja).
ROI year 1: ~75%, year 2: ~300%.
A projekt kihívása: a termék-dokumentáció gyorsan változik (heti release), a vector DB-t inkrementálisan kellett frissíteni.
A „mi az AI-stratégiánk" 2026-ban már túl absztrakt — konkrét use case-ekkel kezdj, ROI-t számolj, és iteráld. A stratégia kialakul a use case-ek megtapasztalásából, nem fordítva.
A „AI-stratégia workshop" a tanácsadó-iparág kedvelt termeke 2024-2025-ben, és a 2026-os tapasztalat: ezek 70-80%-ban shelf-ware maradnak (kész vannak, de a céget nem segítik).
Senior AI engineer havi 1.5-2.5M Ft + a recruiting maga 3-6 hónap. Plus benefits, eszközök, és a junior-okat is tanítani kell. Egy 4 hónapos projekt-re ez 12-15M Ft minimum cost — nem éri meg.
Tanácsadó / outsourcing partnerrel 6 hét alatt élesben van valami. A 3. vagy 4. AI-projektnél lehet érdemes belső csapatra váltani — de nem az 1. előtt.
A 2026-os agent-frameworkok (LangGraph, AutoGen, CrewAI) PoC-szinten lenyűgözőek, production-szinten viszont még flaky-k. Egy multi-step agent egy egyszerű feladaton 5-10 LLM-call-t fogyaszt, és a hibák kumulálódnak — az egyes lépéseken 90%-os accuracy egy 5-lépéses pipeline-on 59% reliability-vé válik (0.9^5 = 0.59).
Single-step LLM-call + jól tervezett workflow stabilabb. Az n8n vagy hasonló orchestration-platformokon kézzel kódolt 5-lépéses pipeline 95-98% reliability-t ad ugyanazon feladaton.
Figyelem: Az autonóm agent-ek éles használata 2026-ban még R&D-fázis. Ha egy partner „AI-agent megoldást" akar eladni neked production-flow-ba, kérdezd, hogy mit fog tenni, amikor a 4. lépésen hallucinál — és milyen recovery van. A válasz tipikusan „még dolgozunk rajta".
Az enterprise OpenAI / Anthropic tier-en explicit no-training opt-out van, és európai data residency elérhető. A „de hát ezt nem használhatjuk GDPR miatt" kifogás 2026-ban már általában nem áll meg — viszont a setup-ja időigényes (DPA aláírás, BAA, regional config).
A „gyorsan, GDPR-ral nem foglalkozunk" megközelítés 1-2 év alatt bukik el — egy felhasználói panaszon vagy a Nemzeti Adatvédelmi Hatóság audit-ján. A bírság 2024 óta szigorodik magyar viszonylatban is.
Ha nincs eval-szett, nem tudod, hogy a rendszer 70%-os vagy 95%-os. A 25 pp különbség az ügyfél-élményben hatalmas — a 70%-os rendszer minden 3. válaszára panasz érkezik, a 95%-osra minden 20. válaszra.
Az eval-szet karbantartása a projekt gerinc. Részletes guide: LLM hallucinációk elleni 7 védekezés.
Ha most lépsz be az AI-térbe KKV-ként:
Listázd a top 5 manuális, repetitív munkafolyamatot, ami napi 1-2+ órás. Ezek a target use case-ek.
Konkrét workshop-formátum: 90 perces meeting a vezetőkkel + 1-1 órás interjú az operatív csapat-tagokkal. Az output egy lista, amelyen minden tétel mellett áll:
2-3 tanácsadóval vagy fejlesztő céggel beszélj. Kérj 30-60 perces díjmentes discovery-call-t. A jelölt-partner három kritérium szerint értékelendő:
A legjobban illeszkedő partnerrel 1-2 hetes fix árú PoC-ot. Cél: működő prototípus a top 1 use case-re. A PoC scope:
Tipikus PoC-cost: 400-800k Ft. Ha többe kerül, gyanús.
PoC eredmény → continue MVP-re (8-10 hét) vagy állj le, próbáld a következő use case-en. A go-kritérium: a PoC eval-szeten legalább 75% accuracy, és a partner becslése a production-szintre min. 90%.
A 30 nap utáni 5 hónap:
| Hónap | Fázis | Output |
|---|---|---|
| 1 | Feltérképezés + PoC | Top use case kiválasztva, PoC futott |
| 2 | MVP-build (1. use case) | Production deployment, hyper-care |
| 3 | Hyper-care + 2. PoC | 1. use case stabil, 2. use case PoC indul |
| 4 | 2. MVP + 1. use case retrospective | 2. production, 1. lessons learned |
| 5 | 3. PoC vagy 1. scaling | Bővítés a következő irányba |
| 6 | Konszolidáció | 2-3 use case élesben, csapat-buy-in |
Témához kapcsolódó saját cikkeink: Lead asszisztens AI case study — konkrét éles projekt. RAG chatbot építése — implementációs guide. LLM hallucinációk elleni 7 védekezés — production-quality framework. n8n vs Zapier vs Make 2026 — orchestration-platform választás.
A magyar KKV-piac 2026-ban érett az AI-implementációhoz — de a sikerhez konkrét use case, mérhető ROI és discovery-fókusz kell. A „mindent át kell írni AI-ra" megközelítés majdnem mindig megégeti magát.
A 2026-os tapasztalat alapján: aki most lép be (1-2 use case-szel kezdve, jól mérve, iteratívan), az 2027-ben már a C-csoportban van. Aki vár, az 2028-ban érzi meg a versenyhátrányt.
Ha AI use case-en gondolkodsz, kezdjük egy díjmentes 30 perces discovery-call-lal — utána pontosan tudni fogod, érdemes-e nekiindulni. Az 1-2 hetes PoC tipikusan tisztázza, hogy az adott use case-en az AI valódi értéket hoz, vagy csak hype.
A szerzőről
Corevanix Kft.
Tech partner
Modern tech partner — SAP/ERP, webfejlesztés, AI automatizáció és mobil app fejlesztés egy szakmai csapatban. KKV-tól enterprise projektig.
LinkedIn →
Hogyan építs RAG chatbotot vállalati dokumentumokra úgy, hogy ne találjon ki dolgokat. Architektúra, stack-választás, költségbecslés és deploy.

Három workflow-automatizációs platform mélyebb elemzése. Pricing, self-hosting, integration count, vendor lock-in és 5 konkrét use case ajánlás.

Hogyan építettünk fel egy AI lead-osztályozó rendszert egy közép-európai autóipari KKV-nak. Architektúra, tech döntések, és a 4 hónap valós tanulságai.