tanszek:oktatas:muszaki_informatika:adattarolas_adatbazisok
This is an old revision of the document!
Table of Contents
📊 Adatbázisok története és fejlődése
Relációs adatbázisoktól a NoSQL-en át a vektor adatbázisokig
1. Bevezetés
- Miért van szükség adatbázisokra?
- Adat vs. információ
- Strukturált, félstrukturált és strukturálatlan adatok
2. Relációs adatbázisok (RDBMS)
- Történet:
- Edgar F. Codd (1970) – relációs modell
- SQL szabványosítása (1970-es, 1980-as évek)
- Jellemzők:
- Táblák (sorok és oszlopok)
- Szigorú séma (schema-on-write)
- ACID tranzakciók: Atomicity, Consistency, Isolation, Durability
- Példák: MySQL, PostgreSQL, Oracle, Microsoft SQL Server
- Előnyök: Adatintegritás, stabilitás
- Hátrányok: Skálázási nehézségek, strukturálatlan adatok kezelése nehézkes
3. NoSQL adatbázisok
- Megjelenés oka:
- Big Data, Web 2.0, gyorsan változó struktúrák
- Horizontális skálázás igénye
- Típusai:
- Dokumentum-orientált (pl. MongoDB)
- Kulcs-érték tárolók (pl. Redis, DynamoDB)
- Oszlop-orientált (pl. Cassandra)
- Gráf adatbázisok (pl. Neo4j)
- Jellemzők:
- Séma nélküli (schema-on-read)
- BASE modell: Basically Available, Soft state, Eventually consistent
- Nagy teljesítmény, skálázhatóság
4. NewSQL adatbázisok
- Cél: Relációs modell + NoSQL skálázhatóság
- Jellemzők:
- ACID + elosztott tranzakciók
- Példák:
- Google Spanner
- CockroachDB
- VoltDB
5. Vektor adatbázisok
- Motiváció:
- Gépi tanulás, jelentés szerinti keresés
- Embeddingek (szövegek, képek, hangok reprezentációja)
- Működés:
- Objektum → Vektor (embedding)
- Közelségi keresés: k-nn (legközelebbi szomszédok)
- Példák:
- FAISS (Facebook)
- Milvus
- Weaviate
- Pinecone
- Chroma (LLM-es RAG rendszerekhez)
- Alkalmazások:
- Dokumentumkeresés (RAG)
- Képkeresés
- Ajánlórendszerek
6. Tendenciák és jövőkép
- Multimodális adatbázisok (szöveg + kép + struktúrált adatok)
- Hybrid keresés: SQL + vektoros keresés együtt
- AI-native rendszerek: LLM + adatbázis integráció (pl. LangChain)
7. Összefoglaló táblázat
Típus | Példa | Előnyök | Hátrányok |
---|---|---|---|
Relációs | PostgreSQL | Stabil, jól ismert | Nehezen skálázható |
NoSQL | MongoDB | Rugalmas, horizontálisan skálázható | Nincs szigorú séma, konzisztencia lehet gyenge |
NewSQL | CockroachDB | ACID + skálázhatóság | Új technológia, kisebb ökoszisztéma |
Vektor | FAISS | Jelentésalapú keresés, ML támogatás | Nem SQL-alapú lekérdezések, új gondolkodásmód |
8. Demó
- SQL lekérdezés vs. MongoDB lekérdezés
- Szöveg → embedding → hasonló dokumentumok keresése vektor alapján
tanszek/oktatas/muszaki_informatika/adattarolas_adatbazisok.1746600464.txt.gz · Last modified: 2025/05/07 06:47 by knehez