User Tools

Site Tools


tanszek:oktatas:muszaki_informatika:adattarolas_adatbazisok

This is an old revision of the document!


Régi anyag: https://docs.google.com/presentation/d/1_nmA1F4ag_O-qlJAE4TfVuyfLgSruZLW/edit?usp=sharing&ouid=110539736176923279178&rtpof=true&sd=true

📊 Adatbázisok története és fejlődése

Relációs adatbázisoktól a NoSQL-en át a vektor adatbázisokig

1. Bevezetés

  • Miért van szükség adatbázisokra?
  • Adat vs. információ
  • Strukturált, félstrukturált és strukturálatlan adatok

2. Relációs adatbázisok (RDBMS)

  • Történet:
    • Edgar F. Codd (1970) – relációs modell
    • SQL szabványosítása (1970-es, 1980-as évek)
  • Jellemzők:
    • Táblák (sorok és oszlopok)
    • Szigorú séma (schema-on-write)
    • ACID tranzakciók: Atomicity, Consistency, Isolation, Durability
  • Példák: MySQL, PostgreSQL, Oracle, Microsoft SQL Server
  • Előnyök: Adatintegritás, stabilitás
  • Hátrányok: Skálázási nehézségek, strukturálatlan adatok kezelése nehézkes

3. NoSQL adatbázisok

  • Megjelenés oka:
    • Big Data, Web 2.0, gyorsan változó struktúrák
    • Horizontális skálázás igénye
  • Típusai:
    • Dokumentum-orientált (pl. MongoDB)
    • Kulcs-érték tárolók (pl. Redis, DynamoDB)
    • Oszlop-orientált (pl. Cassandra)
    • Gráf adatbázisok (pl. Neo4j)
  • Jellemzők:
    • Séma nélküli (schema-on-read)
    • BASE modell: Basically Available, Soft state, Eventually consistent
    • Nagy teljesítmény, skálázhatóság

4. NewSQL adatbázisok

  • Cél: Relációs modell + NoSQL skálázhatóság
  • Jellemzők:
    • ACID + elosztott tranzakciók
  • Példák:
    • Google Spanner
    • CockroachDB
    • VoltDB

5. Vektor adatbázisok

  • Motiváció:
    • Gépi tanulás, jelentés szerinti keresés
    • Embeddingek (szövegek, képek, hangok reprezentációja)
  • Működés:
    • Objektum → Vektor (embedding)
    • Közelségi keresés: k-nn (legközelebbi szomszédok)
  • Példák:
    • FAISS (Facebook)
    • Milvus
    • Weaviate
    • Pinecone
    • Chroma (LLM-es RAG rendszerekhez)
  • Alkalmazások:
    • Dokumentumkeresés (RAG)
    • Képkeresés
    • Ajánlórendszerek

6. Tendenciák és jövőkép

  • Multimodális adatbázisok (szöveg + kép + struktúrált adatok)
  • Hybrid keresés: SQL + vektoros keresés együtt
  • AI-native rendszerek: LLM + adatbázis integráció (pl. LangChain)

7. Összefoglaló táblázat

Típus Példa Előnyök Hátrányok
Relációs PostgreSQL Stabil, jól ismert Nehezen skálázható
NoSQL MongoDB Rugalmas, horizontálisan skálázható Nincs szigorú séma, konzisztencia lehet gyenge
NewSQL CockroachDB ACID + skálázhatóság Új technológia, kisebb ökoszisztéma
Vektor FAISS Jelentésalapú keresés, ML támogatás Nem SQL-alapú lekérdezések, új gondolkodásmód

8. Demó

  • SQL lekérdezés vs. MongoDB lekérdezés
  • Szöveg → embedding → hasonló dokumentumok keresése vektor alapján
tanszek/oktatas/muszaki_informatika/adattarolas_adatbazisok.1746600464.txt.gz · Last modified: 2025/05/07 06:47 by knehez