This is an old revision of the document!
Table of Contents
Protocol Buffers
A Protocol Buffers (Protobuf) a Google által fejlesztett módszer a strukturált adatok szerializációjára (bináris formába alakítására). Különösen előnyös azokban az alkalmazásokban, amelyek szerverekkel kommunikálnak vagy adatokat tárolnak, ahol az adatátvitel sebessége és hatékonysága kritikus. A Protobuf úgy lett tervezve, hogy egyszerűbb és hatékonyabb legyen az XML-nél és JSON-nál, kisebb üzenetméreteket és gyorsabb feldolgozást kínál.
A Protobuf a strukturált adatokat egy standard formátumban: .proto fájlban adja meg, amelyet aztán felhasználnak forráskód generálására a kiválasztott programozási nyelven. Ezt a forráskódot használják a strukturált adatok írására és olvasására különböző adatfolyamokból.
A Protobuf jellemzői
- Hatékonyság: A Protobuf hatékonyabb az XML és JSON alapú adattovábbításnál, mind a sebesség, mind az adatok méretének tekintetében.
- Többnyelvű támogatás: A Protobuf támogatja a kódgenerálást különböző programozási nyelveken, lehetővé téve az adatcsere egyszerűsítését.
- Visszafelé kompatibilitás: A Protobuf úgy van kialakítva, hogy kompatibilis maradjon az adatstruktúra változásai esetén is, lehetővé téve a régi kód számára az új adatformátumok olvasását és fordítva.
A Protobuf egy adatintegrációs projektben való implementálásához tipikusan:
- Definiálni kell az adatszerkezeteket egy .proto fájlban.
- Protobuf fordító (protoc) az adathozzáférési osztályokat legenerálja a .proto fájlok alapján.
- A fejlesztő könnyen használni tudja ezeket a generált osztályokat a szolgáltatások közötti kommunikációhoz.
További részletek itt olvashatók:
https://developers.google.com/protocol-buffers/docs/tutorials
Python mintafeladat
1.) Telepítsük fel a hivatalos oldalról a fordítót. https://github.com/protocolbuffers/protobuf/releases - windows esetén keressük meg a protoc-XXXXXX-win64.zip állományt és csomagoljuk ki.
2.) Hozzunk létre egy könyvtárat ./proto néven és a book.proto állományt a következő tartalommal:
syntax = "proto3";
message Book {
int32 id = 1;
string title = 2;
string author = 3;
float price = 4;
}
message Books {
repeated Book books = 1;
}
Két üzenetet hoztunk létre, Book és Books néven. A Books több Book-ot tartalmazhat. A sorok végén az = 1, = 2 a struktúra mező belső pozícióját adja meg, egytől indul a számozás.
3.) Futtassuk le a következő parancsot:
.\protoc\bin\protoc.exe --python_out=.\ book.proto
A futtatás után létrejön a book_pb2.py ami generált forráskód, és az adat interfészt tartalmazza. Ennek segítségével lehet kezelni (szerializálni és de-szerializálni) az adatokat.
4.) Futtassuk le a pip install protobuf parancsot.
5.) Hozzuk létre a server.py fájlt a következő tartalommal:
import socket
import book_pb2
import create_books as c
# protoc/bin/protoc --python_out=./ book.proto
# pip3 install --upgrade protobuf
books = c.create_books()
book_store = book_pb2.Books()
for book in books:
book_store.books.append(book)
bytes_to_send = book_store.SerializeToString()
#TCP socket server
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.bind((socket.gethostname(), 4100))
s.listen(10)
while True:
client_socket, address = s.accept()
print(f"server> Connection from {address} has been established!\n")
client_socket.send(bytes_to_send)
print(f"server> Message sent: {bytes_to_send}\n")
msg = client_socket.recv(1024)
print(f"client> {msg}\n")
client_socket.close()
if msg == b'bye':
break
s.close()
6.) Hozzuk létre a create_books.py állományt az alábbi tartalommal:
import book_pb2
def create_books():
books = []
books.append(book_pb2.Book())
books[0].id = 1
books[0].title = "Solaris"
books[0].author = "Stanislaw Lem"
books[0].price = 7.54
books.append(book_pb2.Book())
books[1].id = 2
books[1].title = "Dune"
books[1].author = "Frank Herbert"
books[1].price = 9.87
books.append(book_pb2.Book())
books[2].id = 3
books[2].title = "Foundation"
books[2].author = "Isaac Asimov"
books[2].price = 5.07
return books
7.) Hozzuk létre a client.py állományt az alábbi tartalommal:
import socket
import book_pb2
from google.protobuf.json_format import MessageToJson
import json
#TCP socket client
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect((socket.gethostname(), 4100))
msg = s.recv(1024)
print(f"server> {msg}\n")
s.sendall(b'bye')
print(f"client> Message sent: {b'bye'}\n")
s.close()
books = book_pb2.Books()
books.ParseFromString(msg)
json_obj = MessageToJson(books)
print(f"client> The server's message in JSON:\n{json_obj}")
dict_obj = json.loads(json_obj)
with open('data.json', 'w', encoding='utf-8') as f:
json.dump(dict_obj, f, ensure_ascii=False, indent=4)
print("client> data.json saved\n")
with open('data.bytes', 'wb') as fb:
fb.write(msg)
print("client> data.bytes saved\n")
8.) Futtassuk le a szervert és klienst. python server.py majd a python client.py parancsokat és nézzük meg és elemezzük mi történik?
9.) Írjuk meg más nyelven a klienst!
Egy lehetséges megoldás az alábbi java-ban. Generáljuk le a protoc segítségével a java helper osztályt. A Maven repository-ból töltsük le a protobuf.jar-t (https://repo1.maven.org/maven2/com/google/protobuf/protobuf-java/), figyelve a megfelelő verzióra.
import java.io.IOException;
import java.io.ObjectOutputStream;
import java.net.Socket;
public class Client {
Socket requestSocket;
ObjectOutputStream out;
Client() {
}
void run() {
try {
requestSocket = new Socket("localhost", 4100);
out = new ObjectOutputStream(requestSocket.getOutputStream());
BookOuterClass.Books books = BookOuterClass.Books.parseFrom(requestSocket.getInputStream());
for (BookOuterClass.Book book : books.getBooksList()) {
System.out.println("Book ID: " + book.getId());
System.out.println("Author: " + book.getAuthor());
}
} catch (IOException ioException) {
ioException.printStackTrace();
}
}
public static void main(String args[]) {
Client client = new Client();
client.run();
}
}
Haladó lehetőségek
- Authentication – Hitelesítési módszerek, beleértve saját mechanizmusok beépítését.
- Benchmarking – Teljesítménymérés eszközei és módszerei.
- Cancellation – RPC hívások megszakítása.
- Compression – Adatok tömörítése az átvitel előtt.
- Custom Backend Metrics – Saját metrikák gyűjtése szerver és kliens oldalon.
- Custom Load Balancing Policies – Egyedi terheléselosztási szabályok implementálása.
- Custom Name Resolution – Névfeloldás testreszabása.
- Deadlines – Határidők használata megbízhatatlan háttérszolgáltatások esetén.
- Debugging – Hibakeresés grpcdebug eszközzel.
- Error Handling – Hibakezelés és státuszkódok értelmezése.
- Flow Control – Manuális adatfolyam-vezérlés.
- Graceful Shutdown – Szerverek leállítása az ügyfelek megszakítása nélkül.
- Health Checking – Egészségügyi ellenőrzés támogatása szerver és kliens oldalon.
- Interceptors – Köztes rétegek alkalmazása általános funkcionalitásokhoz.
- Keepalive – HTTP/2 alapú kapcsolatébrentartás.
- Metadata – Kiegészítő adatok küldése fejlécekkel.
- OpenTelemetry Metrics – Megfigyelhetőség, mérőszámok gyűjtése.
- Performance Best Practices – Nyelvfüggő teljesítményoptimalizálási tanácsok.
- Reflection – Szolgáltatásleírások lekérdezése futásidőben.
- Request Hedging – Késleltetett kérések párhuzamos újraküldése.
- Retry – Újrapróbálkozás szabályozása részletesen.
- Service Config – Szolgáltatáskonfigurációs fájl kliens viselkedés befolyásolására.
- Status Codes – Részletes státuszkód lista és jelentések.
- Wait-for-Ready – Várakozás, míg a szerver készen áll a kiszolgálásra.
