Hbase Là Gì

  -  
HBase là 1 hệ các đại lý tài liệu mã mối cung cấp msinh hoạt được xuất bản dựa trênBigTable được diễn tả trong nghiên cứu: “BigTable: A Distributed Storage Systemystem for Structure Data”. HBase hỗ trợ kĩ năng lưu trữ dữ liệu béo lên tới sản phẩm tỷ cái, hàng ngàn cột khác nhau tương tự như sản phẩm petabytes dung tích. HBase là một trong NoSquốc lộ điển hình bởi thế những tables của HBase ko có 1 schemas thắt chặt và cố định cùng không có các quan hệ giới tính giữa những bảng, không cung cấp phxay join giữa các bảng. Hadoop có khả năng không ngừng mở rộng giỏi với được thiết kế để không ngừng mở rộng theo chiều ngang (Scale horizontally).

Bạn đang xem: Hbase là gì


Hiện giờ HBase đã là 1 trong trong số top-level project của tổ chức Apabịt Software Foundation và được cung cấp dưới giấy phép: Apabít Lisence 2.0.
HBase được sản xuất dựa vào xây đắp của Google BigTable vì vậy nó cũng có khá nhiều điểm kiểu như với BigTable.Dữ liệu được lưu lại trong 1 table của HBase được xác minh vì các khóa: “Table, Rowkey, Column Families, Column, Timestamp”.
*


Mỗi table bao gồm không hề ít row, hoàn toàn có thể lên đến mặt hàng tỷ rows trong 1 table của HBase, các row được khẳng định cùng nhau do 1 khóa tuyệt nhất “rowkey”, rowkeyvào HBase tất cả công dụng giống như với Primary key trong những hệ đại lý dữ liệu thường thì.Các row vào cùng 1 talbe luôn được bố trí theo sản phẩm công nghệ tự trường đoản cú điển theorowkey.Hình sau cho thấy cách nhưng mà HBase sắp xếp dữ liệu lúc ta thêm những row cùng với những rowkey khác nhau:

Trong lúc trong nghiên cứu nơi bắt đầu BigTable chỉ diễn đạt về single index, mặc dù trong HBase còn hỗ trợ Secondary IndexIndexes.

Xem thêm: Sổ Phụ Ngân Hàng Tiếng Anh Là Gì ? Sổ Phụ Ngân Hàng Tiếng Anh Là Gì


Mỗi row lại bao hàm những columns khác biệt, các column đó lại được gộp thành “column families”.Chúng giúp chúng ta nhóm những dữ liệu tất cả thuộc điểm chung lại cùng nhau, phân đội những một số loại dữ liệu cùng triển khai các cơ chế áp dụng lên từng team, ví dụ: nén… Tất cả những columns nghỉ ngơi trong cùng 1 column families hồ hết được tàng trữ với mọi người trong nhà sinh sống vào storage tệp tin được Hotline làHFile. Các column families này rất cần phải được khai báo lúc ta tạo thành mới tables bên phía trong HBase và trong một table HBase tránh việc bao gồm không ít column families, hiện giờ HBase vẫn không hoạt động giỏi cùng với những table có tương đối nhiều rộng 2 tốt 3 columns families.
Không giống như những hệ cửa hàng tài liệu quan hệ giới tính, column vào HBase không quan trọng phải tạo trường đoản cú Lúc khởi sản xuất bảng cơ mà ta hoàn toàn có thể tạo ra mới column ngay vào quy trình chuyển động. Trong 1 table rất có thể có con số column lên tới hàng trăm ngàn hoặc nhiều hơn nữa. 1 column của Hbase được knhị báo dưới dạng:”families: qualifier”, trong những số ấy familieslà tên gọi của columnsfamiliesnhưng mà colums được nhóm vào trong các số ấy,qualifiernhằm xác định column.

Gía trị của mỗi columns được hotline là cell, từng cells đựng được nhiều cặp “version(timestamp, value)”.

Xem thêm: Từ Điển Anh Việt " So To Speak Là Gì ? So To Speak Là Gì

Trong đó timestamp là quý hiếm được hiện ra vày khối hệ thống hoăc được xác minh bởi vì người tiêu dùng. Các version khác biệt được tách biệt với nhau bởitimestamp, trong một cells rất có thể tàng trữ những version của data ứng cùng với thời hạn được đưa vào khối hệ thống khác biệt. Các version này được sắp xếp theo sản phẩm trường đoản cú trường đoản cú new cho cũ. bởi thế ta sẽ hiểu những version new của data trước tiếp đến gọi đến các version cũ rộng của nó…Hình sau diễn tả 1 cách logic giải pháp các version được sắp xếp trong mỗi rows:

Một điểm khác hoàn toàn nữa của HBase so với những hệ đại lý dữ liệu thông thường khác là các giá trị “null” sẽ không được lưu trữ vào các đại lý tài liệu HBase. Hình sau miêu tả sự không giống nhau vào phương pháp tàng trữ thân 2 loại cơ sở dữ liệu:
Đơn vị tàng trữ cơ bản của HBase là region, việc phân loại tables thành những region bảo vệ tài năng phân tán và cân nặng bảng mua của HBase. Mỗi region chứa 1 dải các row xếp tức thời nhau cùng bọn chúng sẽ tiến hành tự động chia thành 2 nếu tài liệu trong nó trsống lên quá to.
Mỗi region ở trong 1 RegionServer độc nhất, nhưng mà từng RegionServer lại rất có thể cất cùng 1 thời gian những region khác biệt như hình sau: