Hbase Là Gì

  -  
HBase là một trong những hệ cửa hàng tài liệu mã nguồn mở được kiến thiết dựa trênBigTable được biểu lộ vào nghiên cứu: “BigTable: A Distributed Storage Systemystem for Structure Data”. HBase cung ứng kỹ năng lưu trữ dữ liệu béo lên tới mức hàng tỷ dòng, hàng tỷ cột khác biệt cũng giống như mặt hàng petabytes dung tích. HBase là một trong NoSQL điển hình vì vậy những tables của HBase ko có 1 schemas cố định và thắt chặt cùng không tồn tại những quan hệ tình dục giữa các bảng, không cung cấp phép join giữa những bảng. Hadoop có công dụng mở rộng giỏi với được thiết kế với để không ngừng mở rộng theo hướng ngang (Scale horizontally).

Bạn đang xem: Hbase là gì

Quý khách hàng đã xem: Hbase là gì

Lúc bấy giờ HBase đang là một trong trong số top-màn chơi project của tổ chức Apađậy Software Foundation với được hỗ trợ bên dưới giấy phép: Apabít Lisence 2.0.HBase được xây đắp dựa vào xây đắp của Google BigTable vì vậy nó cũng có rất nhiều điểm kiểu như với BigTable.Dữ liệu được giữ trong 1 table của HBase được khẳng định bởi vì các khóa: “Table, Rowkey, Column Families, Column, Timestamp”.
*

Mỗi table bao gồm không ít row, có thể lên tới mặt hàng tỷ rows trong một table của HBase, các row được xác định cùng nhau bởi 1 khóa nhất “rowkey”, rowkeyvào HBase tất cả chức năng giống như với Primary key trong các hệ cửa hàng tài liệu thường thì.Các row vào cùng 1 talbe luôn được thu xếp theo trang bị từ tự điển theorowkey.

Xem thêm: Fortnite Battle Royale Là Gì, Thể Loại:Trò Chơi Battle Royale

Hình sau cho thấy cách mà HBase bố trí tài liệu Khi ta thêm những row với những rowkey không giống nhau:Trong lúc trong nghiên cứu và phân tích cội BigTable chỉ diễn đạt về single index, mặc dù vào HBase còn cung cấp Secondary IndexIndexes.Mỗi row lại bao gồm những columns khác biệt, những column này lại được gộp thành “column families”.Chúng đỡ đần ta đội các dữ liệu tất cả cùng điểm bình thường lại với nhau, phân nhóm những nhiều loại tài liệu và thực hiện những cơ chế áp dụng lên từng nhóm, ví dụ: nén… Tất cả các columns làm việc trong thuộc 1 column families phần đông được tàng trữ cùng cả nhà sinh sống vào storage tệp tin được điện thoại tư vấn làHFile. Các column families này cần được được khai báo khi ta chế tạo new tables bên trong HBase và trong một table HBase tránh việc bao gồm rất nhiều column families, hiện nay HBase vẫn không vận động xuất sắc cùng với các table có nhiều rộng 2 tốt 3 columns families.Không giống hệt như các hệ cửa hàng tài liệu tình dục, column vào HBase không cần thiết phải khởi tạo tự khi khởi chế tác bảng mà lại ta hoàn toàn có thể chế tạo ra mới column ngay lập tức trong quy trình vận động. Trong 1 table rất có thể có con số column lên tới mức hàng ngàn hoặc nhiều hơn thế nữa. 1 column của Hbase được knhì báo dưới dạng:”families: qualifier”, trong các số đó familieslà tên gọi của columnsfamiliescơ mà colums được team vào trong số ấy,qualifierđể xác định column.

Xem thêm: " Anisotropic Filtering Là Gì ? Định Nghĩa Và Giải Thích Ý Nghĩa

Gía trị của mỗi columns được hotline là cell, mỗi cells chứa nhiều cặp “version(timestamp, value)”.Trong đó timestamp là quý hiếm được có mặt bởi vì khối hệ thống hoăc được khẳng định vì chưng người dùng. Các version khác nhau được khác nhau cùng nhau bởitimestamp, trong 1 cells rất có thể lưu trữ các version của data ứng với thời gian được chuyển vào hệ thống khác nhau. Các version này được sắp xếp theo sản phẩm công nghệ tự từ bắt đầu mang đến cũ. Bởi vậy ta đã phát âm những version bắt đầu của data trước kế tiếp hiểu cho các version cũ hơn của nó…Hình sau biểu đạt 1 cách súc tích biện pháp các version được thu xếp trong mỗi rows:Một điểm biệt lập nữa của HBase đối với các hệ đại lý dữ liệu thông thường khác là các giá trị “null” sẽ không còn được lưu trữ trong các đại lý tài liệu HBase. Hình sau biểu lộ sự khác nhau vào biện pháp tàng trữ thân 2 nhiều loại các đại lý dữ liệu:Đơn vị lưu trữ cơ bạn dạng của HBase là region, bài toán phân chia tables thành những region đảm bảo an toàn kỹ năng phân tán cùng cân bảng cài đặt của HBase. Mỗi region đựng 1 dải các row xếp ngay tức khắc nhau và bọn chúng sẽ tiến hành tự động chia thành 2 ví như tài liệu trong nó trnghỉ ngơi lên quá to.Mỗi region nằm trong 1 RegionServer tốt nhất, nhưng mà mỗi RegionServer lại có thể cất thuộc 1 thời điểm những region không giống nhau như hình sau: