Cập nhật: 08:13 20/03/2021

Hive là một framework mã nguồn mở dùng để xử lý và truy vấn dữ liệu lớn trên cơ sở dữ liệu phân tán

Hive thường được sử dụng trong hệ thống Big Data. Hive sử dụng ngôn ngữ truy vấn HiveQL (giống SQL) để xử lý các truy vấn dữ liệu lớn.

Hive là một framework mã nguồn mở dùng để xử lý và truy vấn dữ liệu lớn trên cơ sở dữ liệu phân tánHive cung cấp các cơ chế tối ưu hóa truy vấn như phân tán truy vấn, chỉ số và vận dụng MapReduce để xử lý dữ liệu lớn.

Hive hoạt động trên cơ sở dữ liệu Hadoop và tương thích với nhiều công cụ và framework khác trong hệ sinh thái của Hadoop.

Hive thường được sử dụng cho việc xử lý dữ liệu lớn và truy vấn có thể mất nhiều thời gian hơn so với các hệ thống cơ sở dữ liệu truyền thống. Hive hỗ trợ nhiều loại định dạng dữ liệu như Text, SequenceFile và RCFile.

Hive có thể tích hợp với các công cụ Business Intelligence (BI) để trực quan hóa dữ liệu và tạo báo cáo.

Chủ đề:

CÓ THỂ BẠN QUAN TÂM:

© Công ty Phần mềm & Truyền thông VIỆT LONG
Địa chỉ:
Điện thoại:
Email:
Website: https://vietlong.org
Facebook: