Search results for "HDFS"
showing 3 items of 3 documents
Oracle risinājumu pielietojums Big Data kontekstā
2016
Maģistra darbā tika apskatīti un analizēti Oracle un citu ražotāju piedāvātie risinājumi Big Data apstrādei un analīzei. Darbs satur teorētisku dažādu ražotāju rīku apskati un salīdzinājumu, kā arī praktisko daļu, kurā tiek analizētas datu savienošanas iespējas hibrīdā datu noliktavā. Par hibrīdo datu noliktavu tiek uzskatīta tāda datu noliktava, kurā daļa datu atrodas RDBMS sistēmā un daļa datu HDFS sistēmā. Darba galvenie mērķi ir analizēt šāda veida sistēmas veiktspēju, izmantojot dažādus datu apvienošanas veidus. Testu laikā tika apskatīti apskatīti gadījumi, kad datu apvienošana notiek RDBMS sistēmas pusē un gadījumi, kad datu apvienošana notiek HDFS sistēmas pusē, kā arī tika izpētīta…
A comparison of HDFS compact data formats: Avro versus Parquet
2017
In this paper, file formats like Avro and Parquet are compared with text formats to evaluate the performance of the data queries. Different data query patterns have been evaluated. Cloudera’s open-source Apache Hadoop distribution CDH 5.4 has been chosen for the experiments presented in this article. The results show that compact data formats (Avro and Parquet) take up less storage space when compared with plain text data formats because of binary data format and compression advantage. Furthermore, data queries from the column based data format Parquet are faster when compared with text data formats and Avro. Article in English. HDFS glaustųjų duomenų formatų palyginimas: Avro prieš Parquet…
A systematic review of SQL-on-Hadoop by using compact data formats
2016
Article also submitted for publication in Baltic J. Modern Computing (BJMC) on October 5, 2016.