Neste post vou passar uma noção do que é um SGBD orientado a colunas. É um conceito novo, e não tem nenhuma matéria parecida em português na net. (Se tiverem comentem, pois não achei).
Um SGBD orientado a colunas armazena seu conteúdo de forma inversa aos bancos de dados orientados a linhas. Este formato de armazenar as informações torna-se vantajoso para Data WareHouses onde agregações são procesadas sobre uma quantidade de dados de características similares.
== Descrição ==
Um banco de dados exibe suas informações como tabelas bidimensionais, porém armazenam elas fisicamente como strings unidimensionais. Por exemplo:
EmpId | Sobrenome | Nome | Salario |
1 | Souza | João | 40000 |
2 | Silva | Maria | 50000 |
3 | Rodrigues | Kátia | 44000 |
Esta tabela inclui informações de identificação do empregado (EmpId), Sobrenome, nome e salário.
Esta mesma tabela será armazenada fisicamente em um array de bytes de modo que os Sistemas Operacionais possam ler.
Um banco de dados orientado a linhas armazenam as informações serializadas em arquivos onde cada registro corresponde a uma linha do arquivo.
:1,Souza,João,40000;
:2,Silva,Maria,50000;
:3,Rodrigues,Kátia,44000;
Um banco de dados orientado a colunas armazenam as informações serializadas de modo que cada linha do arquivo corresponda a dados de uma mesma coluna.
:1,2,3;
:Souza,Silva,Rodrigues;
:João,Maria,Kátia;
:40000,50000,44000;
== Benefícios ==
Comparando os dois tipos de sistemas de bancos podemos dizer que:
# Sistemas orientados a colunas são mais eficientes quando uma agregação precisa processar muitas linhas, porém com uma quantidade pequena de dados das colunas.
# Sistemas orientados a colunas são mais eficientes quando novos valores de uma coluna são fornecidos para todas as linhas de uma só vez, pois os dados podem ser escritos de forma eficiente e em caso de substituição dos dados da coluna antiga, pode ser substituídos sem alterar as demais colunas do banco.
# Sistemas orientados a linhas são mais eficientes quando várias colunas de um único registro são requeridos ao mesmo tempo, ou quando o número de registros são pequenos.
Nenhum comentário:
Postar um comentário