quinta-feira, 20 de outubro de 2011

SGBD orientados a coluna

Neste post vou passar uma noção do que é um SGBD orientado a colunas. É um conceito novo, e não tem nenhuma matéria parecida em português na net. (Se tiverem comentem, pois não achei).

Um SGBD orientado a colunas armazena seu conteúdo de forma inversa aos bancos de dados orientados a linhas. Este formato de armazenar as informações torna-se vantajoso para Data WareHouses onde agregações são procesadas sobre uma quantidade de dados de características similares.


== Descrição ==
Um banco de dados exibe suas informações como tabelas bidimensionais, porém armazenam elas fisicamente como strings unidimensionais. Por exemplo:

EmpIdSobrenomeNomeSalario
1SouzaJoão40000
2SilvaMaria50000
3RodriguesKátia44000

Esta tabela inclui informações de identificação do empregado (EmpId), Sobrenome, nome e salário.
Esta mesma tabela será armazenada fisicamente em um array de bytes de modo que os Sistemas Operacionais possam ler.

Um banco de dados orientado a linhas armazenam as informações serializadas em arquivos onde cada registro corresponde a uma linha do arquivo.

:1,Souza,João,40000;
:2,Silva,Maria,50000;
:3,Rodrigues,Kátia,44000;

Um banco de dados orientado a colunas armazenam as informações serializadas de modo que cada linha do arquivo corresponda a dados de uma mesma coluna.

:1,2,3;
:Souza,Silva,Rodrigues;
:João,Maria,Kátia;
:40000,50000,44000;

== Benefícios ==

Comparando os dois tipos de sistemas de bancos podemos dizer que:

# Sistemas orientados a colunas são mais eficientes quando uma agregação precisa processar muitas linhas, porém com uma quantidade pequena de dados das colunas.
# Sistemas orientados a colunas são mais eficientes quando novos valores de uma coluna são fornecidos para todas as linhas de uma só vez, pois os dados podem ser escritos de forma eficiente e em caso de substituição dos dados da coluna antiga, pode ser substituídos sem alterar as demais colunas do banco.
# Sistemas orientados a linhas são mais eficientes quando várias colunas de um único registro são requeridos ao mesmo tempo, ou quando o número de registros são pequenos.

Nenhum comentário:

Postar um comentário