Postagens

Mostrando postagens de março, 2022

Dados Estruturados, Semi-Estruturados e Desestruturados

Imagem
Introdução Em Big Data, a variedade dos dados é uma importante característica. Sendo assim, fontes de dados cada vez mais complexas lidarão com diversos tipos de dados, estes que sua vez podem ser classificados em estruturados, semi-estruturados e desestruturados. Nesse contexto, é importante saber identificar a estruturação dos dados a fim de extrair o máximo de valor. Dados Estruturados O termo dados estruturados, geralmente, se refere a dados que estão em conformidade com um esquema bem definido. Exemplos de dados estruturados incluem números, datas e grupos de palavras, que normalmente são associados em um banco de dados. Se observarmos uma tabela de um banco de dados, é importante notar que mesmo sem olhar para os dados, você terá a garantia de que cada registro que aparecerá na tabela sempre estará de acordo com o esquema da mesma, sem exceções. E como cada registro em um banco de dados relacional é uma linha em uma tabela definida, tem-se uma garantia de estrutura, ainda mais se...

Normalização e Desnormalização de Banco de Dados

Imagem
Introdução Desnormalização e normalização são duas estratégias para o design de banco de dados, que como veremos, existem diferenças e trade-offs entre as duas abordagens. Considere os elementos básicos que você pode usar para criar tabelas: colunas, tipos de dados e outras propriedades de coluna, chaves primárias e chaves estrangeiras. Com esses elementos básicos, você tem muita flexibilidade na forma de como projeta as tabelas para seu banco de dados.  O SGBD não exige que você tenha uma chave primária em uma tabela, então esta é uma maneira possível de armazenar os dados. Com toda essa liberdade de como você configura suas tabelas, pode ser útil entender essas estratégias gerais de design de banco de dados dependendo de suas necessidades. Normalização A normalização do banco de dados é uma estratégia pela qual você projeta cada tabela para que ela obedeça a determinadas condições ou regras organizacionais. As regras são construídas para formas cada vez mais rígidas de organizaçã...

Bancos de Dados Operacionais e Analíticos

Imagem
Bancos de Dados Operacionais O propósito dos bancos de dados operacionais é determinar o estado atual do sistema. Portanto, seu uso é focado em manter os dados sobre o agora, ou o mais próximo possível do agora. Eles não precisam de dados sobre o que ocorreu semana passada ou do mês passado. Na verdade, ter muitos desses dados obsoletos pode aumentar o tamanho do armazenamento de dados do banco e diminuir a velocidade das consultas primárias que você deseja atender. A ideia em sistemas Big Data de propósito operacional é a mesma, permitir que recursos operacionais sejam executados em tempo real em cargas de trabalho interativas que ingerem e armazenam dados de seu estado atual. Bancos de Dados Analíticos Por outro lado, bancos de dados analíticos não precisam manter o status atualizado do sistema. Em vez disso, seu propósito é manter uma coleção de dados grande e estável que pode fornecer respostas para perguntas mais complexas de longo prazo. O valor desse banco de dados está em sua...

Operadores em R

Imagem
R tem diversos operadores para realizar diferentes operações matemáticas e lógicas. Operadores Aritméticos Esses operadores são usados para operações matemáticas como adição e multiplicação. Operador Descrição + Adição - Subtração * Multiplicação / Divisão ^ Elevado %% Módulo %/% Divisão inteira Operadores Relacionais Esses operadores são usados para comparar dois valores. O resultado é um vetor lógico. Operador Descrição <  Menor que >  Maior que <= Menor ou igual que >= Maior ou igual que == Igual que != Diferente de Operadores Lógicos Esses operadores são usados para realizar operações booleanas como “AND” e “OR”. Oper...