Histograma

representação gráfica em colunas ou em barras de um conjunto de dados

O histograma, também conhecido como distribuição de frequências, é a representação gráfica em colunas ou em barras (retângulos) de um conjunto de dados previamente tabulado e dividido em classes uniformes ou não uniformes.[1] A base de cada retângulo representa uma classe. A altura de cada retângulo representa a quantidade ou a frequência absoluta com que o valor da classe ocorre no conjunto de dados para classes uniformes ou a densidade de frequência para classes não uniformes.[2][3] Importante ferramenta da estatística, o histograma também é uma das chamadas sete ferramentas da qualidade.[4][5]

Histograma de um grupo de 18 pacientes. Coleta de HDL com 6 classes definidas e intervalos de 5 mg/dL.

Quando o volume de dados aumenta indefinidamente dentro do conjunto de dados e o intervalo de classes tende a zero (o que torna os retângulos cada vez mais finos e altos), a distribuição de frequência torna–se uma distribuição de densidade de probabilidades. A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Os histogramas podem indicar se uma distribuição se aproxima de uma função normal, assim como também podem indicar a mistura de populações quando se apresentam bimodais.[6]

História

editar
 
William Playfair

A palavra "histograma" se origina dos termos gregos: istos (mastro) e gramma (escrita) e pode ser interpretada como uma escrita em longas formas verticais ou algo semelhante. Entretanto, a palavra não foi originalmente utilizada no idioma grego.[7] [8]

A noção de histograma foi cunhada pelo matemático britânico Karl Pearson no ano de 1895. De acordo com informações do Oxford Dictionary of English, extraídas da obra Philosophical Transactions of the Royal Society, a palavra foi introduzida pelo autor em suas palestras sobre estatística como um termo para uma forma comum de representação gráfica. Isto é, colunas que marcam como áreas a frequência correspondente à extensão da sua base.[8] A palavra teria surgido do termo inglês historical diagram (diagrama histórico).[9]

Tudo indica que os histogramas começaram a ser utilizados antes de receberem o nome. Porém, o seu surgimento é incerto. Provavelmente os gráficos de barras antecederam os histogramas. O gráfico de barra mais antigo do qual se tem informações aparece no livro Commercial and Political Atlas, escrito pelo economista político escocês William Playfair para mostrar as importações e as exportações entre a Escócia e outros dezessete países em 1781.[10][8]

Embora Playfair não acreditasse na utilidade da sua criação, ela foi utilizada por vários estudiosos nos anos seguintes. Por exemplo, a enfermeira britânica Florence Nightingale que utilizou gráficos de barras para comparar a mortalidade no exército de paz e a mortalidade dos civis e convencer o governo britânico a melhorar a higiene das forças armadas.[11]

O histograma foi utilizado pela primeira vez em 1883 pelo advogado e estudioso de estatística francês André–Michel Guerry para descrever sua análise estatística sobre os crimes contra a população em Paris.[12] Com seu livro Essai sur la Statistique Morale de la France (Ensaio sobre a Estatística Moral na França), apresentado à Academia Francesa de Ciências em 1832 e publicado em 1833, Guerry foi o primeiro a apresentar a ideia de um mapa em que regiões individuais eram representadas por cores diferentes com base em alguma variável.[13]

Guerry procurou traçar uma geografia criminal com a sobreposição de dados do Compte Général de l’Administration de la Justice Criminelle (documento estatístico–judiciário mais importante da França, que teve seu primeiro volume publicado em 1827), fonte de natureza fiscal e econômica e informações referentes ao grau de instrução da população.[14] Guerry criou o primeiro mapa coroplético ao escurecer regiões individuais para representar os níveis de criminalidade. Hoje em dia os mapas cloropléticos são comuns para indicar resultados de eleições, distribuição de riquezas entre outras variável relacionadas geograficamente.[13]

Definição informal

editar

Um histograma representa uma distribuição de frequência por meio de retângulos, cujas larguras representam intervalos de classe e cujas áreas são proporcionais às frequências (absolutas ou relativas). A altura de cada retângulo é a frequência dividida pelo tamanho do intervalo.[15] Se os intervalos de classes adjacentes não possuem lacunas, os retângulos tocam–se para indicar que a variável original é contínua.[16] Por exemplo, um histograma pode conter dois intervalos de ligação 10,5 – 20,5 e 20,5 – 33,5, mas não pode conter dois intervalos de ligação 10,5 – 20,5 e 22,5 – 32,5. Os intervalos vazios são representados como vazios (não são ignorados).

Os histogramas às vezes são confundidos com gráficos de barras.[17] Um histograma é usado para dados contínuos, em que os intervalos de classe representam a extensão dos dados. Já um gráfico de barra é um gráfico de variáveis categóricas ou discretas. Alguns autores recomendam que os gráficos de barras tenham espaços entre os retângulos para esclarecer a diferença.

Se um histograma possui intervalos de classe de larguras iguais, um retângulo é erguido sobre o intervalo de classe com altura proporcional à frequência (número de casos em cada intervalo de classe). Um histograma também pode ser normalizado para mostrar frequências relativas. Neste caso, o gráfico mostra a proporção de casos em cada uma das várias categorias com soma das alturas igual a 1.[18] Se um histograma possui intervalos de classe de larguras diferentes, o retângulo erguido tem área proporcional à frequência dos casos no intervalo de classe.[19] Neste caso, o eixo vertical não é a densidade de frequência (número de casos por unidade da variável no eixo horizontal).[20]

Os histogramas dão um sentido grosseiro da densidade da distribuição subjacente dos dados e geralmente são estimativas da densidade – estimativa da função densidade de probabilidade da variável subjacente. A área total de um histograma usado para uma densidade de probabilidade é sempre normalizada para 1. Se os comprimentos dos intervalos no eixo x forem todos 1, então o histograma é idêntico ao gráfico de frequência relativa.[21]

Um histograma pode ser pensado como uma estimativa simplista da densidade kernel, que utiliza o kernel para suavizar as frequências sobre os intervalos de classe. Isto leva a uma função densidade de probabilidade mais suave, que em geral refletirá mais precisamente a distribuição da variável subjacente. A estimativa da densidade pode ser plotada como uma alternativa ao histograma e geralmente é representada como uma curva em vez de um conjunto de retângulos.[22] Outra alternativa é o histograma com média deslocada,[23] que é rápido de ser computado e fornece uma estimativa de curva suave da densidade sem utilizar o kernel.

Então, um histograma pode ser construído, considerando "dado" como qualquer medida ou resultado experimental, para responder às seguintes questões:[24]

  • Que tipo de distribuição os dados estão sugerindo?
  • Como os dados estão localizados?
  • Os dados são simétricos?
  • Existem dados que devem ser desconsiderados por estarem distante dos demais dentro do conjunto?
  • Como os dados estão dispersos?[24]

Definição Formal

editar
 
Um histograma cumulativo comum dos mesmos dados. Os dados apresentados são uma amostra aleatória de 10.000 pontos de uma distribuição normal com uma média de 0 e um desvio padrão de 1.

Em termos matemáticos, um histograma é uma função  que conta o número de observações de cada um dos intervalos de classe. Um gráfico é apenas uma forma de representar um histograma. Então, se  for o número total de observações e se  for o número total de intervalos de classe, o histograma   satisfaz a seguinte condição

 [25]

Histograma cumulativo

editar

Um histograma cumulativo é um mapeamento que conta o número cumulativo de observações em todos os intervalos de classe até o intervalo de classe especificado. Um histograma cumulativo  de um histograma  é definido como  .[26]

Número de barras e largura

editar

Não há um número ideal de intervalos de classe. Diferentes tamanhos de intervalos de classe podem revelar diferentes características dos dados. O agrupamento de dados é pelo menos tão antigo quanto o trabalho de John Graunt no século XVII, embora nenhuma orientação sistemática tenha surgido até o trabalho de Herbert Sturges em 1926.[27][28]

Usando intervalos de classe mais largos, a baixa densidade reduz o ruído devido à aleatoriedade da amostragem. Usando intervalos de classe mais estreitos, a densidade elevada garante maior precisão à estimativa da densidade. Então, variar a largura do intervalo de classe em um histograma pode ser benéfico. Entretanto, intervalos de classe com larguras iguais são amplamente utilizados.[29]

Alguns teóricos tentaram determinar um número ótimo de intervalos de classe. Entretanto, estes métodos geralmente fazem suposições fortes sobre a forma da distribuição. Dependendo da distribuição real dos dados e dos objetivos das análises, diferentes larguras de intervalos de classe podem ser apropriadas. Então, a experimentação geralmente é necessária para determinar uma largura apropriada. Porém, há várias diretrizes úteis e regras práticas.[30]

Escolha do número de barras pela regra de amplitude

editar

O número de intervalos de classe  pode ser calculado diretamente ou a partir de uma largura de intervalo de classe sugerida  como

 ,[31] em que  é o número mínimo inteiro maior ou igual que  .

Escolha do número de barras como raiz quadrada de numero de observações

editar

 ,[31] que toma a raiz quadrada do número de pontos de dados na amostra. Isto é usado pelos histogramas do Excel, entre outras ferramentas. [32]

Escolha do número de barras pela fórmula de Sturges

editar

A fórmula de Sturges   é baseada em uma aproximação da distribuição binomial pela normal,[28] aqui logaritmo é de base 10. Observa–se que  , o que leva a fórmula  . A fórmula de Sturges relaciona os tamanhos dos intervalos de classes a partir da extensão dos dados. Ela pode funcionar mal se   porque o número de intervalos de classes será pequeno (menor que 7) e as tendências dos dados provavelmente não serão bem mostradas. Ela também pode funcionar mal se os dados não forem normalmente distribuídos.[31]

Escolha do número de barras pela regra de Rice (Universidade Rice, EUA)

editar

A regra de Rice  é uma alternativa simples à regra de Sturges.[33]

Escolha do número de barras pela fórmula de Doane

editar

A fórmula de Doane é uma modificação da fórmula de Sturges que tenta melhorar seu desempenho com dados não normais.[34]

 , em que   é a estimativa da distorção do terceiro momento da distribuição e  .

Escolha de largura pela referência normal de Scott

editar

 ,[35] em que   é o desvio padrão da amostra. A regra de referência normal de Scott[36] é ideal para amostras aleatórias de dados normalmente distribuídos, no sentido que minimiza o erro quadrático médio integrado da estimativa de densidade.[27] Esta abordagem de minimizar o erro quadrático médio integrado pode ser generalizada para além das distribuições normais.[37]

Seja  ,[37] em que  é o número de pontos de dados na  -ésima barra. A regra escolha o valor   que minimiza a função    , o que faz com que o erro quadrático médio integrado seja minimizado.

Escolha de largura pela fórmula de Freedman-Diaconi

A escolha de Freedman–Diaconi[38][27] é baseada na amplitude interquartil (interquartile range ou  , em inglês), em que  . Ela substitui o desvio padrão   da regra de Scott pela dobro de amplitude interquartil  . Ela é menos sensível que o desvio padrão para outliers.

Escolha do número de barras baseada na minimização de uma função de risco  

editar

A escolha do número de barras baseada na minimização de uma função de risco  é dada por  , em que   e   são a variância média e tendenciosa de um histograma com largura do intervalo de classe  ,   e  .[39][40] Observa–se que   e   dependem da escolha de  ,  ,  . Isto é, a regra escolha o valor   que minimiza a função  .

Exemplos

editar

Construindo um histograma

editar
 
Tabulação dos dados das coletas de HDL realizadas em um grupo de 18 pacientes que foram agrupados em 6 classes delimitadas por intervalos de 5 mg/dL.

A construção de um histograma envolve as seguintes etapas:

  1. Organizar os dados em ordem crescente;
  2. Definir os intervalos e o número de classes;
  3. Construir o gráfico.[41]

Para definir o intervalo e o número de classes para um conjunto de dados não há fórmula matemática exata, mas uma sistemática consiste em determinar:

  •  
  •  
  •  
  •  
  •  

Dentro desta sistemática, é essencial que  , de modo que todos os dados sejam abrangidos. Um   muito pequeno pode incluir variações muito pequenas de valores ou ruído e um   muito grande pode eliminar variações importantes dos dados.[42][43]

Para  , pode–se aplicar com segurança a fórmula proposta por Sturges.[44]   é o menor inteiro, tal que  .[45] No exemplo da tabela ao lado ( ),   é uma boa escolha para o número de classes. Para  ,   é uma boa escolha para o intervalo de classes.[46]

Para construir um histograma de forma mais prática, existem aplicativos computacionais como o Origin, que definem automaticamente o número de classes e de intervalos. Porém, é necessário que o usuário verifique se a solução proposta pelo aplicativo atende à necessidade de o histograma ser suficiente e adequadamente elucidativo.[47]

Construção de um histograma com base no Censo

editar

A partir de uma análise estatística e de dados demográficos de uma população é possível construir um histograma. Por exemplo, o Escritório de Censos dos EUA[48] descobriu que havia 124 milhões de pessoas que trabalham fora de suas casas. Usando os dados sobre o tempo de viagem de casa para o trabalho, a tabela abaixo mostra o número absoluto de pessoas que responderam na sua maioria pelo menos 30 minutos e menos de 35 minutos para o tempo de percurso. Isto provavelmente deve–se às pessoas que arredondam o tempo de viagem de casa para o trabalho. O problema de relatar valores como números arbitrariamente arredondados é um fenômeno comum na coleta de dados de pessoas.[48]

A construção de um histograma demonstra o número de casos por intervalo de unidade como a altura de cada bloco, de modo que a área de cada bloco é igual ao número de pessoas correspondente a sua categoria de tempo de viagem. A área das barras do histograma representa o valor absoluto ou o número total de casos (124 milhões de pessoas). Foi considerada a quantidade (Q) em milhares para este tipo de histograma o qual mostra números absolutos. Isto é, não existe uma representação por porcentagem e/ou decimais.[48]

 

Além do histograma construído a partir dos números absolutos é possível construir outro histograma a partir de dados de proporção. Isto é, a área de cada bloco é a fração do total que cada categoria representa e a área total de todas as barras é igual a 1 (a fração significa "tudo"). A partir das barras do histograma é possível desenhar uma curva a qual é uma estimativa de densidade simples. Este tipo de histograma mostra proporções, de modo que difere–se do primeiro histograma apenas na escala vertical. Este tipo de histograma é também conhecido como histograma de área de unidade.[49]

 

Leitura de um histograma

editar

Em um histograma, é a área que indica a frequência de ocorrência de cada barra. Isto significa que a altura da barra não indica necessariamente a quantidade de ocorrências dentro dela. É o produto da altura pela largura da barra que indica a frequência de ocorrência dentro da barra. Uma das razões pelas quais a altura da barra é confundida com o indicador de frequência da barra é o fato de muitos histogramas terem barras igualmente espaças.[50]

O aprendizado sobre os histogramas também requer o entendimento das partes do gráfico. O eixo X ou eixo horizontal mostra o intervalo ou os valores dos intervalos de variável de interesse. Eles são comumente chamados de intervalos de classe, que representam ou resumem grandes conjuntos de dados. O eixo Y ou eixo vertical mostra os valores das alturas das barras.[51]

Tipos gráficos de um histograma

editar

Frequência absoluta

editar

Uma frequência absoluta é o número que representa a quantidade de dados em uma determinada amostra ou o intervalo de classe especifico.[52] Por exemplo, em época de eleições, a quantidade de eleitores brasileiros é representada por um número. Este número chama–se de frequência absoluta.[53] Até 2016 o número de eleitores brasileiros era de 146 275 020 de pessoas. Portanto, o gráfico de frequência absoluta é o histograma usual, em que o eixo Y (ordenada) indica a frequência (absoluta) com que uma classe aparece no conjunto de dados.

 

 
grafico de histograma de frequências relativas e cumulativas

Frequência relativa

editar

Uma frequência relativa é o valor percentual que é obtido por meio do resultado da divisão entre o valor absoluto e a quantidade de elementos da população ou da amostra. Para a construção da frequência relativa e acumulativa, é preciso fazer uma tabela associando a classe ao porcentual em que ela aparece no conjunto de dados.[54] Por exemplo, na classe entre 45 e 50 mg/dL da tabela abaixo, obteve–se a frequência absoluta 4 do total de 18 amostras submetidas à análise. Logo,

 . [55]  

Frequência cumulativa

editar

A frequência cumulativa está ligada à soma dos valores de frequência relativa. Por exemplo, para o gráfico de frequência cumulativa soma–se em ordem crescente o valor de uma frequência relativa de uma classe qualquer com todas as classes com valores inferiores. Este gráfico é útil para obter informações a respeito de uma faixa de valores. Por exemplo, na tabela acima observa–se que 61,11% das amostras têm valor inferior a 55 mg/dL.[56] Desta forma obtém-se o gráfico abaixo que representa os histogramas da frequência relativa e acumulativa, indicando a frequência absoluta em cada classe.

 

Polígono de frequências

editar

Polígono é uma forma geométrica que, por definição, é uma região fechada de um plano limitada por um conjunto de segmentos finitos.[57] A diversidade do conceito de polígonos permite a elaboração de uma área, ligando os pontos centrais do topo de cada barra de um histograma chegando na elaboração de um polígono de frequências. [58]

 
Histograma2
 
Exemplos de diferentes tipos de polígonos
 
polígono de frequências, usado em Histograma

Exemplos de histogramas padrões

editar

Com os dados da tabela abaixo, é possível chegar aos exemplos de histogramas padrões simétricos e unimodal, distorcido à direita, distorcido à esquerda, bimodal, multimodal e simétrico. Também é possível encontrar as medidas de tendência central, media, moda e mediana.[59][60]

 
Utilização do histograma para o cálculo da mediana da população {2, 2, 3, 7, 8, 9, 9}.
 
Utilização do histograma para o cálculo da média aritmética da população {2, 2, 3, 7, 8, 9, 9}.
 
Utilização do histograma para o cálculo da moda da população {1, 7, 4, 6, 5, 5, 3, 5}.
Variável Contagem
−3,5 23
−2,5 32
−1,5 109
−0,5 180
0,5 132
1,5 34
2,5 4
3,5 90

Simétricos e unimodal

editar

 

Um histograma unimodal ou simétrico centraliza os dados na média (medida central) e possui características por meio da distribuição da média e do desvio padrão. Uma característica do histograma unimodal ou simétrico é conter a partir do centro do gráfico o maior número de dados. Por exemplo, partindo do centro da base das barras e somando para a direita e subtraindo para a esquerda do gráfico o desvio padrão, encontra–se 68% dos dados. Em estatística, este modelo é chamado de normal e permite analisar o quanto outros dados se afastam deste modelo.[61]

Distorcido à direita

editar

 

Um histograma é distorcido à direita quando a distribuição de dados indica a ocorrência de altos valores com baixa frequência. Este modelo é geralmente usado para representar fenômenos identificados na economia pelas variáveis como preço, Produto Interno Bruto (PIB), salários, entre outras.[62]

Distorcido à esquerda

editar

 

Um histograma é distorcido à esquerda quando a frequência dos dados está concentrada nos altos valores e sendo chamada de distorcida à esquerda. Observa–se que há mais informações acima da média devido a falta de simetria.[62]

Bimodal

editar

 

Um histograma é bimodal quando há o aparecimento de dois picos.

Multimodal

 

Um histograma é multimodal quando há o aparecimento de vários picos. Em tratamento de imagens, os picos são as representações das regiões com maior quantidade de pixels.[63]

Platô

editar

 

Um histograma tem o formato Platô quando suas barras tem praticamente os mesmo tamanhos de altura. Isto ocorre quando existem várias distribuições juntas com médias diferentes. [64]

Processamento de imagens

editar

O campo da computação chamado processamento de imagem é um exemplo prático de como histogramas podem ser utilizados. Em uma imagem, a quantidade de vezes que uma determinada cor se repete pode ser representada por um histograma. Como há várias possibilidades de cores, este tipo de histograma é gerado com base em uma foto preto e branco.[65]

Em processamento de imagens e vídeos, os histogramas são utilizados para traduzir distorções, cores, padrões, número total de objetos, dimensões, geometria, propriedades de cor, luminosidade e textura.[66] Isto é, os histogramas são utilizados para o reconhecimento e a recuperação de imagens morfistas e de objetos poliédricos com poses desconhecidas. Portanto, o histograma das intensidades de imagens demonstra–se uma ferramenta eficiente para a indexação de bases de dados visuais.[67]

Não é possível codificar informações sobre textura. Isto é, não é possível gerar um conjunto de dados representativos a partir da representação da imagem (não são gerados arquivos). Entretanto, os histogramas das versões gaussianas ou curva normal de uma imagem desfocada, codificam as interações entre intensidades de partes vizinhas da imagem causada pela falta de foco. Estes histogramas chamam–se histogramas de multi–resolução. Estas representações mantêm as propriedades importantes dos histogramas. Entre as facilidades da técnica estão a agilidade para computar, espaço eficiente e invariante para movimentos rígidos. O desfoque inerente também é útil ao ruído. Todas estas propriedades resultam em um recurso de textura eficaz.[67]

Por meio da amostragem da imagem é possível quantificar a quantidade de pixels utilizada na imagem digitalizada. Por meio da quantidade de pixels é possível entender a quantidade de tons que podem ser atribuídos a cada bit, equivalente a cada pixel. A decodificação é o processo de acessar as informações codificadas para mostra–las novamente em imagem.[68]

Com o objetivo de melhorar a qualidade das imagens sob os critérios subjetivos do olho humano a técnica de realce de contraste normalmente é utilizada como uma etapa do pré–processamento para sistemas de reconhecimento de padrões. Pode–se definir o contraste entre dois objetos como a razão entre os seus níveis de cinza médios. Com o objetivo de aumentar a discriminação visual entre os objetos presentes na imagem a manipulação do histograma consiste na transferência radiométrica em cada pixel, realizando a operação ponto a ponto, independente da vizinhança. Utilizando a função matemática denominada transformação radiométrica pode–se fazer um realce de contraste. Esta função consiste no mapeamento das variações dentro do intervalo original de tons de cinza para outro intervalo desejado. É utilizada para aumentar o contraste de imagem, expandindo o intervalo original de níveis de cinza da imagem original.[69]

Outras utilizações

editar

Indústria

editar

Para oferecer suporte na indústria foram criadas sete ferramentas da qualidade, das quais o histograma faz parte e fornece ajuda na identificação, na observação, na análise, na verificação e na conclusão de um problema. Portanto o histograma é uma forma robusta para auxiliar vários setores, pois envolve a medição de dados em geral e demonstra tendências.[70]

O histograma permite a análise dos valores de um processo de produção. O histograma ilustra a distribuição de uma população por meio da qual pode–ser verificar visualmente se há algum problema na fabricação que está gerando mais gastos para a empresa.[71]

Finanças

editar

As empresas possuem um fluxo contínuo de valores em vários setores, como compra, pagamento, salários, entre outros. Especialmente sobre os salários em uma empresa, é possível verificar se há alguma tendência nos pagamentos ou desvio de valores a partir de um padrão estatístico de fluxo dos valores por meio de um histograma.[72]

A partir do fluxo contínuo dos pregões em uma bolsa de valores como o Índice de Bolsa de Valores de São Paulo (Ibovespa) é possível observar por meio do histograma de retorno os preços do mercado no decorrer dos dias. A partir da análise gráfica é possível observar chamadas fat tails (caudas pesadas), que possuem caudas mais pesadas que uma distribuição normal. Muitas pesquisas foram feitas no setor para descrever o comportamento dos retornos nas bolsas de valores.[73]

Medicina

editar

É comum a utilização de histogramas na medicina para analisar dados contínuos de pacientes como peso, respiração e dados contínuos de uma população como o grupo de grávidas, obesos, infectados pelo HIV, entre outros. Por exemplo, as intervenções medicas em uma população podem ocorrer após a análise de uma tendência em um histograma.[74]

Ver também

editar

Referências

  1. Zvirtes, Leandro. «Ferramentas da Qualidade» (PDF). p. 2. Consultado em 16 de janeiro de 2017  Texto "publicad" ignorado (ajuda)
  2. FREUND, John E (2004). Estatística Aplicada Economicamente 11 ed. Porto Alegre: Bookman. p. 42. 536 páginas. ISBN 0130467170. Consultado em 12 de outubro de 2014 
  3. «1.6 - Histograma - Estatística Básica | Portal Action». www.portalaction.com.br. Consultado em 2 de dezembro de 2016 
  4. Magalhães, Juliano M. de. «AS 7 FERRAMENTAS DA QUALIDADE» (PDF). Sistema Estadual de Bibliotecas Publicas de São Paulo. p. 2. Consultado em 16 de janeiro de 2017 
  5. Tague, Nancy R. (2005). The Quality Toolbox, Second Edition. [S.l.: s.n.] 15 páginas. ISBN 978-0-87389-639-9 
  6. Zvirtes, Leandro. «Ferramentas da Qualidade» (PDF). Universidade do Estado de Santa Catarina. p. 17. Consultado em 16 de janeiro de 2017 
  7. Riaño Rufilanchas, Daniel (2017). «On the origin of Karl Pearson's term "histogram"» (PDF). Revista Estadística Española. 192: 29-35. ISSN 2254-9390 
  8. a b c Poosala, V (1996). Estimation of Query-Result Distribution and its Application in Parallel-Join Load Balancing. [S.l.]: VLDB. pp. 448–459 
  9. «Exercícios Resolvidos sobre Parâmetros e tabelas de frequência» (PDF). p. 11. Consultado em 11 de janeiro de 2017 
  10. Tufte, E (1983). The Visual Display of Quantitative Infor- mation. [S.l.]: Graphics Press 
  11. Ioannidis, Yannis. «The History of Histograms» (PDF). Management of Data, Information & Knowledge. p. 1. Consultado em 24 de janeiro de 2017 
  12. «Engenharia da Qualidade Integrada – Estatística em Gestão». Universidade Nova de Julho (Uninove). Consultado em 24 de janeiro de 2017 
  13. a b «Gráficos Diferentes Contam Histórias Diferentes». Manual de Jornalismo de Dados. Consultado em 24 de janeiro de 2017 
  14. Pimentel Filho, José Ernesto; Cavalcanti, Carlos André Macêdo (2007). «Estatística e Nascimento do Controle Criminal do Alvorecer da França Contemporânea\». Projeto História (34): 211 – 226. Consultado em 24 de janeiro de 2017 
  15. «Gráficos Descritivos» (PDF). Universidade Federal do Paraná. p. 49. Consultado em 16 de janeiro de 2017 
  16. Charles Stangor (2011) "Research Methods For The Behavioral Sciences". Wadsworth, Cengage Learning. ISBN 9780840031976.
  17. Martins, André. «Estatística Descritiva: Tabelas e Gráficos» (PDF). Escola de Artes, Ciências e Humanidades da Universidade de São Paulo. p. 25. Consultado em 16 de janeiro de 2017 
  18. «Página Dinâmica para Aprendizado do Sensoriamento Remoto». Universidade Federal do Rio Grande do Sul. p. Única. Consultado em 16 de janeiro de 2017 
  19. Freedman, D. Pisani, R. and Purves, R. 1998. Statistics (Third edition). W.W.Norton
  20. Artes, Rinaldo. «Determinação de medidas de posição a partir de dados agrupados» (PDF). Insper. p. 5. Consultado em 16 de janeiro de 2017 
  21. Ponti Jr, Moacir (2013). «Realce de imagens parte 1: operações pontuais» (PDF). Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo. p. 7. Consultado em 16 de janeiro de 2016 
  22. WANDERLEY, MARIA FERNANDA BARBOSA (Dezembro de 2013). «Estudos em Estimação de Densidade por Kernel: Métodos de Seleção de Características e Estimação do Parâmetro Suavizador» (PDF). Programa de Pós-Graduação em Engenharia Elétrica da Universidade Federal de Minas Gerais. p. 27. Consultado em 16 de janeiro de 2017 
  23. David W. Scott (Dezembro de 2009). «Averaged shifted histogram». Wiley Interdisciplinary Reviews: Computational Statistics. 2:2: 160–164. doi:10.1002/wics.54 
  24. a b National Institute of Standards and Technology / "Histogram 1.3.3.14 ", e-book web
  25. Farias, Ana Maria Lima de. «Métodos Estatísticos Aplicados à Economia II» (PDF). Universidade Federal Fluminense. p. 5. Consultado em 17 de janeiro de 2017 
  26. Meyer, Paul L. (2003). Probabilidade - Aplicações à Estatística. Rio de Janeiro: LTC. 86 páginas 
  27. a b c Scott, David W. (1992). Multivariate Density Estimation: Theory, Practice, and Visualization. New York: John Wiley 
  28. a b STURGES, Herbert A (março de 1926). «The Choice of a Class Interval» (PDF). Journal of the American Statistical Association (em inglês). 21 (153): 65-66. Consultado em 12 de outubro de 2014 
  29. «Histogramas e curvas de distribuição» (PDF). Departamento de Física da FCTUC. Universidade de Coimbra. p. 63. Consultado em 17 de janeiro de 2017 
  30. e.g. § 5.6 "Density Estimation", W. N. Venables and B. D. Ripley, Modern Applied Statistics with S (2002), Springer, 4th edition. ISBN 0-387-95457-0.
  31. a b c Costa, Fabrício Martins (2011). Estatística. Belém - Pará: Universidade do Estado do Pará. 27 páginas. ISBN 978-85-88375-63-5 
  32. EXCEL 2007: Histogram
  33. Online Statistics Education: A Multimedia Course of Study (http://onlinestatbook.com/). Project Leader: David M. Lane, Rice University (chapter 2 "Graphing Distributions", section "Histograms")
  34. Doane DP (1976) Aesthetic frequency classification. American Statistician, 30: 181–183
  35. Scott, David W. (14 de março de 2015). «Scott's Rule». ResearchGate. p. 1. Consultado em 17 de janeiro de 2017 
  36. Scott, David W. (1979). «On optimal and data-based histograms». Biometrika. 66 (3): 605–610. doi:10.1093/biomet/66.3.605 
  37. a b «Cópia arquivada». Consultado em 30 de janeiro de 2017. Arquivado do original em 19 de junho de 2015 
  38. Freedman, David; Diaconis, P. (1981). «On the histogram as a density estimator: L2 theory». Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete. 57 (4): 453–476. doi:10.1007/BF01025868 
  39. Shigeru, Hideaki (2007). «A Method for Selecting the Bin Size of a Time Histogram». Massachusetts Institute of Technology. p. 1508. Consultado em 17 de janeiro de 2017 
  40. Shimazaki, H. (2007). «A method for selecting the bin size of a time histogram». Neural Computation. 19 (6): 1503–1527. PMID 17444758. doi:10.1162/neco.2007.19.6.1503 
  41. «Capítulo III Interpretação gráfica de dados» (PDF). Universidade Federal do Pará. p. 26. Consultado em 16 de janeiro de 2017 
  42. WAND, M. P (1997). «Data-Based Choice of Histogram Bin Width». The American Statistician (em inglês). 51: 59-64. doi:10.1080/00031305.1997.10473591 
  43. Martins, André. «Estatística Descritiva: Tabelas e Gráficos» (PDF). Escola de Artes, Ciência e Humanidades da Universidade de São Paulo. p. 54. Consultado em 16 de janeiro de 2017 
  44. STURGES, Herbert A (março de 1926). «The Choice of a Class Interval» (PDF). Journal of the American Statistical Association (em inglês). 21 (153): 65-66. Consultado em 12 de outubro de 2014 
  45. Massad, Eduardo; Sameshima, Koichi; Silveira, Paulo Sérgio Panse (31 de julho de 2001). «Probabilidade: Conceitos e Leis». Faculdade de Medicina da Universidade de São Paulo. p. Única. Consultado em 16 de janeiro de 2017 
  46. Zvirtes, Leandro. «Ferramentas da Qualidade» (PDF). Universidade Estadual de Santa Catarina. p. 9. Consultado em 16 de janeiro de 2017 
  47. Muller, Márcia; José Luís, Fabris. «Fundamentos da Física Experimental» (PDF). Universidade Tecnológica do Paraná. p. 1. Consultado em 16 de janeiro de 2017 
  48. a b c US 2000 census.
  49. US 2000 census.
  50. «Histograms». Laerd Statistics. Consultado em 24 de janeiro de 2017 
  51. «Understanding Histograms and Their Uses». Bright Hub Project Management. 24 de janeiro de 2017 
  52. Medeiros, Luiz. «DISTRIBUIÇÃO DE FREQUÊNCIA» (PDF). Universidade Federal da Paraíba. p. 2. Consultado em 26 de janeiro de 2017 
  53. «Estatísticas do eleitorado – Evolução do eleitorado». Tribunal Superior Eleitoral. 26 de janeiro de 2017. Consultado em 26 de janeiro de 2017 
  54. Caetano, Marco Antonio Leonel. «ESTATÍSTICA» (PDF). Insper. Consultado em 26 de janeiro de 2017 
  55. «HISTOGRAMA». Portal Action. p. Única. Consultado em 16 de janeiro de 2017 
  56. «HISTOGRAMA». Portal Action. p. Única. Consultado em 16 de janeiro de 2017 
  57. Montenegro, Anselmo. «Geometria Computacional» (PDF). Universidade federal Fluminense. p. 5. Consultado em 26 de janeiro de 2017 
  58. Ferreira, José. «Polígono de frequência» (PDF). www.joseferreira.com.br/blogs. p. única. Consultado em 16 de janeiro de 2017 
  59. Artes, Rinaldo. «Coeficiente de Assimetria» (PDF). Insper. p. 1 - 4. Consultado em 16 de janeiro de 2017 
  60. Alves, Marcelo Corrêa (2016). «Proc Univariate:Testando a normalidade» (PDF). Escola Superior de Agricultura da Universidade de São Paulo. p. 9. Consultado em 16 de janeiro de 2017 
  61. Artes, Rinaldo. «Coeficiente de Assimetria» (PDF). Insper. p. 1. Consultado em 26 de janeiro de 2017 
  62. a b Artes, Rinaldo. «Coeficiente de Assimetria» (PDF). Insper. Consultado em 26 de janeiro de 2017 
  63. Esquef, Israel Andrade; Albuquerque, M ́arcio Portes de; Albuquerque, Marcelo Portes de (18 de fevereiro de 2003). «Processamento Digital de Imagens» (PDF). Centro Brasileiro de Pesquisa Física. p. 6. Consultado em 26 de janeiro de 2017 
  64. Maurício, Plínio (2016). Administração Geral Para Concursos. [S.l.]: Clube de Autores. p. 24 
  65. «AULA 16 - Processamento de Imagens» (PDF). Instituto de Pesquisa Espaciais. p. 14. Consultado em 16 de janeiro de 2017 
  66. Conci, Aura (2015). «Aula 2 – importância do histograma em Analise de Imagens» (PDF). Universidade Federal Fluminense. 6 páginas. Consultado em 24 de janeiro de 2017 
  67. a b Hadjidemetriou, E.; Grossberg, M. D.; Nayar, S. K. «Multiresolution Histograms and their Use for Texture Classification» (PDF). Computer Science, Columbia University, New York. p. 1. Consultado em 24 de janeiro de 2017 
  68. Conci, Aura (2015). «Aula 2 – importância do histograma em Analise de Imagens» (PDF). Universidade Federal Fluminense. p. 12. Consultado em 24 de janeiro de 2017 
  69. JÄHNE, B. Digital Image Processing. Springer-Verlag, 2002. ACHARYA, T., RAY, A. K. Image Processing- Principles and Applications. John Wiley & Sons, Inc. 2005. GONZALEZ, R., WOODS, P. Digital Image Processing. Prentice Hall, 2002, 2nd ed. RENCZ, A. N., RYERSON. R. A. (Eds.) Manual of Remote Sensing, Remote Sensing for the Earth Sciences. John Wiley & Sons, Inc. 1999, 3rd ed.
  70. Maia, Denise Ferreira (2008). «FERRAMENTAS DE GESTÃO DA QUALIDADE APLICADAS A PROCESSO DE PRODUÇÃO: O caso da empresa Fitatex» (PDF). PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS. p. 32. Consultado em 24 de janeiro de 2017 
  71. Trivellato, Arthur Antunes (2010). «Aplicação das Sete Ferramentas Básicas da Qualidade no Ciclo PPDCA para Melhoria Contínua: Estudo de Caso Numa Empresa de Autopeça» (PDF). p. 39. Consultado em 24 de janeiro de 2017 
  72. Farias, Ana Maria Lima de. «Métodos Estatísticos Aplicados I» (PDF). Universidade Federal Fluminense. p. 16. Consultado em 24 de janeiro de 2017 
  73. «Análise Estatística de Dados Financeiros» (PDF). PUC-RIO. p. 23. Consultado em 24 de janeiro de 2017 
  74. Velarde, Luis Guillermo Coca. «Noções de Bioestatística» (PDF). Universidade Federal Fluminense. p. 21 - 22. Consultado em 24 de janeiro de 2017 

Ligações externas

editar