Problema de cobertura de conjuntos

O problema de cobertura de conjuntos é uma questão clássica em combinatória, ciência da computação, pesquisa operacional e teoria da complexidade computacional . É um dos 21 problemas NP-completos de Karp mostrado ser NP-completo em 1972.

É um problema "cujo estudo levou ao desenvolvimento de técnicas fundamentais para todo o campo" dos algoritmos de aproximação .[1]

Dado um conjunto universo e uma coleção de conjuntos cuja união é igual ao conjunto universo, o problema de cobertura de conjunto é identificar a menor sub-coleção de cuja união é igual ao conjunto universo. Por exemplo, considere o conjunto universo e a coleção de conjuntos . Claramente a união de é . No entanto, podemos cobrir todos os elementos com o mínimo número de conjuntos a seguir : .

Mais formalmente, dado um conjunto universo e uma família de subconjuntos de , uma capa é uma subfamília de conjuntos cuja união é . No conjunto que cumpre o problema de decisão, a entrada é um par e um inteiro  ; a questão é se há uma cobertura de conjuntos de tamanho ou menos. No conjunto que cumpre o problema de otimização, a entrada é um par , e a tarefa é encontrar uma cobertura de conjuntos que use o menor número de conjuntos.

A versão de decisão da cobertura do conjunto é NP-completa, e a versão de otimização / busca da cobertura do conjunto é NP-difícil . [2]

Se cada conjunto tiver um custo atribuído, ele se tornará um problema de cobertura de conjuntos ponderado .

Formulação do programa linear inteiro

editar

O problema de cobertura mínima de conjuntos pode ser formulado como a seguinte programação inteira (PI).[3]

minimizar   (minimizar o número de conjuntos)
sujeito a   para todos   (cubra todos os elementos do universo)
  para todos   . (cada conjunto está na capa ou não)

Essa PI pertence à classe mais geral de PIs para problemas de cobertura . A lacuna de integralidade deste PI é no máximo  , então seu relaxamento dá um fator   no algoritmo de aproximação para o problema de problema de cobertura mínima de conjuntos mínimo definida (onde   é o tamanho do universo).[4]

Na cobertura de conjuntos ponderados, os conjuntos recebem pesos. Denota o peso do conjunto   de   . Então, o programa linear inteiro que descreve a cobertura do conjunto ponderado é idêntico ao fornecido acima, exceto que a função objetivo para minimizar é   .

Formulação do conjunto de acerto

editar

A cobertura de conjuntos é equivalente ao problema do conjunto de acerto . Isso é visto ao observar que uma instância de cobertura de conjunto pode ser vista como um grafo bipartido arbitrário, com conjuntos representados por vértices à esquerda, o universo representado por vértices à direita e arestas representando a inclusão de elementos em conjuntos. A tarefa é então encontrar um subconjunto de cardinalidade mínima de vértices esquerdos que cubra todos os vértices direitos. No problema do conjunto de acertos, o objetivo é cobrir os vértices esquerdos usando um subconjunto mínimo dos vértices direitos. A conversão de um problema para o outro é, portanto, alcançada trocando os dois conjuntos de vértices.

Algoritmo guloso

editar

Existe um algoritmo guloso para aproximação de tempo polinomial de cobertura de conjunto que escolhe conjuntos de acordo com uma regra: em cada estágio, escolha o conjunto que contém o maior número de elementos descobertos. Pode ser provado [5] que este algoritmo atinge uma razão de aproximação de  , Onde   é o tamanho do conjunto a ser coberto. Em outras palavras, ele encontra uma cobertura que pode ser   vezes tão grande quanto o mínimo, onde   é o   -ésimo número harmônico :

 

Este algoritmo guloso realmente atinge uma proporção de aproximação de   Onde   é o conjunto de cardinalidade máxima de   . Para   instâncias densas, no entanto, existe um   - algoritmo de aproximação para cada   .[6]

 
Exemplo resumido para o algoritmo guloso com k = 3

Há um exemplo padrão no qual o algoritmo guloso atinge uma proporção de aproximação de   . O universo consiste em   elementos O sistema definido consiste em   conjuntos disjuntos em pares   com tamanhos   respectivamente, bem como dois conjuntos adicionais separados  , cada um dos quais contém metade dos elementos de cada   . Nesta entrada, o algoritmo guloso pega os conjuntos  , nessa ordem, enquanto a solução ótima consiste apenas em   e   . Um exemplo de uma entrada para   é ilustrado à direita.

Os resultados de incompatibilidade mostram que o algoritmo guloso é essencialmente o melhor algoritmo de aproximação de tempo polinomial possível para definir cobertura até termos de ordem inferior (consulte Resultados de incompatibilidade abaixo), sob suposições de complexidade plausíveis. Uma análise mais rigorosa do algoritmo guloso mostra que a razão de aproximação é exatamente   .[7]

Sistemas de baixa frequência

editar

Se cada elemento ocorre em no máximo f conjuntos, então uma solução pode ser encontrada no tempo polinomial que aproxima o ótimo dentro de um fator de f usando relaxação LP .

Se a restrição   é substituído por   para todos S em   no programa linear inteiro mostrado acima, então ele se torna um programa linear L (não inteiro). O algoritmo pode ser descrito da seguinte maneira:

  1. Encontre uma solução ótima O para o programa L usando algum método de tempo polinomial para resolver programas lineares.
  2. Escolha todos os conjuntos S para os quais a variável correspondente x S tem valor pelo menos 1 / f na solução O [4]

Resultados de inadequação

editar

Quando   refere-se ao tamanho do universo, Lund & Yannakakis (1994) mostraram que a cobertura do conjunto não pode ser aproximada em tempo polinomial dentro de um fator de  , a menos que NP tenha algoritmos de tempo quase polinomial . Feige (1998) melhorou este limite inferior para   sob as mesmas suposições, o que essencialmente corresponde à razão de aproximação alcançada pelo algoritmo guloso. Raz & Safra (1997) estabeleceram um limite inferior de  , Onde   é uma certa constante, sob a suposição mais fraca de que P   NP . Um resultado semelhante com um valor mais alto de   foi recentemente comprovado por Alon, Moshkovitz & Safra (2006) . Dinur & Steurer (2013) mostraram inadequação ideal, provando que não pode ser aproximado de   a menos que P   NP .

Cobertura de conjuntos ponderada

editar

Relaxando o programa linear inteiro para cobertura de conjunto ponderado declarado acima, pode-se usar o arredondamento aleatório para obter um   - aproximação de fator. A análise correspondente para cobertura de conjunto não ponderada é delineada em Arredondamento aleatório # Algoritmo de arredondamento aleatório para cobertura de conjunto e pode ser adaptada ao caso ponderado.[4]

Problemas relacionados

editar
  • Conjunto de acerto é uma reformulação equivalente do Set Cover.
  • A cobertura do vértice é um caso especial de conjunto de acerto.
  • A cobertura de arestas é um caso especial de capa de conjunto.
  • A cobertura geométrica do conjunto é um caso especial de cobertura do conjunto quando o universo é um conjunto de pontos em   e os conjuntos são induzidos pela interseção do universo e formas geométricas (por exemplo, discos, retângulos).
  • Definir embalagem
  • O problema de cobertura máxima é escolher no máximo k conjuntos para cobrir o máximo de elementos possível.
  • Conjunto dominante é o problema de selecionar um conjunto de vértices (o conjunto dominante) em um gráfico de forma que todos os outros vértices sejam adjacentes a pelo menos um vértice no conjunto dominante. O problema do conjunto dominante foi mostrado como NP completo por meio de uma redução da cobertura do conjunto.
  • O problema exato da cobertura é escolher uma cobertura de conjunto sem nenhum elemento incluído em mais de um conjunto de cobertura.

Referências

  1. Vazirani (2001, p. 15)
  2. Korte & Vygen 2012, p. 414.
  3. Vazirani (2001, p. 108)
  4. a b c Vazirani (2001)
  5. Chvatal, V. A Greedy Heuristic for the Set-Covering Problem. Mathematics of Operations Research Vol. 4, No. 3 (Aug., 1979), pp. 233-235
  6. Karpinski & Zelikovsky 1998
  7. Slavík Petr A tight analysis of the greedy algorithm for set cover. STOC'96, Pages 435-441, doi:10.1145/237814.237991

Referências

Ligações externas

editar