Índice de bitmap x índice de árvore B: Qual e quando usar?

Por Vivek Sharma,
Postado em Dezembro 2014

Entender bem como usar cada índice pode ter grande influência no desempenho. É comum pensar que os índices de bitmap são os mais adequados para culunas que podem conter poucos valores diferentes, como GENDER [gênero], MARITAL_STATUS [estado civil] e RELATION [relação]. Porém, essa premissa não totalmente exata. Na verdade, sempre é recomendável usar índices de bitmap para sistemas em que os dados não são frequentemente atualizados por muitos sistemas simultâneos. De fato, como demonstrarei aqui, usar um índice de bitmap associado a uma culuna com 100% de valores únicos (que poderiam ser usados como chave principal) é um recurso tão eficiente quanto usar um índice de árvore B. Neste artigo, vou oferecer alguns exemplos, bem como decisões do otimizador, comuns a ambos os tipos de índices, quer que estes sejam aplicados a culunas de baixa cardinalidade ou a culunas de alta cardinalidade. Esses exemplos irão ajudar os gerentes de bases de dados a entenderem que o uso dos índices de bitmap não dependem, na verdade, da cardinalidade, mas do aplicativo.

Comparação dos índices Usar um índice de bitmap associado a uma culuna única traz várias desvantagens, entre elas, a necessidade de espaço suficiente (e o Oracle não indica esse uso). Mesmo assim, o tamanho do índice de bitmap depende da cardinalidade da culuna em relação à qual é criado bem como da distribuição dos dados. Por conseguinte, um índice de bitmap para a culuna GENDER será menor que um índice de árvore B para a mesma culuna. Por sua vez, um índice de bitmap para EMPNO [N° de funcionário] (que poderia ser usado como chave principal) será muito maior do que um índice de árvore B para essa culuna. Mas como os usuários que acessam sistemas de apoio para a tomada de decisões (DSS) são menos do que os que acessariam sistemas de processamento de transações (ulTP), os recursos não são um problema para estes aplicativos. Para ilustrar o anterior, criei duas tabelas TEST_NORMAL [teste normal] e TEST_RANDOM [teste aleatório]. Inseri um milhão de linhas na tabela TEST_NORMAL com um bloco PL/SQL e, a seguir, inseri as linhas que seguem na tabela TEST_RANDOM em ordem aleatória:

BITMAP		EMPNO	ÁRVORE B
*Consistent reads*	*Physical reads*	EMPNO	*Consistent reads*	*Physical reads*
5	0	1000	5	0
5	2	2398	5	2
5	2	8545	5	2
5	2	98008	5	2
5	2	85342	5	2
5	2	128444	5	2
5	2	858	5	2

BITMAP		EMPNO (intervalo)	ÁRVORE B
*Consistent reads*	*Physical reads*	EMPNO (intervalo)	*Consistent reads*	*Physical reads*
331	0	1-2300	329	0
285	0	8-1980	283	0
346	19	1850-4250	344	16
427	31	28888-31850	424	28
371	27	82900-85478	367	23
2157	149	984888-1000000	2139	35

BITMAP		SAL (igualdade)	ÁRVORE B		Linhas obtidas
*Consistent reads*	*Physical reads*	SAL (igualdade)	*Consistent reads*	*Physical reads*	Linhas obtidas
165	0	1869	177	164
169	163	3548	181	167
174	166	6500	187	172
75	69	7000	81	73
177	163	2500	190	175

BITMAP		SAL (intervalo)	ÁRVORE B		Linhas obtidas
*Consistent reads*	*Physical reads*	SAL (intervalo)	*Consistent reads*	*Physical reads*	Linhas obtidas
11778	5850	1500-2000	11778	3891	83743
11765	5468	2000-2500	11765	3879	83328
11753	5471	2500-3000	11753	3884	83318
17309	5472	3000-4000	17309	3892	166999
39398	5454	4000-7000	39398	3973	500520

BITMAP		EMPNO (intervalo)	ÁRVORE B
*Consistent reads*	*Physical reads*	EMPNO (intervalo)	*Consistent reads*	*Physical reads*
2463	1200	1-2300	6415	4910
2114	31	8-1980	6389	4910
2572	1135	1850-4250	6418	4909
3173	1620	28888-31850	6456	4909
2762	1358	82900-85478	6431	4909
7254	3329	984888-1000000	7254	4909