Notas operacionais
Planejamento de capacidade: como dimensionar a operação à demanda.
Equipe enxuta demais e o nível de serviço desaba. Rica demais e você queima orçamento em horas ociosas. O planejamento de capacidade é como você acha a linha, e a sustenta conforme a demanda se move.
10 min de leitura · Por Everton Paula · Read in English →
A maioria das decisões de dimensionamento em uma empresa em crescimento é tomada no feeling. A fila está feia, então um gestor pede mais três pessoas. O orçamento está apertado, então o financeiro congela uma reposição. Nenhuma das decisões está errada de propósito, e as duas são chute, porque ninguém conectou o número de pessoas à quantidade de trabalho de um jeito que você consiga defender.
O planejamento de capacidade é essa conexão. Pega quanto trabalho está chegando, quanto tempo cada peça leva, e quanto do tempo pago de uma pessoa está de fato disponível, e os transforma em um número de pessoas. Bem feito, encerra a discussão mensal sobre headcount, porque o nível de equipe deixa de ser opinião e vira um cálculo que todo mundo enxerga.
O que é planejamento de capacidade
Planejamento de capacidade é casar a equipe com a demanda prevista para que a operação atinja seu nível de serviço sem pagar por gente ociosa. Vale em qualquer lugar onde o trabalho chega e pessoas o processam: uma fila de atendimento, um centro de distribuição, um time de sinistros, uma mesa de moderação, um piso de despacho de entregadores. O vocabulário muda por função, a matemática não.
Um plano de capacidade precisa de quatro insumos, e a qualidade do plano é limitada pelo mais fraco deles.
- Previsão de demanda. Quanto trabalho está chegando, por período. Contatos por semana, pedidos por dia, sinistros por turno. É o insumo que a maioria dos times erra, em geral planejando para a média em vez do pico.
- Tempo de atendimento. Quanto leva uma unidade de trabalho, em média. A média esconde muita coisa, mas é o ponto de partida.
- Tempo disponível por pessoa. As horas que uma pessoa consegue de fato gastar no trabalho principal, depois de tudo o mais que o dia pago contém.
- Nível de serviço alvo. O padrão que você está dimensionando para sustentar. Atender 80% dos contatos em 30 segundos, despachar 99% dos pedidos no mesmo dia. Sem um alvo, não há resposta certa para quantas pessoas você precisa.
O cálculo central
A base de todo modelo de capacidade é a mesma. Trabalho total é igual a demanda vezes tempo de atendimento. Pessoas necessárias é igual a trabalho total dividido pelo tempo disponível por pessoa. Tudo o mais é refinamento por cima dessas duas linhas.
Um exemplo prático. Um time de atendimento recebe 10.000 contatos por semana, e o tempo médio de atendimento é de 8 minutos. São 80.000 minutos de trabalho, ou cerca de 1.333 horas por semana. Se um agente é pago por 40 horas semanais, é tentador dividir 1.333 por 40 e concluir que você precisa de 33 agentes. Esse número está errado, e a operação que se dimensiona por ele vai furar o nível de serviço toda semana. O motivo é o shrinkage.
Shrinkage: o insumo que quebra a maioria dos planos
Shrinkage é a diferença entre as horas pelas quais a pessoa é paga e as horas em que ela está disponível para o trabalho principal. Pausas, reuniões de time, treinamento, 1-a-1s, queda de sistema, tarefas administrativas e ausências vivem todas nessa diferença. Na maioria das operações o shrinkage fica entre 25% e 35%, e é o motivo único mais comum de um plano de capacidade subdimensionar.
De volta ao exemplo. Se o shrinkage é de 30%, um agente pago por 40 horas está disponível por 28. Agora a conta é 1.333 horas de trabalho divididas por 28 horas produtivas, que dá cerca de 48 agentes, não 33. A diferença de 15 agentes entre o número ingênuo e o real é a diferença entre sustentar o nível de serviço e se afogar nele. Um plano que ignora o shrinkage não é um plano conservador, é um plano errado.
Dimensionar call center tem mais um detalhe
Para trabalho que entra em fila em tempo real, como ligações e chats ao vivo, você não pode simplesmente dividir trabalho por horas disponíveis, porque os contatos não chegam em um fluxo arrumado. Eles se agrupam, e enquanto agentes atendem um contato, outros esperam. Para sustentar um tempo de atendimento alvo, uma operação de interação precisa dimensionar acima do número bruto de carga, deixando folga deliberada para a fila não acumular durante os agrupamentos.
É isso que um modelo de Erlang captura, e é por isso que existem ferramentas de dimensionamento de call center. A lição prática sem a matemática: quanto mais alto o seu nível de serviço alvo, mais folga você precisa dimensionar, e a relação não é linear. Sair de atender 70% das ligações em 30 segundos para 90% custa muito mais do que a diferença de 20 pontos sugere. Essa curva é uma conversa de orçamento que vale ter antes de prometer um nível de serviço.
Do cálculo ao modelo de dimensionamento
Um único número não é um modelo de dimensionamento. Um modelo de dimensionamento é o cálculo rodado entre períodos, para que você enxergue onde a demanda tem pico, onde o plano está curto, e onde você está carregando folga. É o que transforma planejamento de capacidade em planejamento de headcount: a contratação que você aprova neste trimestre deveria sair da diferença que o modelo mostra entre demanda e capacidade atual ao longo dos próximos dois ou três trimestres, não de como a fila pareceu na semana passada.
Você consegue montar uma primeira versão em uma planilha, e deveria, porque montá-la te ensina quais insumos a sua operação não tem. Se quiser uma partida adiantada, a ferramenta grátis de previsão de equipe no Marketplace Ops Toolkit modela demanda, tempo de atendimento e shrinkage em um número de headcount no seu navegador, sem cadastro.
As três formas de dar errado
Planejar para a média. A demanda não é plana. Se você se dimensiona para a média semanal, fica superdimensionado nos vales e submerso nos picos, e os clientes só vivem os picos. Planeje para o formato da demanda, não para a média dela.
Esquecer o shrinkage. Coberto acima, e vale repetir porque é comum. Horas pagas não são horas produtivas. Subtraia a diferença antes de dividir.
Tratar como exercício único. Um plano de capacidade não é um documento, é um modelo que você roda de novo conforme demanda e tempo de atendimento se movem. O plano que você montou em janeiro está errado em março se ninguém atualizou a previsão. Ele pertence à cadência operacional, revisado mensalmente, não arquivado depois que o orçamento é fechado.
Por que isso é trabalho de operação
O planejamento de capacidade é onde boa parte da dor operacional é decidida em silêncio. Um time que está sempre atrasado muitas vezes não é um time com problema de performance, é um time que foi dimensionado para o número errado e está sendo cobrado a cobrir a diferença com esforço. Montar o modelo que acerta o número, e revisá-lo na cadência operacional conforme a demanda se move, é um dos sistemas que deixam uma empresa crescer sem a operação quebrar embaixo.
É esse o trabalho que a Plenor faz. Se a sua operação é dimensionada no feeling e você quer um operador externo para lê-la e ranquear o que corrigir primeiro, o Operating Teardown de uma semana e preço fixo é por onde começar. Se você precisa de alguém para conduzir a operação enquanto a constrói, isso é trabalho de COO fracionado.
Próxima nota.
Como instalar uma cadência operacional semanal em 30 dias
Onde o modelo de capacidade é revisado e reprojetado conforme a demanda se move. A semana de três reuniões e a instalação de 30 dias.
Como fazer uma análise de causa raiz
Quando um time está sempre atrasado, a capacidade costuma ser a causa raiz. Os métodos dos 5 Porquês e da espinha de peixe, com um exemplo prático.
