Notas operacionais

Planejamento de capacidade: como dimensionar a operação à demanda.

Equipe enxuta demais e o nível de serviço desaba. Rica demais e você queima orçamento em horas ociosas. O planejamento de capacidade é como você acha a linha, e a sustenta conforme a demanda se move.

10 min de leitura  ·  Por Everton Paula  ·  Read in English →

A maioria das decisões de dimensionamento em uma empresa em crescimento é tomada no feeling. A fila está feia, então um gestor pede mais três pessoas. O orçamento está apertado, então o financeiro congela uma reposição. Nenhuma das decisões está errada de propósito, e as duas são chute, porque ninguém conectou o número de pessoas à quantidade de trabalho de um jeito que você consiga defender.

O planejamento de capacidade é essa conexão. Pega quanto trabalho está chegando, quanto tempo cada peça leva, e quanto do tempo pago de uma pessoa está de fato disponível, e os transforma em um número de pessoas. Bem feito, encerra a discussão mensal sobre headcount, porque o nível de equipe deixa de ser opinião e vira um cálculo que todo mundo enxerga.

O que é planejamento de capacidade

Planejamento de capacidade é casar a equipe com a demanda prevista para que a operação atinja seu nível de serviço sem pagar por gente ociosa. Vale em qualquer lugar onde o trabalho chega e pessoas o processam: uma fila de atendimento, um centro de distribuição, um time de sinistros, uma mesa de moderação, um piso de despacho de entregadores. O vocabulário muda por função, a matemática não.

Um plano de capacidade precisa de quatro insumos, e a qualidade do plano é limitada pelo mais fraco deles.

  • Previsão de demanda. Quanto trabalho está chegando, por período. Contatos por semana, pedidos por dia, sinistros por turno. É o insumo que a maioria dos times erra, em geral planejando para a média em vez do pico.
  • Tempo de atendimento. Quanto leva uma unidade de trabalho, em média. A média esconde muita coisa, mas é o ponto de partida.
  • Tempo disponível por pessoa. As horas que uma pessoa consegue de fato gastar no trabalho principal, depois de tudo o mais que o dia pago contém.
  • Nível de serviço alvo. O padrão que você está dimensionando para sustentar. Atender 80% dos contatos em 30 segundos, despachar 99% dos pedidos no mesmo dia. Sem um alvo, não há resposta certa para quantas pessoas você precisa.

O cálculo central

A base de todo modelo de capacidade é a mesma. Trabalho total é igual a demanda vezes tempo de atendimento. Pessoas necessárias é igual a trabalho total dividido pelo tempo disponível por pessoa. Tudo o mais é refinamento por cima dessas duas linhas.

Um exemplo prático. Um time de atendimento recebe 10.000 contatos por semana, e o tempo médio de atendimento é de 8 minutos. São 80.000 minutos de trabalho, ou cerca de 1.333 horas por semana. Se um agente é pago por 40 horas semanais, é tentador dividir 1.333 por 40 e concluir que você precisa de 33 agentes. Esse número está errado, e a operação que se dimensiona por ele vai furar o nível de serviço toda semana. O motivo é o shrinkage.

Shrinkage: o insumo que quebra a maioria dos planos

Shrinkage é a diferença entre as horas pelas quais a pessoa é paga e as horas em que ela está disponível para o trabalho principal. Pausas, reuniões de time, treinamento, 1-a-1s, queda de sistema, tarefas administrativas e ausências vivem todas nessa diferença. Na maioria das operações o shrinkage fica entre 25% e 35%, e é o motivo único mais comum de um plano de capacidade subdimensionar.

De volta ao exemplo. Se o shrinkage é de 30%, um agente pago por 40 horas está disponível por 28. Agora a conta é 1.333 horas de trabalho divididas por 28 horas produtivas, que dá cerca de 48 agentes, não 33. A diferença de 15 agentes entre o número ingênuo e o real é a diferença entre sustentar o nível de serviço e se afogar nele. Um plano que ignora o shrinkage não é um plano conservador, é um plano errado.

Dimensionar call center tem mais um detalhe

Para trabalho que entra em fila em tempo real, como ligações e chats ao vivo, você não pode simplesmente dividir trabalho por horas disponíveis, porque os contatos não chegam em um fluxo arrumado. Eles se agrupam, e enquanto agentes atendem um contato, outros esperam. Para sustentar um tempo de atendimento alvo, uma operação de interação precisa dimensionar acima do número bruto de carga, deixando folga deliberada para a fila não acumular durante os agrupamentos.

É isso que um modelo de Erlang captura, e é por isso que existem ferramentas de dimensionamento de call center. A lição prática sem a matemática: quanto mais alto o seu nível de serviço alvo, mais folga você precisa dimensionar, e a relação não é linear. Sair de atender 70% das ligações em 30 segundos para 90% custa muito mais do que a diferença de 20 pontos sugere. Essa curva é uma conversa de orçamento que vale ter antes de prometer um nível de serviço.

Do cálculo ao modelo de dimensionamento

Um único número não é um modelo de dimensionamento. Um modelo de dimensionamento é o cálculo rodado entre períodos, para que você enxergue onde a demanda tem pico, onde o plano está curto, e onde você está carregando folga. É o que transforma planejamento de capacidade em planejamento de headcount: a contratação que você aprova neste trimestre deveria sair da diferença que o modelo mostra entre demanda e capacidade atual ao longo dos próximos dois ou três trimestres, não de como a fila pareceu na semana passada.

Você consegue montar uma primeira versão em uma planilha, e deveria, porque montá-la te ensina quais insumos a sua operação não tem. Se quiser uma partida adiantada, a ferramenta grátis de previsão de equipe no Marketplace Ops Toolkit modela demanda, tempo de atendimento e shrinkage em um número de headcount no seu navegador, sem cadastro.

A ferramenta de previsão de equipe no Marketplace Ops Toolkit: tipos de caso com volume diário e tempo médio de atendimento, parâmetros operacionais incluindo horas produtivas por agente e shrinkage, e um resultado de headcount necessário.
A ferramenta grátis de previsão de equipe: informe volume, tempo de atendimento e shrinkage, e ela retorna o headcount necessário. Abrir a ferramenta →

As três formas de dar errado

Planejar para a média. A demanda não é plana. Se você se dimensiona para a média semanal, fica superdimensionado nos vales e submerso nos picos, e os clientes só vivem os picos. Planeje para o formato da demanda, não para a média dela.

Esquecer o shrinkage. Coberto acima, e vale repetir porque é comum. Horas pagas não são horas produtivas. Subtraia a diferença antes de dividir.

Tratar como exercício único. Um plano de capacidade não é um documento, é um modelo que você roda de novo conforme demanda e tempo de atendimento se movem. O plano que você montou em janeiro está errado em março se ninguém atualizou a previsão. Ele pertence à cadência operacional, revisado mensalmente, não arquivado depois que o orçamento é fechado.

Por que isso é trabalho de operação

O planejamento de capacidade é onde boa parte da dor operacional é decidida em silêncio. Um time que está sempre atrasado muitas vezes não é um time com problema de performance, é um time que foi dimensionado para o número errado e está sendo cobrado a cobrir a diferença com esforço. Montar o modelo que acerta o número, e revisá-lo na cadência operacional conforme a demanda se move, é um dos sistemas que deixam uma empresa crescer sem a operação quebrar embaixo.

É esse o trabalho que a Plenor faz. Se a sua operação é dimensionada no feeling e você quer um operador externo para lê-la e ranquear o que corrigir primeiro, o Operating Teardown de uma semana e preço fixo é por onde começar. Se você precisa de alguém para conduzir a operação enquanto a constrói, isso é trabalho de COO fracionado.

Da leitura à operação

Dimensionado no feeling em vez do modelo?

Uma semana, preço fixo, um teardown escrito que lê a sua operação e ranqueia o que corrigir primeiro, capacidade incluída.

Entre em contato