Última atualização: 1 de setembro de 2025
Obter ótimos resultados geralmente se resume a escolher as configurações corretas do motor. Use esta lista de verificação ao configurar um assistente:
1. Escolha um Modo
| Modo | Por que escolhê-lo? | Observações |
|---|
| Dualplex (Beta) | Troca de turnos rápida + vozes premium/clonadas | Padrão recomendado. Combine com Gemini Flash 2.0/2.5 ou GPT‑5 Realtime. |
| Speech-to-Speech (Multimodal) | Troca de turnos mais rápida e fluxo mais natural | Modelo recomendado: GPT‑5 Realtime. |
| Pipeline | Controle máximo sobre voz e respostas longas | Modelo recomendado: GPT‑5 Mini. Se você selecionar Pipeline, continue para a etapa Transcritor abaixo. |
Quer saber mais sobre as diferenças entre os modos? Leia o guia Modos do assistente.
Experimente os três modos: grave o mesmo cenário em cada um e compare o tempo de resposta e a satisfação do chamador.
2. Escolha um Transcritor (apenas Pipeline)
| Transcritor | Precisão | Latência | Melhor para |
|---|
| Azure | ⭐⭐⭐⭐ | ⏱️⏱️⏱️ (mais lento) | Quando você precisa da mais alta fidelidade de transcrição. |
| Gladia | ⭐⭐⭐ | ⏱️ (mais rápido) | Boa opção completa para a maioria dos idiomas. |
| Deepgram | ⭐⭐⭐ | ⏱️ (mais rápido) | Outra escolha sólida—teste qual tem melhor desempenho para seu idioma e configuração de áudio. |
Dica: Diferentes idiomas, sotaques ou ruídos de fundo podem afetar cada motor de forma diferente. Execute um teste A/B rápido e mantenha o melhor desempenho.
3. Selecione um Modelo LLM
| Modelo | Pontos fortes | Compensações |
|---|
| GPT-5 Mini | Raciocínio equilibrado com baixa latência | Pode ser mais lento que os modelos em tempo real para trocas rápidas de turnos. |
| GPT-5 Realtime | Projetado para trocas de voz de latência ultra baixa | Melhor para Speech-to-Speech e Dualplex. |
| GPT-4o | Raciocínio forte e compreensão multimodal | Latência mais alta. |
| Gemini Flash 2.0 / 2.5 | Ultra-rápido para trocas de voz em Dualplex/Multimodal | Excelente para minimizar a latência percebida. |
Se a velocidade é crítica, use GPT‑5 Realtime (ótimo para Speech-to-Speech) ou Gemini Flash 2.0/2.5 (ótimo com Dualplex). Para raciocínio mais rico, use GPT-4o ou GPT-5 Mini e compense a latência usando áudios de preenchimento.
4. Cancelamento de Ruído
Se os chamadores estiverem em viva-voz ou em um ambiente silencioso, mantenha o cancelamento de ruído ATIVADO. Se o volume de chamadas for baixo ou algumas palavras estiverem “cortadas”, DESATIVE para que o transcritor receba a forma de onda completa.
Se seu assistente não está ouvindo você bem, você pode tentar desativar o cancelamento de ruído.
5. Temporizadores de Conversação
| Parâmetro | Recomendado | Por quê |
|---|
| Reengajamento | ≈ 30 s | Dá aos chamadores tempo suficiente para pensar. Valores mais baixos podem parecer agressivos. |
| Duração máxima de silêncio | ≈ 60 s | Evita desligamentos prematuros enquanto ainda encerra chamadas verdadeiramente silenciosas. |
Teste valores diferentes em chamadas reais—muito baixo pode interromper, muito alto deixa lacunas estranhas.
6. Mensagem Inicial
| Modo | Como é usado | Melhor prática |
|---|
| Pipeline | Lido exatamente como escrito (convertido por TTS). | Escreva a saudação literalmente: “Olá, aqui é Alex da …”. |
| Dualplex | Lido exatamente como escrito (renderizado via ElevenLabs TTS). | Escreva a saudação literalmente, depois selecione sua voz clonada. |
| Speech-to-Speech | Interpretado como um prompt pelo modelo. | Inclua instruções como “Cumprimente o cliente e diga …” ou adicione diga exatamente: para garantir saída literal. |
7. Som ambiente
Habilitado por padrão, o som ambiente é um recurso que adiciona ruído de fundo à voz do assistente.
Se o assistente não está ouvindo você bem, você pode tentar desativar o som ambiente ou diminuir o volume.
8. Controles deslizantes de ponto final
Controle quando seu assistente começa a falar com o controle deslizante de sensibilidade de ponto final na parte inferior das configurações do assistente.
| Configuração | Efeito | Use quando |
|---|
| Sensibilidade mais baixa | Assistente responde mais rápido depois que o chamador para de falar | Você quer conversas rápidas e ágeis |
| Sensibilidade mais alta | Assistente espera mais tempo antes de responder | Chamadores dão respostas mais longas e detalhadas |
Dica profissional: Se seu assistente corta os chamadores no meio da frase, aumente a sensibilidade. Se as respostas parecerem lentas, diminua.
9. Debug usando transcrição de chamada
Se você estiver tendo problemas com seu assistente, pode usar a transcrição de chamada para depurar o problema.
- Vá para a página de Histórico de chamadas.
- Clique na última chamada que você testou
- A transcrição da chamada será mostrada incluindo chamadas de função e seus parâmetros.
10. Ainda tem dúvidas?
Se você tiver alguma dúvida, entre em contato com nossa equipe de suporte através do widget de chat dentro do aplicativo.
Teste diferentes configurações com chamadas reais—o equilíbrio certo depende do seu fluxo de conversação e padrões de comportamento do chamador.
Precisa de uma lista completa de cada opção e controle deslizante? Consulte a
referência completa de configurações do assistente.