Introdução
Bem-vindo à documentação oficial da API Smart Agent Vet. Esta API fornece ferramentas avançadas para transcrição de áudio veterinário, edição inteligente de texto via IA e geração automatizada de laudos radiográficos e ultrassonográficos.
Gerenciamento de Sessão: A API utiliza `session_id` para manter o estado do texto. Sessões inativas por mais de 10 minutos são limpas automaticamente (TTL).
Autenticação
Todas as requisições requerem o token de acesso no Header.
Authorization: Bearer
Smart Editor (Async)
O coração do sistema. Permite enviar áudio ou texto para atualizar um documento em progresso.
POST /transcrever_e_editar
Envia uma nova entrada para a sessão e inicia o processamento assíncrono.
Parâmetros (Multipart/Form ou JSON)
| Campo | Tipo | Descrição |
|---|---|---|
session_id | string | Opcional. Se não enviado, gera um novo. |
audio | file | Arquivo de áudio (se transcricao não enviada). |
transcricao | string | Texto opcional para pular a transcrição. |
instrucao | string | Opcional. Instrução específica para a edição (ex: "traduza"). |
use_vad | boolean | Default: true. Detecta fala antes de processar. |
Resposta (202 Accepted)
{
"job_id": "uuid-do-job",
"session_id": "uuid-da-sessao",
"status": "processing",
"mensagem": "Seu áudio está sendo processado."
}
Status de Processamento
GET /status/<job_id>
Consulta o progresso e o resultado final da tarefa assíncrona.
Resposta (Sucesso)
{
"status": "completed",
"result": {
"session_id": "...",
"transcricao": "Texto original reconhecido",
"texto_atualizado": "Texto final editado pela IA",
"data": "2026-04-08T..."
}
}
Undo (Desfazer)
POST /undo
Reverte o texto da sessão para a versão anterior.
JSON: { "session_id": "..." }
Geração de Laudos
POST /gerar_laudo
Gera laudo radiográfico estruturado.
POST /gerar_laudo_ultra
Gera laudo ultrassonográfico detalhado por órgão.
Motores Offline
O sistema pode ser configurado no arquivo .env para operar de forma offline:
TRANSCRIPTION_ENGINE=openai(Padrão Cloud)TRANSCRIPTION_ENGINE=atrain(Faster-Whisper Local)TRANSCRIPTION_ENGINE=wav2vec2(HuggingFace Local - Especializado PT-BR)