Pular para o conteúdo
Ad: top-banner (320x50)

Classificador de toxicidade

Verifique se um texto é tóxico, insultuoso, ameaçador ou odioso antes de publicar ou partilhar. Corre um pequeno modelo de IA a 100% no seu navegador — sem conta, sem upload.

Seus dados nunca saem do seu dispositivo
Ad: sidebar (300x250)
Ad: mid-banner (300x250)

Perguntas Frequentes

  • O que conta como "tóxico"?

    O modelo devolve pontuações para seis categorias definidas pelo dataset Jigsaw/Conversation AI (usado para treinar modelos de moderação em comentários da Wikipédia) — tóxico, muito tóxico, obsceno, ameaça, insulto e ódio por identidade. Pontuações mais altas significam maior confiança.

  • Que modelo é usado?

    Um classificador BERT destilado (Xenova/toxic-bert) servido como ficheiro ONNX quantizado (~60 MB). Corre via @huggingface/transformers em WebAssembly; os pesos ficam em cache no navegador após o primeiro uso.

  • O meu texto é carregado para algum lado?

    Não. Toda a classificação corre no seu navegador. Nada é enviado para um servidor.

  • Quão preciso é?

    O modelo foi treinado em dados de redes sociais e comentários em inglês, logo funciona melhor em conteúdo semelhante. Pode falhar com sarcasmo, dog whistles e toxicidade noutros idiomas. Use como assistente, não como único árbitro.