Classificador de toxicidade
Verifique se um texto é tóxico, insultuoso, ameaçador ou odioso antes de publicar ou partilhar. Corre um pequeno modelo de IA a 100% no seu navegador — sem conta, sem upload.
Seus dados nunca saem do seu dispositivoPerguntas Frequentes
-
O que conta como "tóxico"?
O modelo devolve pontuações para seis categorias definidas pelo dataset Jigsaw/Conversation AI (usado para treinar modelos de moderação em comentários da Wikipédia) — tóxico, muito tóxico, obsceno, ameaça, insulto e ódio por identidade. Pontuações mais altas significam maior confiança.
-
Que modelo é usado?
Um classificador BERT destilado (Xenova/toxic-bert) servido como ficheiro ONNX quantizado (~60 MB). Corre via @huggingface/transformers em WebAssembly; os pesos ficam em cache no navegador após o primeiro uso.
-
O meu texto é carregado para algum lado?
Não. Toda a classificação corre no seu navegador. Nada é enviado para um servidor.
-
Quão preciso é?
O modelo foi treinado em dados de redes sociais e comentários em inglês, logo funciona melhor em conteúdo semelhante. Pode falhar com sarcasmo, dog whistles e toxicidade noutros idiomas. Use como assistente, não como único árbitro.