O que conta como "tóxico"?

O modelo devolve pontuações para seis categorias definidas pelo dataset Jigsaw/Conversation AI (usado para treinar modelos de moderação em comentários da Wikipédia) — tóxico, muito tóxico, obsceno, ameaça, insulto e ódio por identidade. Pontuações mais altas significam maior confiança.

Um classificador BERT destilado (Xenova/toxic-bert) servido como ficheiro ONNX quantizado (~60 MB). Corre via @huggingface/transformers em WebAssembly; os pesos ficam em cache no navegador após o primeiro uso.

O meu texto é carregado para algum lado?

Não. Toda a classificação corre no seu navegador. Nada é enviado para um servidor.

O modelo foi treinado em dados de redes sociais e comentários em inglês, logo funciona melhor em conteúdo semelhante. Pode falhar com sarcasmo, dog whistles e toxicidade noutros idiomas. Use como assistente, não como único árbitro.

Classificador de toxicidade

Verifique se um texto é tóxico, insultuoso, ameaçador ou odioso antes de publicar ou partilhar. Corre um pequeno modelo de IA a 100% no seu navegador — sem conta, sem upload.

Seus dados nunca saem do seu dispositivo

Perguntas Frequentes

O que conta como "tóxico"?

O modelo devolve pontuações para seis categorias definidas pelo dataset Jigsaw/Conversation AI (usado para treinar modelos de moderação em comentários da Wikipédia) — tóxico, muito tóxico, obsceno, ameaça, insulto e ódio por identidade. Pontuações mais altas significam maior confiança.
Que modelo é usado?

Um classificador BERT destilado (Xenova/toxic-bert) servido como ficheiro ONNX quantizado (~60 MB). Corre via @huggingface/transformers em WebAssembly; os pesos ficam em cache no navegador após o primeiro uso.
O meu texto é carregado para algum lado?

Não. Toda a classificação corre no seu navegador. Nada é enviado para um servidor.
Quão preciso é?

O modelo foi treinado em dados de redes sociais e comentários em inglês, logo funciona melhor em conteúdo semelhante. Pode falhar com sarcasmo, dog whistles e toxicidade noutros idiomas. Use como assistente, não como único árbitro.

Classificador de toxicidade

Perguntas Frequentes

O que conta como "tóxico"?

Que modelo é usado?

O meu texto é carregado para algum lado?

Quão preciso é?