Skip to content

Latest commit

 

History

History
16 lines (13 loc) · 418 Bytes

README.md

File metadata and controls

16 lines (13 loc) · 418 Bytes

1.简介

本仓库收录业务安全场景真实常见中文脏词,可用于脏词模型训练负样本。

脏词按照类型主要分为如下几类,分别放置在对应目录下:

  • ad 广告因流类
  • curse 辱骂类
  • drug 毒品类
  • gamble 赌博类
  • polity 涉政类
  • porn 情色类
  • violence 暴恐类

欢迎大家补充。

2.提示

脏词很脏,内容可能引起不适,请量力阅读。