Делал нейросеть, обрабатывающую обращения пользователей к техподдержке, узнал интересный факт: в выборке из 200 тысяч сообщений примерно 14% слов — нецензурные. Слова, которые на втором и третьем месте по частоте употребления (исключая служебные слова), тоже нецензурные. Стало даже немного жаль сотрудников ТП.