Я ищу наилучшие методы для выполнения строгой («белого») проверки / фильтрации предоставленного пользователем HTML.
Основная цель - отфильтровать XSS и аналогичные nasties, которые могут быть введены через веб-формы. Вторичная цель - ограничить поломку содержимого HTML, введенного нетехническими пользователями, например. через редактор WYSIWYG, который имеет вид HTML.
Я рассматриваю возможность использования очистителя HTML или сворачиваю свой собственный, используя парсер HTML DOM, чтобы пройти процесс, подобный HTML (грязный) - & GT; DOM (грязная) - & GT; фильтр- & GT; DOM (чистая) - & GT;. HTML (чистая) р>
Можете ли вы описать успехи этих или любых более простых стратегий, которые также эффективны? Любые подводные камни, за которыми следует следить?