Создавая свои проекты, веб-проекты, многие программисты и веб-мастера зачастую сталкиваются с проблемой внешних ссылок в теле сайта. Наличие внешних ссылок неблагоприятно сказывается как на рейтинге сайта (бесплатно отдавать свой ТИЦ и PR другим никто не хочет), так и на его стоимости в случае продажи ссылок.
Устранение внешних ссылок - занятие простое. Даже очень. Достаточно внести в свою систему достаточно простой код.
Для начала, уточню, что поиск внешних ссылок в теле сайта легко делается регулярным выражением высотой менее трёх этажей. Хабровцы могут со мной поспорить, но это именно так.
Чтобы найти все ссылки на сайте, можно применить следующее регулярное выражение:
/<a (.*?)href=[\"\']([a-z0-9]+)\:\/\/(.*?)\/(.*?)[\"\'](.*?)>(.*?)<\/a>/i
Единственный его минус - это выражение находит все ссылки, как внешние, так и внутренние. Мы можем слегка доработать его в рамках php и добавить распознавание хоста:
Дополнительная информация: новые скачать фильмы клипы без регистрации
