글
블로그와 스팸 차단
태터툴즈/기능 업글 팁
2006. 6. 27. 00:14
많은 분들이 블로그에 몰리는 스팸 때문에 골치를 썩고 계십니다. 저도 예외는 아니어서, 하루 1G 트래픽의 계정을 사용했었지만 반나절이면 트래픽이 모자라곤 했었습니다. 그리고 방문객의 수를 보면 하루에 200 명 이상... 내가 그렇게 인기 블로거였나.. ;;;
하지만, 이것은 다 허수입니다. 스팸 및 검색엔진에서 날리는 봇들 때문이지요. 웬만한 저가형 웹호스팅에서는 저가로 서비스를 제공해 주는 대신, 로그분석 등의 서비스는 일체 제공하지 않습니다. 그러다보니 트래픽이 모자란 것이 스팸 봇에 의한 것인지 이미지 및 다른 파일의 외부 링크에 의한 것인지 판단할 방법이 없지요.
그래서 순차적으로 제가 적용한 방법은 이렇습니다.
하지만, 이것은 다 허수입니다. 스팸 및 검색엔진에서 날리는 봇들 때문이지요. 웬만한 저가형 웹호스팅에서는 저가로 서비스를 제공해 주는 대신, 로그분석 등의 서비스는 일체 제공하지 않습니다. 그러다보니 트래픽이 모자란 것이 스팸 봇에 의한 것인지 이미지 및 다른 파일의 외부 링크에 의한 것인지 판단할 방법이 없지요.
그래서 순차적으로 제가 적용한 방법은 이렇습니다.
1. 이미지 및 다른 파일의 외부 링크 방지
2. 들이대기가 심한 야후 봇의 거절(하루에 몇백 건 이상의 히트수를 기록합니다!)
3. 태터툴즈 최신 버전(1.0.6) 설치
4. 태터툴즈에 스팸 키워드 등록(Online, Casino, href 등)
5. Referer가 스팸키워드일 때, 접근 금지 설정
#계정 웹루트의 .htaccess 파일에 설정합니다.
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} .*jpg$|.*gif$|.*png$ [NC]
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !mydevs\.com [NC]
RewriteCond %{HTTP_REFERER} !google\. [NC]
RewriteCond %{HTTP_REFERER} !search\?q=cache [NC]
#WaterMark
#RewriteRule (.*) image.php?image=$1
#Cut External Link
RewriteRule (.*) noimage.php?image=$1
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} .*jpg$|.*gif$|.*png$ [NC]
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !mydevs\.com [NC]
RewriteCond %{HTTP_REFERER} !google\. [NC]
RewriteCond %{HTTP_REFERER} !search\?q=cache [NC]
#WaterMark
#RewriteRule (.*) image.php?image=$1
#Cut External Link
RewriteRule (.*) noimage.php?image=$1
2. 들이대기가 심한 야후 봇의 거절(하루에 몇백 건 이상의 히트수를 기록합니다!)
#계정 웹루트의 robots.txt 파일에 설정합니다.
User-agent: Slurp
Disallow: /
User-agent: Slurp
Disallow: /
3. 태터툴즈 최신 버전(1.0.6) 설치
4. 태터툴즈에 스팸 키워드 등록(Online, Casino, href 등)
본문 필터링 : href
이름 필터링 : buy와 online
이름 필터링 : buy와 online
5. Referer가 스팸키워드일 때, 접근 금지 설정
#계정 웹루트의 .htaccess 파일 최 상단에 설정(내용은 단 두줄입니다. 그러나 내용이 길어서 여러 줄로 보일 수 있습니다.)
[DN=cfile27.uf@262BAD3D58776F7F0BF69D.txt].htaccess 파일 설정[/DN]
[DN=cfile27.uf@262BAD3D58776F7F0BF69D.txt].htaccess 파일 설정[/DN]
위와 같은 작업을 해 놓은 지금은 트래픽이 아주 약소합니다. 혹시 선의의 피해자가 생기기는 하나 제가 모르는 것일 수도 있겠습니다만, trace watch 및 Google Analytics로 분석해 볼때 실 유저만 접근하는 것으로 판단됩니다.