검색엔진 차단법

味 흥미 | 2008/07/22 21:20 | LuneBlanche

블로그가 검색엔진에 검색되지 않도록 하는 방법은 몇 가지가 있습니다.
 
첫번째. 검색엔진을 운영하는 회사에 직접 요청을 하는 방법입니다.
다음이나 네이버 같은 검색 사이트에는 고객센터 등등 잘 뒤젹거려보면 검색제외신청을 할 수가 있답니다. '블로그'코너에 검색되는 건 확실히 제외를 시킬 수가 있죠.
 
두번째. 검색엔진의 규칙을 이용하는 방법입니다. 또 여기에 두가지 방법이 있죠. 검색로봇들은 국제적인 규칙을 따라 특정 파일이나 문구가 있는 것을 인식하여 자료를 퍼갈지 퍼갈지를 결정합니다.
 
두번째-하나. Robots.txt 를 이용하여 검색로봇이 검색하지 못하게 하는 방법입니다.
JinKPark 님의 블로그에 보면 Robots.txt파일을 이용하는 방법을 자세히 설명해 주셨네요. ^_^
http://idleant.com/2690334 (무단 링크 ㅈㅅ)
이것은 설치형 텍스트큐브나 개인 계정을 가진 분들이 사용할 수 있는 방법으로써, 샨새교나 텍큐닷컴을 이용하는 사람들은 그림의 떡이죠.
 
두번째-둘. META TAG를 이용하는 방법입니다.
이것은 HTML소스에 삽입하여 로봇이 읽고 검색을 할지말지 결정하게 하는 건데요, 샨새교 등의 서비스형 블로그에서도 사용이 가능합니다. (텍큐닷컴은 아직 스킨설정이 안 되는 관계로 사용불가합니다)
구글에 잘 나와있군요.
http://www.google.co.kr/support/webmasters/bin/answer.py?answer=35301
(robots.txt까지 나와있어?!)

어떤 로봇도 사이트의 페이지에 대해 색인을 생성하지 못하게 하려면 페이지의 <HEAD> 섹션에 다음 메타 태그를 추가합니다.
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

너무 간략하게 썼군요. -_-
여기서 ROBOTS 는 모든 검색로봇을 의미합니다. 네이버는 NaverBot이구요, 구글은 GOOGLEBOT이네요. 네이버봇만 써 놓는다면 네이버봇만 막히겠죠.
NOINDEX는 검색로봇이 그 페이지에 대한 색인을 만들지 못하게 하는 것이구요,
NOFOLLOW는 외부와 연결된 링크를 따라가지 않도록 하는 것입니다.
추가로, NOIMAGEINDEX 는 이미지 색인을 막는 것이구요,
NOARCHIVE는 이미 검색엔진이 가지고 있는 캐시된 링크를 막는 거랍니다.


기본적으로는 위의 예시만으로도 모든 검색엔진이 차단된답니다.

티스토리에서, 혹은 텍스트큐브닷컴이 스킨 설정이 가능해진다면, 스킨파일 skin.html 에서 <HEAD>와 </HEAD> 사이에 넣으시면 검색엔진이 블로그의 내용을 담아가지 못하게 되겠죠 ^_^

개인적으로는 텍스트큐브닷컴에서 검색엔진 노출을 설정할 수 있도록 해 주셨으면 좋겠습니다.


좋은 정보 되시길~


profile image

아무리 힘들고 어려워도 사랑 하나만 있으면 이겨낼 수 있는 멋지고 약간은 느끼한 로맨티시스트. 하루종일 사랑하는 사람 생각뿐이라 사실 포스팅 할 거리가 별로 없어요 ^_^;

  1. 검색엔진(검색봇) 차단하기

    Tracked from idleant : stroge 2008/07/23 08:04

    검색봇을 차단하기 수많은 쓸데 없는 검색봇을 차단하려면 오른쪽 그림과 같이 작성후 robots.txt란 파일 이름으로 저장한 root 디렉토리에 저정하면 대부분 차단 가능하다 그런데 반드시 차단 가능한것은 아니다 이렇케 한다고 해서 반드시 차단되느게 아니라 검색엔진 개발자 업체간의 합의에 의한것이기 때문에 광고를 목적으로 하는 검색엔진업체, 이 합의에 동의안하는 검색엔진 업체등에는 무용지물이다 검색 차단 방법/ 잘 응용하면 다양한 방법으로 차단 할..

  2. 엘뮤 2008/07/24 04:27 답글수정삭제

    아, 두번째-둘의 방법도 있었네요. 두번째-하나의 방법만 알고 있어서 티스토리를 쓰던 시절에 고민했었는데..텍큐닷컴으로 넘어오니 이 방법을 알게되어도 스킨 수정이 안되어 적용을 바로 못하네요. 좋은 정보 감사합니다.

    • LuneBlanche 2008/07/24 09:18 수정삭제

      검색엔진에게 한번 뒷통수를 맞은 적이 있어서 이것저것 알아보았었답니다.
      이런 방법을 써도 RSS를 통해 검색결과에 나타나게 되는 건 막을수가 없지만요.

트랙백 주소 :: http://tc.luneblanche.net/7/trackback/
옵션
댓글 달기