기타등등/SNS & 블로그

네이버 웹마스터도구의 웹 페이지 수집에서 수집보류 됐을 때

jbee 2020. 6. 20. 20:37
728x90
반응형

블로그를 새로 개설하고 나니 아무래도 검색 노출을 신경 쓰게 된다. 일기도 아닌데 내가 쓰고 나만 볼 게 아니기 때문에 아무래도 많은 사람들이 검색을 통해서 나의 글을 봐줬으면 하는 바람은 모든 블로거의 마음일 것이다.

블로그/사이트를 처음 개설하면 일단 검색엔진에 잘 노출 되도록 SEO(검색 최적화 작업)을 하게 된다. 그 중에서 네이버와 구글을 많이 신경 쓸텐데 웹마스터 도구를 이용한 사이트 등록과 메타 태그 정리 등은 이제 기본적인 처리 사항이 됐다. 

그 중에서도 국내 사용자라면 네이버를 먼저 신경쓰게 되는데 네이버에 내 블로그/사이트의 존재를 알려주고 포스팅(페이지)을 빨리 수집해 가길 바라는 마음에 RSS 제출이나 웹페이지 수집 요청도 하게 된다. 그런데 며칠이 지나도 "수집보류"로 돼 있으면 여간 신경쓰이는 게 아니다.

네이버가 사용자는 많지만 신뢰도는 그렇게 높지 않아서 아마도 타 블로그나 사이트의 페이지 수집에 차별을 두고 있는 게 아닌가 의심을 하게 되기도 한다. 티스토리 사용자의 경우 주소를 "숫자"에서 "문자"로 바꿔 보라는 블로거도 있다. 그러나 개발자 경력 20여년이 됐지만 URL이 검색에 영향을 끼친다는 내용은 본 적이 없다. 내가 본 적이 없지만 실제로 영향이 있는지 없는지는 나도 확실하지 않다.

티스토리 사용자들은 대부분 https://myurl***.com/123 이렇게 숫자 형태를 많이 사용하는데 기술적인 이유보다 깔끔한 거 좋아하는 한국인들 성격이 반영 된 게 아닌가 싶다. 문자로 하게 되면 숫자 대신 %4%$%4^%$456%$%$%%$%$% 이런 비슷하게 생긴 특수 문자 형태로 바뀌게 된다.

기술적인 부분 잠깐 설명하자면 URL 뒤에 특수 문자처럼 보이는 건 한글을 통신이 가능한 특수한 형태로 변형한 것이다. 컴퓨터에서는 한글을 제대로 확인 할 수 있지만 (인터넷)통신망에서는 한글이 한글 형태로 이동하지 않는다. 기계가 이해할 수 있는 문자로 변형해야 하는데 그걸 ENCODING(인코딩)이라고 한다. 전송 받은 특수 문자를 다시 한글로 변환해서 사용자에게 보여주는데 그걸 DECODING(디코딩)이라고 한다. 이런 작업들은 포토토콜(Protocol)에 의해서 가능하다.

예를들어 한글로 "안녕하세요"를 통신용 문자로 인코딩하면 "%BE%C8%B3%E7%C7%CF%BC%BC%BF%E4" 이렇게 된다. 이 문자를 다시 디코딩하면 "안녕하세요"가 된다. 사람이 볼 때는 두 개가 전혀 다른 문자 같지만 사실 컴퓨터는 똑같은 문자로 인식한다. 만약 URL이 한글(문자) 형태가 검색에 영향을 끼치려면 이 URL이 다른 페이지에 A태그로 링크 됐을 때는 가능하다. 검색 로봇들은 A태그를 좋아한다.

여담이 길었는데 위에 네이버 웹마스터도구에서 "수집보류"라고 돼 있는 걸 보고 찝찝했다면 그냥 재시도 하면 된다. 첨부한 이미지를 보면 8월9일 수집 요청해서 수집보류가 나자 별다른 작업 없이 며칠 뒤에 다시 수집요청하니 1분도 안 되서 바로 수집성공으로 바뀐다.

만약 수집보류가 떴다면 해당 페이지의 수집 요청을 다시 해보자. 만약 그래도 안 된다면 내 페이지가 robots.txt나 다른 방화벽 등의 이유로 검색 로봇의 접근이 차단 됐을 수 있다.

내 블로그/사이트가 네이버에서 제대로 검색되고 있는지 확인하고 싶다면 위에서처럼 "site:블로그 주소"로 검색해 보자. 정상적으로 검색이 되고 있다면 내 블로그의 글 목록들이 보여질 것이다.

728x90
반응형