본문 바로가기
일상다반사

구글 검색엔진 상위에 나타나는 글쓰기 방법(feat. SEO)

by 희망공간 2023. 9. 10.

구글이나 네이버의 검색결과에서 상위를 차지하면 엄청난 트래픽을 가져온다. 트래픽은 검색량을 의미하며 트래픽이 높을 수록 곧바로 수익으로 연결된다.  때문에 수익창출을 목적으로 하는 블로거는 물론 인터넷 사업을 목적으로 광고를 하고 있는 사업주 모두가 검색 최상위 자리를 차지하고 싶어 하며 그 방법을 찾아내려 노력하고 있다.

 

구글에는 200여 가지의 랭킹 조건이 있다고 알려지는데, 이렇게 여러 조건들과 연결된 검색엔진 최적화 SEO(Search Engine Optimization)을 시도하는 사람들은 다양한 방법으로 랭킹을 높이고자 끊임없이 노력한다.  예를 들어, 다양한 메타 태그를 부여해 보기도 하고, 인기 있는 키워드도 분석한다. 링크를 추가한다던지 사이트맵을 개선하기도 한다. 소스코드까지 다른 것으로 바꿔본다. 이렇게 검색엔진이 좋아할 수 있도록 끊임없이 시도해 본다. 

 

반면, 검색엔진 업체들은 1~2가지 조건으로 쉽게 랭킹을 올릴 수 없도록 알고리즘을 개선하고 진화시킨다. 단순히 메타태그 몇 개를 부여한다고 랭킹이 쉽게 올라가선 곤란하다. 스팸이 없고, 품질이 좋은 문서만 랭킹에 오를 수 있도록 검색엔진 업체들은 계속 방어 로직을 개선한다. 이 싸움은 끝이 없으며, 검색 서비스가 존재하는 한 계속될 것이다.

 

 

◎ 전세계 1위 검색 서비스업체, 구글의 등장

 

우리는 하루에도 몇 번씩 검색서비스에 쿼리(Query)를 날리며 인터넷 검색생활을 한다. 쿼리는 한마디로 내가 입력하는 검색어다. 정보를 검색하는 사람 입장에서는 빠른 시간 내에 스팸이 아닌 정확한 내용의 정보를 기대한다. 현재 우리나라에서는 네이버가 1등이지만, 전 세계적으로는 구글이 1등 검색 서비스업체이다.

 

2000년대 초반 구글은 검색 엔진에 CPC(Cost Per Click) 방식의 검색광고를 도입한다. 검색어에 따라 적합한 광고를 매번 다르게 보여주고, 사용자가 클릭하면 더 비싸게 광고료를 비싸게 책정하는 방식이다. 누군가 인터넷에서 '셔츠'를 검색하면 '폴로', '빈폴' 같은 광고를 띄어서 검색자가 구매하도록 유도한다. '폴로'의 광고주가 클릭당 1,000원 제시하고, '빈폴' 광고주가 클릭당 1,200원을 제시했다면, 화면에는 '빈폴'의 광고가 먼저 노출된다. 다만, 단가가 높다고 무조건 그 제품이 노출되는 게 아니라 클릭율까지 함께 높이는 알고리즘이 돌아간다. 현재 구글의 광고는 전체 연매출 약 200조원의 80%를 차지하고 있다.

 

 구글의 색인(Index) 작업과 빠른 검색결과 보여주기

 

구글은 엄청난 문서를 수집해서 색인(Index) 작업을 한다. 색인이란 검색엔진이 인터넷에 있는 문서를 수집하여 검색에 적합하도록 보관하고 있는 것이다. 구글은 2013년에만 무려 30조 개의 문서를 색인하였고, 2016년에는 100개조가 더 늘었다고 했다.  이후 더 이상 공개하진 않았지만, 2020년 기준 300조 개 이상의 문서를 색인하였을 것으로 추정된다.

 

구글은 이 엄청난 문서를 고가의 컴퓨터 몇 대에 저장하는 방식이 아닌 일반 PC처럼 저렴한 컴퓨터 수백, 수천대에 나누어 저장하는 방식을 택한다. 구글파일시스템 GFS(Google File System)이라는 효율적 파일 분산시스템을 만들어냈고 아무리 큰 파일도 여러 대의 서버에 분산하여 저렴한 비용으로 저장할 수 있게 된다. 이 방식은 초기 빅데이터  플랫폼의 원형이 되어 이후에 본격적인 빅데이터 플랫폼이 등장하고, 나아가 인공지능 시대가 열리는 계기가 된다.

 

구글은 클롤러(Crawler)를 이용해 웹페이지에서 색인을 위한 정보를 추출하는 작업을 한다. 크롤러는웹 페이지를 갈고리처럼 몽땅 긁어 가져온다. 제목이나 본문 같은 텍스트는 물론, 본문의 주제와 문서의 길이 같은 메타데이터도 추출하여 저장한다. 이런 환경 속에서 구글 작동방식은 사용자가 검색어를 입력하면 수 많은 문서 중에서 딱 맞는 문서 10개를 찾아낸다. 사용자는 92%의 확률로 10개 중 하나를 클릭하며, 여기까지 걸리는 시간은 0.5초가 채 걸리지 않는다.

 

 구글의 검색엔진 상위 랭킹조건

 

블로그는 검색엔진 위에서 구동하는 플랫폼이고, 각 검색엔진이 좋아하는 글쓰기 방식이 다르다. 그러나, 구글이 좋아하는 방식은 나무위키, 위키백과의 형식의 검색엔진 최적화 SEO방식으로 알려지고 있다. 위키백과는 집단지성의 결정체로 이루어진 훌륭한 정보의 보고로 간주되고 있어, 블로거가 동일한 형식의 글쓰기를 하면 좋은 문서로 분류될 가능성이 높다.

 

구글이 원하는 품질 좋은 문서를 만들기 위해서는 아래 사항들을 고려하여 글을 작성하도록 한다.

 

■ 쿼리가 문서 제목에 포함된 것이어야 한다

   무엇보다도 제목에 쿼리가 포함되어 있다면, 구글은 중요한 문서라고 판단한다.

 

■ 내용이 많은 문서른 작성한다.

   짧은 글보다는 긴 글이 품질 점수가 높다. 유명 블로거들은 보통 1,000 ~ 1500자 이상의 단어를 적는다 (단어 수는 네이버의 글자 수 세기 기능으로 확인가능하다). 문서는 '~했다.'처럼 문장의 끝부분을 명확히 나누고, 문단 간 표시도 명확히 하여 가독성을 높여준다.

 

■ 빠른 문서 로딩의 속도를 고려하라.

   보통 문서 1개당 사진 1~2개 정도만 업로딩을 해야 속도가 빠르게 로딩된다(크기는 400px 이하로 설정). 사진의 경우, html의 alt를 태그를 사용하여 ai가 글과 그림을 분리하여 인식할 수 있도록 한다. 구글은 사진이 가독성을 높여주는 좋은 소재라고 생각한다.

■ 안정적 사이트에서 문서를 포스팅한다.

   빠른 로딩과 함께 사이트의 안정성은 매우 중요하다. 자주 다운되는 사이트에 있는 문서라면 아무리 내용이 좋아도 문서를 보기가 어렵다.

 

■ 모바일에서 더 잘보이는 시각 디자인을 한다.

   모바일 인터넷 트래픽이 PC를 앞지른 지 오래되었다. 문서가 모바일에서 잘 보이느냐는 매우 중요한 사항이다.

 

■ 문서 내에 퀴리가 많이 포함되어 있어야 한다.

   딱 한번 나오는 것 보다는 여러 번 반복해서 나오는 것이 좋다. 이 개념은 유사도를 판별하는 TF-IDF 알고리즘의 바탕이 되기도 한다.

 

■ 동일한 사이트에서 중복으로 나오는 콘텐츠는 감점된다

   긴 문서로 만들기 위해 일부러 동일한 내용을 반복하는 경우는 당연히 감점 요인이다.

 

■ 다른 문서에서 복사한 내용은 감점된다

   당연히 불펌한 문서는 점수가 낮고, 원본이 더 높은 점수를 받아야 한다. 구글은 이 부분도 판단하여 점수에 포함한다.

 

■ 비방보다는 품위있는 내용으로 된 문서를 작성한다.

   본문 내용의 수준이 지적인 내용인가 욕설로 가득 찬 내용인가도 당연히 고려의 대상이다. 글의 품위가 평가 기준이다.

 

■ 정확한 저작권을 표기해준다.

   그림이나 사진 등을 게시할 경우는 저작권을 제대로 표시해 주어야 좋은 문서로 판단될 가능성이 높다

 

■ 포스팅한 문서가 SNS 등에 링크가 많이 걸려있을수록 좋다.

   좋은 문서라면 트위터 등 SNS에 링크가 퍼진 경우가 많다