Tip:
Highlight text to annotate it
X
안녕하세요. Matt Cutts입니다. Google 품질 그룹에서 일하는 엔지니어죠.
오늘은 웹에서 검색할 때 어떤 일이 일어나는 것인지 얘기해보려 합니다.
먼저 아셔야 할 점은 Google에서 검색할 때 실제로 웹을 검색하는 것이 아니란 거에요.
Google의 웹 색인을 검색하는 것입니다. 최대한 많은 웹을 색인으로 생성하기 위해 노력하죠.
스파이더라 부르는 소프트웨어가 이 일을 해요. 웹페이지 몇 개를 가져오는 것으로 시작해서
그 페이지에 연결된 링크를 따라갑니다. 새로 가리킨 페이지를 가져오고
각각의 페이지에 있는 링크를 따라가서 새 링크를 가져오는 식으로 계속되는 거죠.
Google은 수천 대의 컴퓨터에 걸쳐 수십억 페이지로 된 방대한 규모의 웹에 색인을 생성했습니다.
제가 치타의 속도가 궁금하다고 가정해 보죠. 예를 들어 검색창에 '치타 달리기 속도'라고
입력하고 엔터를 누릅니다. 그러면 소프트웨어는 각 검색어를 포함하는 모든 페이지를 찾기위해
Google 색인을 검색하게 되는 거에요. 이 때 가능한 검색결과가 수십만 가지 나오죠.
그렇다면 Google은 어떻게 내가 원하는 대로 문서 몇 장으로 압축해서 보여줄까요?
200가지가 넘는 질문을 합니다. 어떤 페이지가 검색어를 몇 번 포함하는지,
나오는 곳이 제목인지 URL인지, 또 붙어 나오는지, 페이지에 검색어의 동의어가 나오는지,
나오는 페이지가 양질의 웹사이트인지, 질이 낮거나 혹시 스팸인 페이지는 아닌지,
페이지의 PageRank는 어떤지 등이에요. Google 창립자인 Larry Page와 Sergey Brin이
고안한 공식으로서, 연결된 외부 링크의 수와 그 링크의 중요성 등을 조사해서
한 웹페이지의 중요성을 평가하는 것입니다. 마지막으로 이 모든 요소를 종합하여
각 페이지의 전반적인 평점을 매기고 이에 따라 검색결과를 내보내게 되는 것이죠.
이 과정이 검색어 입력하고 약 0.5초 걸립니다. Google은 유용하면서도 공정한 검색결과를
제시한다는 명제를 아주 중요하게 생각합니다. 돈 받고 사이트를 색인에 추가해주는 일 없고요.
업데이트를 더 자주 해주거나 순위를 높여주는 일 없습니다. 제 검색결과를 한번 살펴볼까요?
항목별로 제목, URL 그리고 텍스트의 스니펫이 있어서 제가 찾던 페이지가 맞는지 쉽게 알 수 있죠.
그리고 유사 내용 페이지 링크가 있고요. 해당 페이지에서 Google이 가장 최근 저장한
페이지도 있죠. 제가 나중에 찾을 지 모르는 관련 검색어도 보입니다. 때로는
오른쪽과 상단을 따라 광고도 표시되죠. Google은 광고 비즈니스도 아주 중대하게 생각합니다.
광고주에게는 가능성 큰 잠재고객을 연결하고 일반 사용자에게는 원하는 광고만 표시하려고
양 방향으로 노력합니다. 광고를 일반 검색결과와 차별화해서
표시하려고 신경을 많이 쓰고요. 그리고 Google이 생각하기에
여러분이 원하는 정보를 찾지 못한다면 차라리 광고를 표시하지 않으려 합니다.
아까 얘기하던 치타의 최고 속도는 시속 100km 가까이 되더군요.
시청해주셔서 감사드립니다. 여러분이 Google을 좀 더 이해할 수 있는 계기가 되었기를 바랍니다.