검색에 접근함에 있어 일단 많아야 좋은 것을 발견할 가능성이 높다(Much is Better)라는 점은 인정한다. 결국 문제는 그 많은 정보들 속에서 자신이 원하는 좋은 정보(Right information)를 어떻게 걸러내 주느냐가 관건이다.
Google의 PageRank는 많이 인용(Reference)된 웹문서가 좋은 정보다. 이와 살짝 비슷하게 첫눈의 SnowRank는 많이 카피(Copy)된 웹문서가 좋은 정보다. 이들을 보면 오프라인에서의 정보의 활용도와 비슷한 메타포를 함의하고 있음을 느낀다.
논문을 검색하다보면 좋은 논문일 수록 앞선 좋은 논문을 Reference로 달고 있다. 그래서 본인은 논문을 볼 때 Abstract와 Reference만 일단 본다. 또한 본인은 좋은 논문은 인쇄/복사해서 보는 경우가 많다. 즉 오프라인에서도 좋은 정보는 인용이 많이 되고 카피도 많이 된다. 그것이 링크로든 아니면 원문 그대로든. (저작권 문제는 여기서 다루는 것을 회피하고자 한다.^^)
그렇다면 현재의 알고리즘 이상의 좋은 정보를 검색할 만한 껀덕지는 없을까 고민해본다. 좋은 정보는 사람에게 있고 좋은 정보는 여전히 책에 많다. 사람에게서 좋은 정보를 뽑아내기 힘들고 책은 여전히 디지털라이징하기 벅차다.
그렇다면 여전히 정보가 분절화되고 분산 유통되는 구조 즉 웹의 본질로 간다면 PageRank가 우세할 것이라고 본다. 물론 직관적이고 주관적인 Tag가 시기적절하게 검색의 보완재 역할을 하겠지만 대체재가 되기엔 역부족이다. 그렇다면 Tag는 보완재로써 가치있는 접근이 필요하겠다.(to be continue :-))
# by harris | 2006/02/13 14:02 |
기술동향 |
트랙백(2) |
덧글(10)