방금전 한RSS 공지를 보니, 수집해둔 포스팅들의 본문 검색을 지원한다는 소식이 올라와 있다.
사용자 삽입 이미지
공지사항 내용에는 '검색파트너인 오픈마루'라고 되어 있어서, 오픈마루에서 검색 기술을 제공한 것으로 보인다. 오픈마루스튜디오 블로그에도 관련된 포스팅이 올라왔다.
사용자 삽입 이미지

메타블로그인 올블로그 역시 작년 하반기 부터 포스팅 본문 검색을 지원했었다.

요즘은 뭔가를 찾을 때, 포털의 검색을 이용하기 전에 메타블로그의 검색을 먼저 이용하는 습관이 생겼다. 포털들의 검색은 블로그 검색을 자사 위주로 먼저 보여주고 있고, 어떤 곳은 아예 인덱싱 조차 하지 않는다는 것을 알기에 메타블로그나 Agrregator의 검색은 그 가치가 있어 보인다.

검색엔진이 단순한 기술은 아니지만, 그렇다고 넘볼 수 없는 대단한 기술은 아니다. 수집을 하고 색인을 하여 DB에 쌓아두면 검색질의에 대한 형태소 분석 후 색인DB에서 원본글을 찾는 방식을 취한다. 어쩌면 간단한 작업이지만, 여기에는 형태소 분석이라는 중요한 기술적인 장벽이 버티고 있다. 아마도 검색엔진 기술을 가지고 있다면 이런 형태소분석기를 가지고 있거나 적어도 활용을 한다는 뜻이다.

블로그의 포스트는 점점 늘어나고 있고, 유용한 포스트들이 늘고 있다. 이들을 위한 전문 검색엔진이 필요할 때도 되었다고 본다. 올블로그에 이어 RSS Aggregate 서비스인 한RSS도 검색기능을 추가하였다.

아마도 조만간 블로고스피어에도 검색 바람이 불지 않을까 조심스레 짐작해 본다.
Posted by 까칠한 킬크
TAG ,

댓글을 달아 주세요

  1. insoul 2007.01.30 23:46  댓글주소  수정/삭제  댓글쓰기

    엇.. "수집해둔 포스팅들의 본문 검색" 맞나요? 제가 보기엔 그냥 블로고스피어를 검색하는 것 같은데요. (어떻게 구성된 블로고스피어인지는 모르겠으나 말이죠.)
    흠.. 제가 모르는 어떤 옵션이 존재하는건가요? ^^a

    • Favicon of http://srlog.egloos.com BlogIcon 성렬 2007.01.31 02:49  댓글주소  수정/삭제

      기본적으론 킬크님 말씀대로 한RSS에 등록된 feed들을 기반으로 crawling이 되긴 합니다만, 뭐 오픈마루 독자적으로 구축한 feed db들이 또 있을테니까요. 그런 것들이랑 다 통합이 되긴 하겠죠. ^^;

    • Favicon of https://cusee.net BlogIcon 까칠한 킬크 2007.01.31 09:57 신고  댓글주소  수정/삭제

      robots.txt를 인식한다고 언급한 것은, 만일 robots.txt가 없는 Feed라면 Crawler가 돌아다니면서 사용자들이 등록한 RSS Feed의 글을 수집한다는 뜻으로 보이고, 그렇다면 본문을 모두 긁어오겠죠. 그렇게 해서 긁어온(Han RSS가 수집한) 포스팅 내용을 색인하고 검색하는 방식으로 이해했는데, 아닌가요? ^.^