이 예제는 WEB PAGE의 내용을 읽어들여 링크와 TEXT를 분리하는 예제입니다.
javascript형태의 link를 처리 할 수 있도록 구성하였습니다.
본 예제를 바탕으로 javascript link처리가 가능한 web crawler를 제작할 수 있습니다.
이 예제는 검색어에 대한 연관 단어 네트워크를 리포팅 합니다.
수집/분석된 문서에서 사용자가 입력한 단어와 밀접한 연관도가 있는 단어들을 추출하고, 추출된 단어 간의 연관도를 분석 각 단어 간에 서로 관련이 있다고 판단되는 단어를 연결하여 네트워크 형태로 도식화하여 보여 줍니다.
이 예제는 검색어에 대한 연관 단어 리스트를 리포팅 합니다.
수집/분석된 문서에서 사용자가 입력한 검색어와 연관된 단어를 시간에 따른 리스트 형태로 보여주어 검색어와 연관된 키워드가 시간의 흐름에 따라 어떻게 변화하는지를 파악하여 원하는 정보 검색을 위하여 더 정확한 검색어로 검색할 수 있습니다. 또한, 시간에 따라 변화하는 연관 단어들을 한눈에 파악할 수 있어 연관어 트랜드를 쉽게 파악할 수 있습니다.
이 예제는 매일 수집되는 BLOG DATA를 분석하여 최근 24시간동안 중요도가 높은 단어를 자동으로 추출하여 리스트를 만들고 이 리스트를 기준으로 검색어 자동완성 서비스를 하여 사용자의 검색 키워드 선정에 도움을 줍니다.
이러한 방식으로 검색어 자동완성 리스트를 갱신하면 관리자는 자동완성 키워드 선정을 위하여 별도의 작업을 하지 않아도 최신 키워드를 지속적으로 서비스할 수 있습니다.
이 예제는 매일 수집되는 BLOG DATA를 분석하여 최근 24시간동안 가장 이슈가 되는 단어를 추출하여 보여줍니다.
사람은 자신이 원하는 정보나 관심이 있는 분야의 정보만을 주로 찾아보지만, 사람의 주관이 들어가지 않은 시스템이 객관적으로 추출하여 주는 키워드를 통하여 보다 넓은 분야의 이슈를 얻을 수 있습니다.
이 예제는 매일 수집되는 BLOG DATA를 분석하여 최근 10일간 이슈가 되었던 단어들을 '태그 클라우드'와 비슷한 형태로 보여줍니다.
이슈 키워드 클라우드는 최신 이슈단어들을 한눈에 보여주며 각 단어별 연관 단어를 동시에 볼 수 있어 이슈 키워드의 의미를 좀더 쉽고 빠르게 파악할 수 있도록 도와 줍니다.
이 예제는 검색어에 대하여 최근 90일 동안의 이슈 크기를 리포팅 합니다.
수집/분석된 문서에서 사용자가 입력한 키워드가 시간의 흐름에 키워드의 비중이 변화하는 것을 한눈에 파악할 수 있어 해당 키워드의 중요도에 따른 구간 검색에 도움을 줍니다.