Collapse AllExpand All

4.2. 사전 구조

사전 형식

추천검색어 사전의 각 엔트리는 다음과 같이 두 가지 형식을 가진다. (기본형, 표제어형)

  • 기본형

    검색어1,검색어2,검색어3,...,검색어n

    검색어n으로 검색할 경우 검색어n을 제외한 나머지 검색어들을 지정된 개수 만큼 순서대로 추천한다.

    검색어 간의 구분자는 콜론(:)을 사용하며 콜론(:) 문자를 포함하고 싶을 경우 '\:'와 같이 명시한다.

  • 표제어형

    표제어:검색어1,검색어2,...,검색어n
    

    표제어로 검색할 경우 검색어1 부터 검색어n 까지 지정된 개수 만큼 순서대로 추천한다.

    표제어검색어들 간의 구분자는 콜론(:)을 사용하며 콜론(:) 문자를 포함하고 싶을 경우 '\:'와 같이 명시한다.

    참고

    이전 버전과 달리 하나의 사전 안에 기본형과 표제어형의 사전 엔트리를 혼합하여 사용할 수 있다.

예시

$ head kre-user.0.txt
핸드폰, 이효리, 초코렛폰, 테레비
"동급생, 하급생", 동급생, 하급생, "동급셍, 하급셍", 동급셍, 하급셍
"록맨, 메가맨", 록맨 메가맨, 록멘 메가멘, 록멘 메가맨, 록맨 매가맨, 록맨 매가멘
"록맨, 메가맨 (31)", "Rock Man, Mega Man"
061JOB, 061job
1492마일스, 1492MILES, 일사구이마일스, 1492마일즈, 일사구이마일즈
16진수 , hexadecimal
24h 크림, 24시간 크림
$ head kre-usr2.0.txt
사이언:LG사이언, LG텔레콤
스카이, 스키니폰, 펜택
캔유, 흰둥이
$ head kre-stop.0.txt
테레비

위의 사전 파일을 이용하는 경우 검색어 "핸드폰"에 대한 추천검색어는 "이효리"와 "초코렛폰"이다. "테레비"기 제외되는 이유는 "테레비"가 금칙어 사전(kre-stop.0.txt)에 등록되어 있기 때문이다.