Collapse AllExpand All

2.3. 설정 파일

자동완성 서비스의 환경 설정은 akc-conf.{domain}.rc 파일에 저장된다.

프로퍼티명설명

use_character_series

(Deprecated)

한글 풀어쓰기 사용 여부를 설정한다. (기본값 : 1)

  • 0 : 입력문 유지

  • 1 : 입력문을 초성, 중성, 종성으로 풀어쓰기 변환을 한다.

참고

이 옵션은 더 이상 지원하지 않으며 기본적으로 한글 풀어쓰기를 사용한다.

use_consonant_match

초성 풀어쓰기 검색 여부를 설정한다. (기본값 : 0) (1.2.0 버전 부터)

  • 초성 검색은 입력 문자열이 초성 혹은 숫자나 공백으로 이루어졌을 경우에만 동작하며, 검색 시 공백은 무시된다.

  • 사전에 등록된 검색어가 한글이나 숫자가 아닌 문자는 무시하고 초성 및 숫자만 일치하는 검색을 찾는다.

  • 초성 검색은 첫 단어 일치 모드로만 동작한다.

use_keyword_case

입력문이 영문일 경우 대소문자 구분 여부를 설정한다. (기본값 : 0)

  • 0 : 대소문자 구분 안함

  • 1 : 대소문자 구분함

whitespace_sensitive

공백 문자 무시 여부를 설정한다. (기본값 : 0)

modes

지원하는 자동완성 모드를 설정한다. (기본값 : se)

첫 단어 일치(starts with), 가운데 단어 일치(contains), 끝 단어 일치(ends with), 단어 기반 일치(token based) 모드를 조합하여 지정할 수 있다.

  • s : 첫 단어 일치 지원

  • sc : 첫 단어 및 가운데 단어 일치 지원

  • se : 첫 단어 및 끝 단어 일치 지원

  • sce : 첫 단어, 공백 기준의 가운데 단어, 끝 단어 일치 지원

  • t : 단어(토큰) 기반 일치 지원 (일치 횟수 순으로 정렬)

참고

  • t모드는 sce 모드와 섞어서 사용 할 수 없다.

  • 지원하는 모드가 늘어나면 사전 컴파일 시간 및 사용되는 메모리 용량이 늘어나므로 필요한 모드만 설정하는 것이 바람직하다.

sort_by_linenum

완성형 검색어 정렬 방법을 설정한다. (기본값 : 1)

  • 1 : 사전에 등록된 순서로 우선 정렬 (modes=t 경우, 히트카운트 + 사전위치 + 시드위치 + 토큰인덱스)

  • 0 : 가나다 순서대로 정렬 (modes=t 경우, 히트카운트 + 시드위치 + 토큰인덱스 + 사전위치)

참고

  • 1.2.5 버전 부터는 t모드에서도 동작한다.

use_token_all_match

(mdes=t 일 때 사용 가능)

토큰 완전 일치 여부를 설정한다. (기본값 : 0) (1.2.5 버전 부터)

1로 설정할 경우, 입력한 토큰이 모두 맞는 단어만 출력된다.

설정 후, 사용 예시

use_token_all_match = 1
  • 검색어 : "AA 증권 거래소"

  • 검색 결과 : "AA", "증권", "거래소" 세개 토큰이 모두 맞는 단어만 출력되고 "AA은행", "증권회사"는 출력되지 않음.

merge_weights

2중 모드 (modes=sc 혹은 modes=se 등 두가지 모드) 에서 각 모드에 대한 검색 결과를 통합하여 하나의 배열로 반환받는 옵션이다. (기본값 : N/A) (1.2.0 버전 부터)

예를 들어, modes=sc일 경우 s와 c 모드에 대한 각 결과를 하나의 모드처럼 취급하여 단일 배열에 넣어 반환한다. 이때 각 모드에 대한 개별 결과 건수 조정을 merge_weights 값으로 설정한다.

이 모드는 나타나는 키워드의 중복을 제거한다.

modes=sc, merge_weights=7:3 일 경우, merge_weights는 s와 c결과에 대해 분배할 키워드 개수이다. (비율이 아님) 따라서 만약 결과 건수를 max_count를 20으로 한다면 merge_weights=14:6과 같은 식으로 조정해야 한다.

두 모드의 결과 중 하나의 결과 값이 모자랄 경우, 다른 모드의 결과 값으로 채워준다. 7:3 예에서 s 결과가 9이고, c 결과가 2일 경우에는 8:2로 반환한다. s의 결과가 0이고 c의 결과가 10일 경우에는 c의 결과를 모두 반환한다.

use_hnj

(mdes=t 일 때 동작 불가)

입력문 사전에 포함된 한자의 독음으로 검색어를 추천한다. (기본값 : 0) (1.2.0 버전 부터)

참고

  • use_hnj 옵션을 활성화하기 위해서는 동일한 도메인에 한자독음 모듈이 실행되고 있어야 한다.

allow_duplication

사전에 중복된 키워드를 허용한다. (기본값 : true) (1.2.1 버전 부터)

  • true : 중복 허용

  • false : 중복 제거

charset

사전 데이터의 문자셋을 설정한다. (기본값 : utf-8)

참고

  • 설치된 JVM이 지원하는 문자셋들을 지원한다.

    EUC-KR로 설정한 경우, module-conf.도메인번호.rc 파일에도 euckr 설정이 있어야 하며, 사전 파일 인코딩을 ANSI로 변경해야 한다.

  • use_hnj=1로 설정한 경우에는 반드시 charset=utf-8로 문자셋을 설정해야 한다. euc-kr의 경우는 한국식 한자만 표현할 수 있으므로 유니코드 상의 희귀 한자, 간체 등은 표현할수 없기 때문이다.

prefixes

토큰 기반 자동완성과 관련된 설정 정보이다. (기본값 : null)

사전 파일에 형태소 분석 결과가 포함되어 있을 경우 사전 파일 라인 앞 구분자들의 목록을 설정한다.

max_token_count

토큰 기반 자동완성과 관련된 설정 정보이다. (기본값 : 7)

인덱스에 포함시킬 최대 토큰의 개수를 설정한다.

min_token_len_en

토큰 기반 자동완성과 관련된 설정 정보이다. (기본값 : 3)

인덱스에 포함시킬 최소 토큰 길이를 설정한다. (영문)

min_token_len_ko

토큰 기반 자동완성과 관련된 설정 정보이다. (기본값 : 2)

인덱스에 포함시킬 최소 토큰 길이를 설정한다. (한글)

use_final_consonant_series

종성 풀어쓰기 기능을 허용한다. (기본값 : false) (1.2.6 버전 부터)

  • true : 종성 풀어쓰기 허용

  • false : 종성 풀어쓰기 허용 안함 (기본값)

설정 후, 사용 예시

  • 검색어 : 웺

  • 자동완성 결과 : '웹솔루션', '웹소설'과 같은 단어 노출

usr2_dictionary_first

true 설정 시, 보조 사용자 사전인 akc-usr2.{domain}.txt을 우선 적용된다. (기본값 : false) (1.2.14 버전 부터)

Admin에서는 자동목록의 키워드를 상위에 먼저 노출 시킬 수 있다.

use_mode_contains_endswith

공백 기준의 가운데 단어의 끝 단어 검색 여부를 설정한다. (기본값 : 0) (1.3.1 버전부터)

  • 0 : 공백 기준의 가운데 단어의 끝 단어 검색 사용안함

  • 1 : 공백 기준의 가운데 단어의 끝 단어 검색 사용

참고

modes 프로퍼티가 sce, ce일때 작동한다.

use_kscv

한글에서 영어 자동 변환 여부를 설정한다. (기본값 : true) (1.3.5 버전부터)

  • true : 한글에서 영어로 자동 변환 허용 (기본값)

  • false : 한글에서 영어로 자동 변환 허용 안함

참고

설정파일에 설정하지 않고 API로도 호출이 가능하다. 환경설정보다 API 설정이 우선적으로 적용된다.

http://host:port/ksf/api/suggest?target=complete&domain_no=domain&use_kscv=false