서비스 프레임워크 설명서 |
금칙어 서비스의 환경 설정은 csw-conf.{domain}.rc 파일에 저장된다.
프로퍼티명 | 설명 |
---|---|
use_exact_match | 금칙어 사전의 목록과 일치하는 결과값을 반환 할 것인지 설정한다. (기본값 : 1) 1로 설정할 경우 다른 옵션들은 무시된다. |
use_character_series_match | 입력문을 풀어쓰기 할 것인지 설정한다. (기본값 : 0) |
ignore_special_character | 입력문에 특수문자가 포함되어 있을 경우 무시할 것인지 설정한다. (기본값 : 0) |
charset | 사전 데이터의 문자셋을 설정한다. (기본값 : utf-8) 참고설치된 JVM이 지원하는 문자셋들을 지원한다. EUC-KR로 설정한 경우, module-conf.도메인번호.rc 파일에도 euckr 설정이 있어야 하며, 사전 파일 인코딩을 ANSI로 변경해야 한다. |
검색어가 금칙어로 취급되는 것을 막기 위해 한글 풀어쓰기 및 특수문자를 혼용하는 경우가 있는데, 이러한 시도를 막기위한 옵션을 제공한다. 사용자 사전에 "성인"을 등록한 후 use_chracter_series_match와 ignore_special_character를 1로 설정하면 "ㅅㅓㅇ인", "성/인", "성 인"등의 검색어도 금칙어로 추출할 수 있다.
"세계4대성인"과 같은 검색어의 경우 금칙어로 취급되지 않도록 하기 위해서는 금칙어 제외 사전(csw-stop.{domain}.txt)에 검색어 전문을 등록한다.