본문 바로가기

전체 글

(6)
[정보검색] 검색 성능 척도 :: 재현율 (Recall) & 정확률 (Precision) & F척도 (F-measure) 정보검색시스템의 평가는 검색 성능(retrieval performance)이 가장 중요한 평가 기준이다. 검색 성능에는 검색의 효율성과 검색의 효과성이 존재한다. 검색의 효율성(effiency)이란 검색 속도 혹은 응답 속도를 의미하는 한편 검색의 효과성(effectiveness)은 검색 결과의 정확성을 의미한다. 이러한 검색 성능을 평가하는 지표로서 재현율, 정확률, F척도 등이 존재한다. 가장 대표적인 검색 성능 척도로 재현율과 정확률이 있다. 이는 다음과 같이 문헌집단을 분할하여 손쉽게 구할 수 있다. 적합 문헌 부적합 문헌 검색된 문헌 a b a + b 검색되지 않은 문헌 c d c + d a + c b + d a + b + c + d 재현율 (Recall) 재현율은 적합 문헌 중 검색된 적합 문..
[CSS] 목록 관련 속성 :: list-style-type, list-style-image, list-style-position, list-style 목록 관련 속성 속성 속성값 설명 list-style-type none, disc, circle, decimal, lower-alpha, ... 목록 마커의 형태를 도형, 숫자, 문자로 지정 list-style-image none, url('이미지 경로') 목록 마커의 형태를 이미지로 지정 list-style-position outside, inside 목록 마커의 위치를 지정 list-style ... 목록 관련 속성 일괄 지정 list-style-type HTML 문서에서 목록은 태그 혹은 태그를 통해 만들 수 있다. 이때 목록 앞에 붙는 도형이나 문자를 목록 마커라고 하는데, CSS에서 list-style-type 속성을 통해 목록 마커의 형태를 지정할 수 있다. 순서가 없는 목록 즉 태그의 경우 ..
[텍스트 전처리] Stopwords Removal (불용어 제거) Zipf's Law 지프의 법칙 Zipf’s law는 어떠한 자연어 말뭉치 표현에 나타나는 단어들을 그 사용 빈도가 높은 순서대로 나열하였을 때, 모든 단어의 사용 빈도는 해당 단어의 순위에 반비례함을 나타낸다. 다시 말해, 가장 사용 빈도가 높은 단어는 두번째 단어보다 빈도가 약 두배 높으며, 세번째 단어보다는 빈도가 약 세배 높다는 것이다. Zipf’s law에 따르면, 문헌집단에 나타나는 단어들의 빈도수를 시각화 하면 long tail distribution이 나타나고, 이때 highly rank된 단어들 즉 고빈도 단어들 중에는 전치사가 대부분이다. 이러한 단어의 frequency와 단어의 rank의 곱이 constant 즉 일정하다는 Zipf’s law에 기반하여 Luhn은 단어의 출현 빈도 및..
[텍스트 전처리] Stemming (어간 추출) & Lemmatization (원형 복원) 단어의 형태 변화 (lexical variations of term ; term variation) 에 따라 같은 단어라도 다른 단어인 것처럼 취급되는 문제를 해결하기 위해 사용되는 보편적인 방법으로 어간 추출 (Stemming) 과 원형 복원 (Lemmatization) 이 있다. Stemming 어간 추출 Stemming이란 어형이 변형된 단어로부터 접사 등을 제거하고 그 단어의 어간을 분리해내는 것을 의미한다. 이때 어간이 반드시 어근과 같아야 하는 것은 아니며, Stemming의 목적은 어근과 차이가 있더라도 관련이 있는 단어들이 일정하게 동일한 어간으로 매핑되게 하는 것이다. 이러한 역할을 하는 것을 Stemming Algorithm 또는 Stemmer라고 한다. stemming은 정보검색 분야..
[CSS] 선택자 CSS 선택자 종류 1. 태그 선택자 2. id 선택자 3. class 선택자 태그 선택자 해당 태그에 스타일을 적용한다. 태그이름{ 속성1: 값1; 속성2: 값2; } 오늘의 날씨 구름이 많고 오후에 비가 내린다. id 선택자 해당 id 속성 값을 갖는 태그에 스타일을 적용한다. 원칙적으로 하나의 객체에만 스타일을 적용할 수 있다. #id값{ 속성1: 값1; 속성2: 값2; } box 클래스 box_m 아이디 class 선택자 해당 class 속성 값을 갖는 태그에 스타일을 적용한다. 여러 객체에 스타일을 적용할 수 있다. .class값{ 속성1: 값1; 속성2: 값2; } box 클래스 box 클래스
[CSS] HTML에 CSS를 적용하는 방법 CSS 표현식 selector{attribute: value;} selector (선택자) : 스타일 효과를 적용하는 대상 attribute (속성) : 해당 선택자에 적용할 스타일 효과 이름 value (값) : 해당 선택자에 적용할 스타일 효과 값 CSS 적용 방법 1. 인라인 스타일 2. 내부 스타일시트 3. 외부 스타일시트 1. 인라인 스타일 : HTML 태그에 기술 HTML 태그의 style 속성을 이용한다. this is red text. 2. 내부 스타일시트 : HTML 문서 내부에 기술 HTML 문서 I like CSS. this is red blue 3. 외부 스타일시트 : HTML 문서 외부로 연결 HTML 문서 외부로 .css 파일로 분리하여 이를 HTML 문서에 연결한다. HTML ..