728x90 반응형 Skills/ML.NET1 N-gram 관련 용어 정리 🔍 검색이 작동하는 방식 – 용어 설명1. N-gram (엔그램)엔그램은 입력한 문장을 일정한 길이로 잘라서 여러 조각으로 나눈 것입니다.예를 들어 단어 “hello”를 2-gram으로 나누면 “he”, “el”, “ll”, “lo”가 됩니다.이 방식을 사용하면, 비슷한 글자나 오타가 있어도 유사한 항목을 찾아낼 수 있어요.예: “헬로”와 “헬로우”는 공통 조각이 있어서 유사하게 인식됩니다.2. N-gram 유사도두 문장을 각각 n-gram 조각으로 나눈 다음, 서로 겹치는 조각이 얼마나 있는지 비교하여 유사도를 계산합니다.예를 들어 "abc"와 "abd"는 2-gram으로 나누면 "ab"만 겹치므로, 유사도는 50%가 됩니다.이 방식은 글자 단위에서 오타, 띄어쓰기 차이 등을 유연하게 인식하는 데 강.. 2025. 5. 12. 이전 1 다음 728x90 반응형