벡터 임베딩이란
·
Python
1. 임베딩이란 ?임베딩(Embedding)이란 텍스트, 이미지, 오디오 등의 데이터를 숫자 배열(벡터)로 변환하는 것이다. "사과" → [0.12, -0.34, 0.91, 0.07, -0.55, ...] (1536개 숫자)"과일" → [0.11, -0.31, 0.88, 0.09, -0.51, ...]"자동차" → [0.55, 0.72, 0.03, 0.44, 0.21, ...] 핵심 원리는 단순하다. 의미가 비슷한 텍스트는 벡터 공간에서 가까운 위치에 놓인다. 2. 왜 임베딩을 쓰는가 — 키워드 검색의 한계 전통적인 키워드 검색은 단어가 정확히 일치해야 결과가 나온다. 키워드 검색사용자: "강아지 훈련"결과: "강아지 훈련" 포함 문서만 반환→ "반려견 교육", "펫 트레이닝" 같은 연관 결과 누락임..