Hye Jin Ryoo

[Production RAG] Day 5: RAG 운영 - 인덱스 갱신 전략과 파이프라인 모니터링

서론: 구축 후가 더 긴 여정이다 RAG 파이프라인을 한 번 만들고 끝나는 팀이 있다. 실제 운영에서는 문서가 바뀌고, 새 소스가 추가되고, 청크 전략을 개선해야 하고, 검색 품질이 조용히 저하된다. 구축보다 운영 설계가 더 중요한 이유다. 1. 인덱스 갱신 전략 1.1 전체 재구축 (Full Reindex) 모든 문서를 처음부터 다시 임베딩하...

교토 벚꽃, 1,200년 기록상 어느 때보다 일찍 만개

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 812년부터 2026년까지 이어진 교토 벚나무 만개일 기록은 838개 관측값을 담은 장기 자연 현상 자료임 지난 천년 대부분 만개일은 4월 초~중순...

[Production RAG] Day 4: RAG 평가 - Faithfulness, Relevance, Context Recall

서론: RAG가 “잘 작동한다”는 것을 어떻게 증명하는가 RAG 개선이 실제로 효과가 있는지 판단하려면 측정 기준이 필요하다. 지연이 줄었어도 답이 틀렸다면 개선이 아니고, 답이 맞아 보여도 컨텍스트와 무관한 내용을 생성했다면 할루시네이션이다. 각 실패 유형을 포착하는 지표가 따로 필요한 이유다. 1. RAG 평가의 세 축 1.1 Faithful...

생리 추적 앱 Flo, 사용자 데이터를 Meta에 판매한 사실 확인돼

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 생리 추적과 임신 관련 정보를 다루는 Flo는 프라이버시 보호를 내세웠지만, 실제로는 월경 주기, 배란, 임신 관련 데이터를 Meta 등 제3자와 ...

[Production RAG] Day 3: 하이브리드 검색과 리랭킹 - 검색 품질을 높이는 두 전략

서론: 벡터 검색만으로는 충분하지 않은 경우 벡터 검색은 의미적 유사성이 뛰어나지만, 정확한 용어·제품명·코드 같은 정밀 일치에서는 키워드 검색이 더 정확할 수 있다. 두 방식은 서로 다른 유형의 질의를 잘 처리한다. 하이브리드 검색은 두 방식을 결합해 더 넓은 질의 유형을 커버한다. 1. 키워드 검색: BM25 TF-IDF 기반의 통계적 키워...

Quarkdown - 강력한 기능을 더한 Markdown

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 Markdown 기반 문서 작성에 LaTeX 수준의 조판 기능을 결합해, 논문부터 책·프레젠테이션·정적 사이트·지식 베이스까지 한 도구로 다룰 수 ...