Hye Jin Ryoo

[Production RAG] Day 4: RAG 평가 - Faithfulness, Relevance, Context Recall

서론: RAG가 “잘 작동한다”는 것을 어떻게 증명하는가 RAG 개선이 실제로 효과가 있는지 판단하려면 측정 기준이 필요하다. 지연이 줄었어도 답이 틀렸다면 개선이 아니고, 답이 맞아 보여도 컨텍스트와 무관한 내용을 생성했다면 할루시네이션이다. 각 실패 유형을 포착하는 지표가 따로 필요한 이유다. 1. RAG 평가의 세 축 1.1 Faithful...

생리 추적 앱 Flo, 사용자 데이터를 Meta에 판매한 사실 확인돼

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 생리 추적과 임신 관련 정보를 다루는 Flo는 프라이버시 보호를 내세웠지만, 실제로는 월경 주기, 배란, 임신 관련 데이터를 Meta 등 제3자와 ...

[Production RAG] Day 3: 하이브리드 검색과 리랭킹 - 검색 품질을 높이는 두 전략

서론: 벡터 검색만으로는 충분하지 않은 경우 벡터 검색은 의미적 유사성이 뛰어나지만, 정확한 용어·제품명·코드 같은 정밀 일치에서는 키워드 검색이 더 정확할 수 있다. 두 방식은 서로 다른 유형의 질의를 잘 처리한다. 하이브리드 검색은 두 방식을 결합해 더 넓은 질의 유형을 커버한다. 1. 키워드 검색: BM25 TF-IDF 기반의 통계적 키워...

Quarkdown - 강력한 기능을 더한 Markdown

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 Markdown 기반 문서 작성에 LaTeX 수준의 조판 기능을 결합해, 논문부터 책·프레젠테이션·정적 사이트·지식 베이스까지 한 도구로 다룰 수 ...

Show GN: 완전하게 로컬에서 돌리는 AI 페르소나 시뮬레이터

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 mirollama는 문서와 시나리오를 입력하면 로컬 LLM 기반 AI 에이전트들이 이해관계자 반응, 갈등, 내러티브 변화를 시뮬레이션해주는 loca...

[Production RAG] Day 2: 임베딩 선택과 인덱스 설계 - 모델 비교와 HNSW/IVF 트레이드오프

서론: 임베딩이 바뀌면 인덱스 전체를 다시 만들어야 한다 임베딩 모델은 RAG 시스템에서 교체 비용이 가장 큰 컴포넌트다. 모델을 바꾸면 기존 벡터와 호환되지 않아 인덱스를 전면 재구축해야 한다. 처음에 올바른 모델을 선택하는 것이 중요한 이유다. 1. 임베딩 모델 선택 기준 1.1 도메인 적합성 범용 모델은 일반 텍스트에 강하지만 법률·의료·...

Fast16: Stuxnet보다 5년 앞선 고정밀 소프트웨어 사보타주

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 2005년 제작된 미문서화 사보타주 프레임워크로, 선택된 계산 소프트웨어의 메모리 코드를 패치해 수치 결과를 왜곡하도록 설계됨 svcmgmt.exe...

만들기 전에 거는 세 가지 제약

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 제품 아이디어는 제약조건을 먼저 걸어야 탐색 공간이 줄고, 너무 복잡하거나 정체성이 없는 결과물로 흐르는 일을 막아줌 모든 아이디어는 한 장짜리 o...