Hye Jin Ryoo

[LLMOps] Day 5: 프로덕션 배포와 모니터링 - 안정적인 RAG 시스템 운영하기

서론: 프로토타입에서 프로덕션으로 RAG 시스템을 개발하는 것과 운영하는 것은 완전히 다른 문제다. 로컬에서는 잘 되는데, 프로덕션에서는 느리다: 동시 요청이 10개만 넘어도 타임아웃이 발생한다. 비용이 예상의 10배: 임베딩 API 호출을 잘못 설계해서 불필요한 비용이 발생한다. 품질 저하를 모른다: 새로운 문서가 추가되면서 검색 정...

[LLMOps] Day 4: 검색 최적화와 하이브리드 서치 - 정확도를 높이는 고급 기법

서론: 벡터 검색의 한계 순수 벡터 검색(Semantic Search)은 강력하지만, 놓치는 것이 있다. 키워드 매칭 실패: “GPT-4”를 검색할 때, “GPT-4”가 정확히 포함된 문서를 찾아야 하는데 의미적으로 유사한 “LLM” 문서가 상위에 올라올 수 있다. 희귀 용어 처리 부족: “PostgreSQL 15의 pg_stat_stat...

파인만 물리학 강의 (1961–1964)

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 인터넷 브라우저만으로 리처드 파인만의 전설적인 물리학 강의를 고품질 HTML5 형식으로 열람할 수 있음 텍스트, 그림, 수식이 모두 기기 크기에 맞...

[LLMOps] Day 3: 임베딩과 벡터 데이터베이스 선택 - 성능과 비용의 Trade-off

서론: 벡터 검색의 숨겨진 복잡성 많은 개발자가 벡터 데이터베이스를 “그냥 코사인 유사도를 빠르게 계산하는 도구”로 생각한다. 하지만 프로덕션에서는 훨씬 더 많은 고려사항이 있다. 정확도 vs 속도: 완전 탐색(Brute Force)은 정확하지만 느리고, 근사 탐색(ANN)은 빠르지만 결과를 놓칠 수 있다. 메모리 vs 디스크: 모든 벡터...

유효한 미국 취업 허가를 가진 아일랜드 남성, ICE 구금 5개월째

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 미국에서 20년간 거주하며 합법적 취업 허가를 보유한 아일랜드인이 범죄 경력 없이도 ICE에 의해 5개월간 구금됨 그는 미국 시민과 결혼하고 보스턴...

마법에서 악성코드까지: 어떻게 Openclaw의 Agent 기능이 악성코드를 옮기게 되었을까?

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 제목은 약간 변경했습니다. 정확한 영문 제목은 ‘마법에서 멀웨어로: OpenClaw의 에이전트 스킬이 공격 표면이 되는 방법’ 정도가 됩니다. 26...

[LLMOps] Day 2: 문서 처리와 청킹 전략 - 검색 품질을 결정하는 첫 단계

서론: “Garbage In, Garbage Out” RAG 시스템에서 가장 간과되기 쉬운 단계가 청킹(Chunking)이다. 많은 개발자가 LLM 선택이나 벡터 DB 성능에만 집중하지만, 실제로는 문서를 어떻게 분할하느냐가 검색 품질의 70%를 결정한다. 잘못된 청킹의 결과는 치명적이다. 너무 작은 청크: 문맥이 부족해서 검색 정확도가 떨...