Hye Jin Ryoo

[LLM Agent Patterns] Day 5: 에이전트 운영 - 신뢰성 패턴과 운영 성숙도

서론: 에이전트는 배포 후가 더 어렵다 단일 LLM 호출은 테스트하기 쉽다. 입력을 주고 출력을 검사하면 된다. 에이전트는 다르다. 루프, 툴 호출, 상태 변이가 얽혀 있어 같은 입력도 다른 경로를 거칠 수 있다. 이 비결정성이 에이전트 운영의 핵심 난제다. 1. 에이전트 테스트 전략 1.1 단위 테스트: 툴 계층 각 툴을 독립적으로 테스트한다...

AI 디자인 패턴으로 Show HN 제출물 점수화

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 최근 Show HN 제출 수 증가와 함께 비슷한 인상의 랜딩 페이지가 반복적으로 나타났고, 최신 Show HN 500개 페이지를 기준으로 공통 패턴...

기술 부채, 인지 부채, 의도 부채

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 LLM이 코드를 대량 생산하는 환경에서는 코드 자체의 문제만이 아니라 팀의 공유 이해와 시스템 목표 기록까지 함께 약해지며, 이를 기술 부채·인지 ...

[LLM Agent Patterns] Day 4: 툴 사용 안전성 - 권한 최소화와 Human-in-the-Loop

서론: 에이전트가 틀렸을 때의 비용 에이전트가 웹을 검색하다 실패하면 재시도하면 된다. 에이전트가 데이터베이스 레코드를 삭제하거나 외부 API에 트랜잭션을 전송하면 복구가 어렵다. 툴의 위험성은 균일하지 않다. 이 차이를 무시한 설계가 프로덕션 장애의 주요 원인이다. 1. 툴 위험도 분류 모든 툴을 동일하게 취급하지 않는다. ...

술 취한 글: 시니어 엔지니어로서 배운 것들 (2021)

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 경력 성장에는 회사 이동이 효과적이며, 직함보다 실제로 무엇을 했고 무엇을 이뤘는지가 더 중요함 좋은 코드는 주니어도 이해할 수 있는 단순함을 갖고...

Kimi 벤더 검증기 - 추론 제공자의 정확성 검증

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 오픈소스 모델 배포 이후 서로 다른 인프라에서 발생하는 추론 구현 편차를 검증해, 모델 자체 한계와 엔지니어링 오류를 구분할 수 있게 한 공개소스 ...