Hye Jin Ryoo

[LLM 추론 최적화] Day 5: 프로덕션 추론 운영 - 비용·지연·처리량의 균형

서론: 최적화는 배포 이후에도 계속된다 추론 서버를 띄우고 모델을 올렸다고 해서 끝이 아니다. 트래픽 패턴이 바뀌고, 모델이 교체되고, 비용이 예상을 초과한다. 운영 단계의 최적화는 구축 단계만큼 중요하다. 1. 핵심 지표 대시보드 운영에서 봐야 할 지표를 계층별로 나눈다. 비즈니스 지표 - GPU 비용 / 1000 요청 - 요청당 생성...

Tell HN: Claude Design 쓰지 마세요. 구독 해지 후 내 프로젝트 접근 권한을 잃었습니다

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 Claude Code Max를 5개월 구독한 뒤 codex를 시험해보고, 다시 Claude Design의 이전 프로젝트로 돌아갔지만 더는 접근할 수...

휴리스틱 없는 결정론적 완전 정적 전체 바이너리 번역

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 Elevator는 디버그 정보·소스 코드·바이너리 레이아웃 가정 없이 x86-64 실행 파일 전체를 AArch64로 정적으로 번역함 코드·데이터 판...

텍스트를 미래적으로 보이게 만드는 방법 (2016)

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 Eurostile Bold Extended만으로도 영화적 시대감을 만들 수 있지만, 여섯 가지 변형을 더하면 텍스트가 훨씬 더 미래적으로 보임 단순...