Hye Jin Ryoo

[LLM Observability] Day 5: 관측성 플랫폼 설계 - 운영 성숙도 로드맵

서론: 도구보다 먼저 물어야 할 것 관측성 플랫폼 도입에서 가장 흔한 실수는 도구 선택부터 시작하는 것이다. Datadog을 쓸지, Langfuse를 쓸지보다 먼저 “지금 팀이 어떤 질문에 답하지 못하고 있는가”를 정해야 한다. 답할 수 없는 질문의 목록이 곧 관측성 로드맵이다. 1. 성숙도 단계 모델 Level 0: 관측성 없음 오류는...

OpenAI, 새 언어 모델 GPT-2를 위험성 이유로 전체 공개 보류

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 GPT-2는 8백만 개 웹페이지로 학습된 대규모 텍스트 생성 인공지능으로, 주어진 문장을 자연스럽게 이어 쓰는 능력을 보임 OpenAI는 이 모델이...

Anthropic의 청구 오류와 한 달 넘게 답변이 없는 지원 문제

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 3월 초 Anthropic 계정에서 약 180달러의 비정상 청구가 발생했으며, 사용자는 당시 Claude Max 구독자였음 사용 기록상 실제 활동이...

[LLM Observability] Day 4: 알람과 이상 탐지 - LLM 응답 품질 저하 신호 감지

서론: 무엇이 달라졌는지 알아야 알림을 보낼 수 있다 인프라 알람은 임계값이 명확하다. CPU 90% 초과, 에러율 1% 초과. LLM 품질 알람은 다르다. “응답이 나빠졌다”는 신호는 지연이나 에러율에 나타나지 않고, 여러 간접 지표가 복합적으로 변할 때 드러난다. 1. 알람 대상 지표 계층 LLM 시스템의 알람은 세 계층으로 구분한다. 1....

모든 시대를 바꾼 GPU의 30년 연대기

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 1996년부터 2025년까지의 49종 GPU를 시대별로 정리해, 기술 발전과 시장 변화를 시각화한 데이터 스토리 각 세대는 트랜지스터 수·소비전력·...

[LLM Observability] Day 3: 분산 추적 - 에이전트 체인과 멀티스텝 RAG 파이프라인 추적

서론: 에이전트는 추적이 없으면 블랙박스다 단일 LLM 호출은 지연을 측정하면 충분했다. 에이전트는 다르다. 툴 호출이 중첩되고, 루프가 발생하고, 여러 모델이 연쇄한다. span 추적 없이는 어느 단계에서 시간이 소비됐는지, 어디서 잘못된 결과가 생겼는지 알 수 없다. 1. Span 트리 구조 설계 에이전트 실행은 트리 형태로 표현할 수 있다....

독일 경찰, GandCrab·REvil 랜섬웨어 조직의 러시아인 수장 실명 공개

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 독일 연방범죄수사청이 러시아 국적의 다닐 막시모비치 슈추킨을 GandCrab과 REvil 랜섬웨어 조직의 수장으로 지목하며 실명을 공개함 슈추킨은 ...