Hye Jin Ryoo

[Modern Table Format] Day 1: Apache Iceberg의 스냅샷 격리와 매니페스트 구조

서론: 테이블 포맷은 결국 메타데이터 엔진이다 레이크하우스에서 성능 문제를 분석할 때 많은 팀이 파일 포맷(Parquet/ORC)만 본다. 하지만 실제 병목은 종종 메타데이터 트리에서 발생한다. Iceberg는 이를 해결하기 위해, “디렉터리 스캔”이 아니라 스냅샷 기반 메타데이터 탐색으로 쿼리 계획을 만든다. 핵심은 세 가지다. 원자적 ...

대규모 모델을 위한 데이터 엔지니어링: 아키텍처, 알고리듬 및 프로젝트

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 대규모 모델 시대에 데이터 품질이 모델 성능의 상한을 결정하며, 이를 위한 체계적 데이터 엔지니어링 지식을 제공하는 오픈소스 가이드북 사전학습 데이...

국토안보부가 ICE 비판자 검열을 위해 플랫폼에 압력을 가하고 있다는 주장 제기

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 기술 기업들이 불법적 정부 요청으로부터 이용자를 보호해야 한다는 압력이 커지고 있으며, 이러한 요청이 ICE 관련 정보 공유를 어렵게 만들고 있음 ...

AI 일자리 상실에 대해 걱정하지 않는 이유

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 최근 AI가 인간 일자리를 대규모로 대체할 것이라는 공포와 과장된 위기감이 확산되고 있으나, 실제 변화는 훨씬 느리고 불균등한 과정임 노동 대체는 ...

미국 기업과 소비자가 관세 비용의 90%를 부담한다고 뉴욕 연준이 발표

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 뉴욕 연방준비은행 분석에 따르면, 미국이 부과한 관세의 약 90%를 국내 기업과 소비자가 부담하고 있음 관세 부과로 인한 비용이 수입업체와 소비자 ...

Anthropic, 시리즈 G 투자 라운드에서 300억 달러 조달하며 사후 가치 3,800억 달러 달성

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 GIC와 Coatue가 주도한 시리즈 G 투자 라운드에서 300억 달러를 유치하며, Anthropic의 기업 가치는 사후 기준 3,800억 달러로 ...

[LLMOps] Day 5: 프로덕션 배포와 모니터링 - 안정적인 RAG 시스템 운영하기

서론: 프로토타입에서 프로덕션으로 RAG 시스템을 개발하는 것과 운영하는 것은 완전히 다른 문제다. 로컬에서는 잘 되는데, 프로덕션에서는 느리다: 동시 요청이 10개만 넘어도 타임아웃이 발생한다. 비용이 예상의 10배: 임베딩 API 호출을 잘못 설계해서 불필요한 비용이 발생한다. 품질 저하를 모른다: 새로운 문서가 추가되면서 검색 정...

캘리포니아 정치에 영향력을 행사하기 위해 Y Combinator CEO 가리 탄이 ‘다크머니’ 단체를 출범

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 가리 탄은 샌프란시스코의 기술·정치 교차점에서 활동해온 인물로, 캘리포니아 전역을 대상으로 한 정치 영향력 조직 ‘Garry’s List’ 를 설립...