Hye Jin Ryoo

[Modern Table Format] Day 2: Apache Paimon - 스트리밍 처리에 특화된 LSM-tree 기반 테이블 포맷

서론: 스트리밍 업데이트는 Iceberg의 약한 고리였다 분석 쿼리 중심에서는 Iceberg가 매우 강력하다. 하지만 초당 수천 건의 upsert/delete가 들어오면, file rewrite 기반 모델은 빠르게 비싸진다. Paimon은 여기서 출발한다. 쓰기 경로: LSM-tree 스타일로 append + compaction 읽기 경...

뉴욕시 공립병원, 팔란티어에 수백만 달러 지급

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 뉴욕시 공립병원 시스템이 팔란티어(Palantir) 와 계약을 맺고 병원 청구 효율화를 위해 약 400만 달러를 지급함 팔란티어는 메디케이드 및 공...

마그누스 칼슨, 2026 FIDE 프리스타일(체스960) 세계 챔피언 등극

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 마그누스 칼슨이 독일 바이센하우스에서 열린 2026 FIDE 프리스타일 체스 세계선수권에서 우승하며 첫 공식 FIDE 인정 타이틀을 획득 결승전에서...

[Modern Table Format] Day 1: Apache Iceberg의 스냅샷 격리와 매니페스트 구조

서론: 테이블 포맷은 결국 메타데이터 엔진이다 레이크하우스에서 성능 문제를 분석할 때 많은 팀이 파일 포맷(Parquet/ORC)만 본다. 하지만 실제 병목은 종종 메타데이터 트리에서 발생한다. Iceberg는 이를 해결하기 위해, “디렉터리 스캔”이 아니라 스냅샷 기반 메타데이터 탐색으로 쿼리 계획을 만든다. 핵심은 세 가지다. 원자적 ...

대규모 모델을 위한 데이터 엔지니어링: 아키텍처, 알고리듬 및 프로젝트

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 대규모 모델 시대에 데이터 품질이 모델 성능의 상한을 결정하며, 이를 위한 체계적 데이터 엔지니어링 지식을 제공하는 오픈소스 가이드북 사전학습 데이...

국토안보부가 ICE 비판자 검열을 위해 플랫폼에 압력을 가하고 있다는 주장 제기

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 기술 기업들이 불법적 정부 요청으로부터 이용자를 보호해야 한다는 압력이 커지고 있으며, 이러한 요청이 ICE 관련 정보 공유를 어렵게 만들고 있음 ...

AI 일자리 상실에 대해 걱정하지 않는 이유

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 최근 AI가 인간 일자리를 대규모로 대체할 것이라는 공포와 과장된 위기감이 확산되고 있으나, 실제 변화는 훨씬 느리고 불균등한 과정임 노동 대체는 ...

미국 기업과 소비자가 관세 비용의 90%를 부담한다고 뉴욕 연준이 발표

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 뉴욕 연방준비은행 분석에 따르면, 미국이 부과한 관세의 약 90%를 국내 기업과 소비자가 부담하고 있음 관세 부과로 인한 비용이 수입업체와 소비자 ...