Hugging Face 업데이트

Hugging Face의 최신 릴리스, 보안 패치, 기능 업데이트 소식을 확인하세요.

Hugging Face 최신 소식

Hugging Face 2026년 7월 28일

OlmoEarth 플랫폼: 행성 규모 지리공간 추론 인프라 해부

Allen AI(Ai2)가 OlmoEarth 플랫폼의 대규모 지리공간 추론 인프라 설계를 공개했다. 위성 이미지 수집·전처리·추론·후처리를 CPU/GPU 별로 분리하고, 수천 워커를 팬아웃하는 아키텍처를 상세히 다룬다.

Hugging Face 2026년 7월 27일

NVIDIA Cosmos-H-Dreams: 수술 로봇을 위한 실시간 생성형 시뮬레이션

NVIDIA가 수술 로봇 시뮬레이션 모델 Cosmos-H-Surgical-Simulator를 실시간 추론이 가능하도록 증류한 Cosmos-H-Dreams를 공개했다. FlashDreams 추론 엔진과 결합해 단일 GPU에서 약 160fps로 인터랙티브 시뮬레이션을 구동한다.

Hugging Face 2026년 7월 23일

Nunchaku 4비트 디퓨전 추론을 Diffusers에 통합하다

Nunchaku의 SVDQuant 4비트 양자화 체크포인트를 Diffusers에서 from_pretrained()만으로 로드할 수 있는 'Nunchaku Lite' 통합이 발표되었다. 별도 추론 엔진 없이 VRAM을 절반 수준으로 줄이면서 약 30% 속도 향상을 제공한다.

Hugging Face 2026년 7월 20일

NVIDIA Cosmos 3 Edge 소개 — 엣지 디바이스용 40억 파라미터 월드 모델

NVIDIA가 Hugging Face에 Cosmos 3 Edge를 공개했다. 로봇·비전 AI 에이전트용 40억 파라미터 오픈 월드 모델로, 엣지 디바이스에서 실시간 추론과 로봇 액션 생성을 목표로 한다.

Hugging Face 2026년 7월 17일

NVIDIA NeMo Automodel과 Diffusers로 영상·이미지 모델 대규모 파인튜닝하기

NVIDIA NeMo Automodel이 Hugging Face Diffusers 포맷을 네이티브로 지원해, 체크포인트 변환 없이 Hub 모델을 바로 분산 파인튜닝할 수 있게 됐다. YAML 설정 하나로 병렬화 전략을 전환하는 구조가 핵심이다.

Hugging Face 2026년 7월 16일

NVIDIA Nemotron 3 Embed, RTEB 리더보드 1위 — 에이전틱 검색을 위한 임베딩 모델 컬렉션 공개

NVIDIA가 RTEB 리더보드 1위를 차지한 8B 모델과 프로덕션용 1B 변형 두 종을 포함한 Nemotron 3 Embed 임베딩 모델 컬렉션을 오픈 웨이트로 공개했다. RAG, 에이전틱 검색, 코드 검색 등 실서비스 배포를 염두에 둔 구성이다.

Hugging Face 2026년 7월 15일

Shippy를 만들며 배운 에이전트 구축 교훈

Allen AI(Ai2)가 해양 감시 플랫폼 Skylight에 탑재한 AI 에이전트 Shippy의 아키텍처와 운영 교훈을 공유했다. 에이전트를 soul·skills·config 세 계층으로 분리하고, 비결정적 모델 위에 결정적 CLI 도구를 얹는 설계가 핵심이다.

Hugging Face 2026년 7월 6일

PRX 시리즈 4편: Photoroom의 이미지 생성 모델 데이터 전략 공개

Photoroom이 7B 규모 이미지 생성 모델 PRX의 사전학습 데이터 파이프라인 설계를 공개했다. 데이터 포맷 선택(Lance와 MDS 병용), 캡션 전략, JPEG 품질 검증 등 실무적 결정과 그 근거를 상세히 다룬다.

Hugging Face 2026년 7월 6일

🤗 Kernels 프로젝트 대규모 업데이트 정리

Hugging Face가 커스텀 GPU 커널의 패키징·배포·보안 체계를 전면 재설계했다. 새 리포지토리 타입, 신뢰된 퍼블리셔 제도, 코드 서명, Torch Stable ABI 및 TVM FFI 지원이 핵심이다.

Hugging Face 2026년 7월 1일

Hugging Face와 Cerebras, Gemma 4 기반 실시간 음성 AI 데모 공개

Hugging Face와 Cerebras가 Gemma 4 31B를 중심으로 한 모듈형 음성-음성(speech-to-speech) 파이프라인 데모를 공개했다. 각 단계가 교체 가능한 오픈 아키텍처이며, 추론 속도와 P95 레이턴시 안정성에 초점을 맞추고 있다.

Hugging Face 2026년 6월 29일

DiScoFormer: 하나의 트랜스포머로 밀도와 스코어를 동시에 추정하다

Allen AI가 DiScoFormer를 공개했다. 분포의 밀도(density)와 스코어(score)를 하나의 트랜스포머 포워드 패스로 추정하며, 재학습 없이 새 분포에 적용할 수 있다.

Hugging Face 2026년 6월 22일

PP-OCRv6가 Hugging Face에 공개: 1.5M~34.5M 파라미터로 50개 언어 OCR 지원

PaddleOCR의 PP-OCRv6가 tiny·small·medium 세 가지 모델 티어로 공개되었다. 50개 언어를 단일 모델 패밀리로 지원하며, Paddle Inference·Transformers·ONNX Runtime 세 가지 백엔드를 선택할 수 있다.

Hugging Face 2026년 6월 17일

MolmoMotion: 언어 기반 3D 모션 예측 모델 공개

Allen AI가 텍스트 지시와 3D 포인트를 입력받아 객체의 미래 3D 궤적을 예측하는 MolmoMotion 모델, 116만 영상 규모의 MolmoMotion-1M 데이터셋, 2.7K 클립의 PointMotionBench 벤치마크를 오픈 공개했다.

Hugging Face 2026년 6월 12일

olmo-eval: LLM 개발 루프를 위한 평가 워크벤치 공개

Allen AI가 LLM 개발 과정에서 반복되는 평가 작업을 간소화하기 위해 olmo-eval을 공개했다. 기존 OLMES 표준 위에 에이전트·멀티턴 평가, 모듈식 런타임 교체, 체크포인트 간 문항별 비교 기능을 추가한 도구다.

Hugging Face 2026년 6월 9일

음성 에이전트는 이중 언어 고객을 처리할 수 있는가? 코드스위칭 음성에 대한 최신 ASR 벤치마크

ServiceNow AI 팀이 이중 언어 코드스위칭 음성에 대해 7개 ASR 모델을 벤치마크한 결과를 Hugging Face Blog를 통해 공개했다. ElevenLabs Scribe V2, Gemini 3 Flash, AssemblyAI Universal 3-Pro가 상위권을 차지했다.

Hugging Face 2026년 6월 7일

Amazing Digital Dentures — 실패한 프로젝트 회고

Hugging Face의 Build Small 해커톤 참가자가 LLM으로 Three.js 게임을 자동 생성하려다 실패한 과정을 솔직하게 공유한 글이다. 최종 결과물은 간단한 HTML 토이 메이커로 축소되었다.

Hugging Face 2026년 6월 6일

다섯 연구소, 다섯 모델: 소형 모델로 만든 멀티모델 금융 시뮬레이션 후기

Build Small Hackathon 참가작 'Thousand Token Wood v2'의 엔지니어링 후기. 네 개 연구소의 소형 모델을 에이전트별로 다르게 배치하고, 내부자 정보 방화벽·감정 메모리 등 구조적 장치로 신뢰성을 확보한 과정을 정리한다.

Hugging Face 2026년 6월 5일

Thousand Token Wood: 3B 모델 위에 멀티 에이전트 경제 시뮬레이션 올리기

Qwen2.5-3B 기반 에이전트 다섯 개로 실시간 경제 시뮬레이션을 구축한 Build Small Hackathon 프로젝트의 엔지니어링 후기. 소형 모델의 포맷 생성 능력과 추론 한계를 구조·프롬프트로 메꾼 사례 보고다.

Hugging Face 2026년 6월 4일

Nemotron 3.5 Content Safety: 엔터프라이즈 AI를 위한 커스터마이즈 가능한 멀티모달 안전 모델

NVIDIA가 Nemotron 3.5 Content Safety를 공개했다. 멀티모달 입력, 다국어 지원, 커스텀 정책 적용, 추론 추적을 단일 모델에 통합한 안전 분류 모델이다.

Hugging Face 2026년 6월 2일

Holo3.1: 빠르고 로컬에서 동작하는 컴퓨터 사용 에이전트

H Company가 Holo3.1 모델 패밀리를 공개했다. 웹·데스크톱·모바일 환경을 아우르는 컴퓨터 사용 에이전트로, 양자화 체크포인트를 통한 로컬 추론을 처음으로 공식 지원한다.

Hugging Face 2026년 6월 1일

JetBrains가 만든 12B MoE 모델 Mellum2 공개

JetBrains가 텍스트·코드 겸용 12B Mixture-of-Experts 모델 Mellum2를 Apache 2.0 라이선스로 공개했다. 토큰당 활성 파라미터가 2.5B로 제한되어 저지연·고처리량 추론에 초점을 맞춘 모델이다.

Hugging Face 2026년 5월 27일

ITBench-AA: 최초의 에이전트 기반 엔터프라이즈 IT 벤치마크에서 최상위 모델들이 50% 미만 기록

Artificial Analysis와 IBM이 Kubernetes 장애 대응 중심의 SRE 에이전트 벤치마크 ITBench-AA를 공개했으며, 현재 최상위 모델 어느 것도 정확도 50%를 넘지 못했다.