Search

허깅페이스로 배우는 멀티모달 모델

저자
정우준, 이정인
출간일
2026/03/25
상태
예약판매
장르
IT/컴퓨터
ISBN
978-89-6088-504-2
판매가
22000
쪽수
232
가격
예제 파일 URL
판매가 1
6 more properties

판매처

책소개

세계 최대이자 대표 오픈소스 AI 플랫폼 허깅페이스로 시작하는 멀티모달 모델의 모든 것

허깅페이스(Hugging Face)는 전 세계의 수많은 연구자와 기업들이 자신의 모델과 데이터셋을 공개하고 공유할 수 있는 대표적인 오픈소스 AI 플랫폼입니다. 허깅페이스는 단순히 모델을 모아 둔 저장소 역할만 하지 않습니다. Transformers와 같은 라이브러리를 통해 이 모델들을 쉽게 다룰 수 있는 방법을 제공하며, 개발자들이 복잡한 기술을 간단한 코드 몇 줄로 활용할 수 있게 해줍니다. 이렇듯 허깅페이스는 AI 기술을 효과적으로 활용하는 것은 물론 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터를 동시에 처리하는 멀티모달(Multimodal) AI 분야에서도 필수적인 도구로 자리 잡았습니다. 《허깅페이스로 배우는 멀티모달 모델》은 허깅페이스(Hugging Face) 생태계를 기반으로, 텍스트와 이미지를 동시에 다루는 멀티모달 (Multimodal) 모델의 기초부터 실무 활용까지 이론을 바탕으로 실습을 통해 익힐 수 있도록 구성하였습니다. 이론 설명을 넘어 멀티모달 모델의 핵심인 CLIP 인코더의 원리와 비전 언어 모델(VLM)의 파인튜닝 그리고 ControlNet을 활용한 정교한 이미지 생성 기법을 단계별 실습과 함께 알려 줍니다. 특히 급변하는 AI 트렌드에 발맞춰 비디오 LLM, 옴니 모델, 로봇 멀티모달 등 차세대 기술의 확장성까지 조망함으로써 AI 엔지니어와 개발자들이 실질적인 구현 능력을 갖출 수 있도록 도와줄 것입니다.