대한전자공학회

The Institute of Electronics and Information Engineers

학술행사 Confercence & Workshop

2026년 영상이해연구회 여름학교
숙명여자대학교 명신관 221호 / 2026-07-15

(사)대한전자공학회 연구회 행사

2026년 영상이해연구회 여름학교
2026년 7월 15일(수) / 숙명여자대학교 명신관 221호

*사전등록기간 : ~ 2026. 7. 13.(월) 18시까지

초대의 글

최근 인공지능 기술은 단순히 다양한 데이터를 이해하고 생성하는 수준을 넘어, 시간의 흐름 속에서 변화를 학습하고 미래를 예측하는 방향으로 빠르게 발전하고 있습니다. 특히 영상 데이터를 기반으로 한 표현 학습과 더불어, 복잡한 환경을 이해하고 동적인 세계를 모델링하려는 World Models 연구가 활발히 이루어지며, 인공지능은 점차 현실 세계를 보다 깊이 있게 이해하는 단계로 나아가고 있습니다. 이러한 변화는 인공지능 기술이 산업과 일상을 넘어, 실제 환경과 상호작용하는 지능으로 확장되고 있음을 보여주며, 영상이해연구 분야에도 새로운 도전과 기회를 제시하고 있습니다.
이러한 흐름 속에서 인공지능신호처리 소사이어티 영상이해연구회가 준비한 이번 여름학교는, 최신 연구 동향을 공유하고 활발한 학술 교류의 장을 제공하고자 합니다. 이번 여름학교에서는 컴퓨터 비전 및 영상처리 분야의 기초 이론부터 최신 연구에 이르기까지 폭넓은 주제를 다루며, 특히 영상 기반 표현 학습, 시계열 및 비디오 이해, 그리고 World Model로 이어지는 최근의 연구 흐름을 심도 있게 조망하고자 합니다. 또한, Embodied AI와 같이 실제 환경과의 상호작용을 고려한 연구 주제까지 함께 다룸으로써, 인공지능이 나아갈 방향을 다각도로 살펴보고자 합니다.
아울러, 전통적으로 꾸준한 관심을 받아온 Computational Photography 및 3D Computer Vision 분야와 더불어, 산업계 최신 기술 동향을 소개하는 특별 강연도 준비되어 있습니다. 이를 통해 대학원생뿐만 아니라 해당 분야로의 진학 및 진로를 고민하는 학부생, 그리고 산업계 연구원 여러분께도 유익한 시간이 되기를 기대합니다.

이번 여름학교가 다양한 연구 주제와 최신 동향을 접하고, 새로운 아이디어와 영감을 얻어 한 단계 더 성장할 수 있는 계기가 되기를 바랍니다. 바쁘신 가운데에도 영상이해 연구회 여름학교에 참여해 주신 모든 발표자분, 교수님, 연구원님, 학생 여러분께 깊이 감사드립니다.

영상이해연구회 위원장 이덕우
인공지능 신호처리 소사이어티 회장 박인규

여름학교 개요

o 행사명 : 2026년 영상이해연구회 여름학교
o 일시 : 2026년 7월 15일(수) 09:00 ~ 18:00

o 장소 : 숙명여자대학교 명신관(221호)

o 주최 : 대한전자공학회 인공지능신호처리 소사이어티, 영상이해연구회
-----------------------------------------------------------------------------------------
2026년도 영상이해연구회 여름학교 운영위원회
o 조직위원장 : 이덕우(계명대)
o 조직위원 : 김승룡(KAIST), 김태현(한양대), 김학구(중앙대), 민동보(이화여대), 엄찬호(중앙대),
오지형(중앙대), 유재준(UNIST), 임성훈(DGIST), 최종원(중앙대), 최종현(서울대),
함범섭(연세대), 홍성은(성균관대)

여름학교 프로그램 (세부일정)

[ 2026년 7월 15일(수). 숙명여자대학교 명신관(221호) ]

시간	프로그램	강연자
09:00 – 09:20 (20’)	등록 접수	등록데스크
09:20 – 09:30 (10’)	인사말 및 개회사	박인규 소사이어티 회장 (인공지능 신호처리)
세션 1. Generative AI and World Model
09:30 – 10:30 (60’)	A tutorial on Flow Matching:Concepts and Intuition	곽노준 교수 (서울대학교)
10:30 – 11:30 (60’)	Seoul World Model: Grounding World Simulation Models in a Real-World Metropolis	김승룡 교수 (KAIST)
11:30 – 12:30 (60’)	다중 시점 기하학 기초 및 전통/학습기반 스테레오 매칭 방법 소개	임성훈 교수 (DGIST)
12:30 – 13:30 (60’)	중 식	지정 장소
세션 2. Physical AI & Embodied AI
13:30 – 14:30 (60’)	강건한 Physical AI를 위한 포용적 생성 모델	음수빈 교수 (국민대학교)
14:30 – 15:30 (60’)	3D 인간의 물리적 캡쳐와 모델링을 통한 로봇 및 월드 AI	문경식 교수 (고려대학교)
15:30 – 15:45 (15’)	Coffee Break	-
세션 3. Fundamentals in Computer Vision and Mentoring
15:45 – 16:45 (60’)	시뮬레이션에서 현실로: Real-World Robotic Manipulation을 위한 Sim-to-Real과 World Model	고병철 교수 (계명대학교)
16:45 – 17:45 (60’)	비CS전공자로서 CV/ML 연구 및 논문 작성하기	박대희 교수 (DGIST)
17:45 – 18:00 (15’)	맺음말	이덕우 영상이해연구회장(계명대학교)

* 주최측의 사정으로 프로그램이 일부 변경될 수 있습니다.

여름학교 등록안내

여름학교 등록비 안내

구분	학생	일반
사전등록	200,000원	300,000원
현징등록	250,000원	350,000원

o 등록기간 : ~ 2026년 7월 13일(월) 18시 까지

o 아래 사전등록 클릭 - 사전등록 정보 입력 및 등록비 결제 진행을 하여주시기 바랍니다.
o 사전등록(결제완료)시, 신용카드 전표 및 거래명세서를 출력할 수 있습니다. (참가확인서 웹출력 - 행사종료 이후 가능)

o 카드결제가 불가하신 분께서는 계좌시, 아래 계좌정보로 이체하여 주시기 바랍니다.
이체 후 입금정보 및 계산서발행을 위한 정보(사업자등록증)를 E-메일로 송부하여 주시기 바랍니다.

- 입금계좌(영상이해연구회) :
수협은행 1010-2143-7394 (예금주 : (사)대한전자공학회)

o 대한전자공학회 사업자등록증(2026년) 사본 (클릭 다운로드 -PDF)
o 등록비 수협은행 입금통장사본(영상이해연구회) (클릭 다운로드-PDF)

영수증 및 계산서 발급안내

결제방법	카드영수증	계산서(전자)	거래명세서
카드결제	가능(온라인 출력가능)	불가능(이중발급)	기본발행
계좌이체 및 무통장 결제	불가능	가능 (전자-이메일발행,)	기본발행

o 계산서는 온라인에서 신청해 주시기 바랍니다. 카드결제시 계산서 발급은 불가능합니다.

문의처

o 담 당: 대한전자공학회 배기동 부장
o 연락처 : 02-553-0255 (내선4) / E-메일 : biz@theieie.org

여름학교 강연 요약

연사	강연 요약
곽노준 교수 (서울대)	A tutorial on Flow Matching:Concepts and Intuition While diffusion models have achieved immense success in generative AI, their underlying mechanics can be conceptually complex. This focused, one-hour tutorial provides an intuitive, engineering-oriented introduction to Flow Matching, a simplified and highly efficient framework for training continuous-time generative models via vector field regression. Rather than diving into rigorous mathematical proofs, we will concentrate on core structural concepts. The tutorial will introduce how Flow Matching designs tractable probability paths, with a primary focus on Optimal Transport (OT) Flow Matching. We will explore how OT constructs simple, deterministic straight-line trajectories to enable efficient generation.
김승룡 교수 (KAIST)	Seoul World Model: Grounding World Simulation Models in a Real-World Metropolis What if a world simulation model could render not an imagined environment but a city that actually exists? Prior generative world models synthesize visually plausible yet artificial environments by imagining all content. In this seminar, I will present the Seoul World Model (SWM), a city-scale world model grounded in the real city of Seoul. SWM anchors autoregressive video generation through retrieval-augmented conditioning on nearby street-view images. I will also discuss the directions of generative world models.
고병철 교수 (계명대)	시뮬레이션에서 현실로: Real-World Robotic Manipulation을 위한 Sim-to-Real과 World Model 최근 robotic manipulation 연구는 diffusion policy, flow matching, Vision-Language-Action(VLA), 그리고 world model을 중심으로 빠르게 발전하고 있다. 그러나 시뮬레이션에서 우수한 성능을 보인 정책도 실제 물리 세계에서는 관측 분포 차이, embodiment 차이, 센서 지연과 비동기성, 접촉 불확실성, 제한된 실데이터 등의 문제로 쉽게 실패한다. 본 강연에서는 이러한 간극을 줄이기 위해 실제로 어떤 설계 결정이 필요한지를 살펴본다. 특히 공유 가능한 action representation, real-world observation adaptation, calibration과 synchronization, low-data real-world adaptation, 그리고 sensor–fusion–action 관점에서의 시스템 설계를 중심으로 sim-to-real의 핵심 이슈를 정리한다. 아울러 최근 주목받는 LeWorldModel 등 world model 연구를 함께 소개하며, 앞으로의 real-world robotic manipulation이 단순한 정책 학습을 넘어 sensing, execution, prediction이 통합된 방향으로 발전하고 있음을 논의한다.
음수빈 교수 (국민대)	강건한 Physical AI를 위한 포용적 생성 모델 Physical AI 및 embodied AI 시스템이 현실에서 강건하게 동작하려면, 희귀한 시나리오에 대한 대응력이 필수적입니다. 예를 들어, 일반적인 물체 배치 위주로 학습된 로봇은 비정형적 상황에서 쉽게 실패합니다. 본 강연에서는 데이터 분포의 저밀도 영역을 포함한 다양한 모드로 생성을 유도하는 포용적 확산 모델 연구를 소개하고, 이를 physical AI의 데이터 다양성 문제에 적용할 가능성을 논의합니다.
문경식 교수 (고려대)	3D 인간의 물리적 캡쳐와 모델링을 통한 로봇 및 월드 AI 본 강연에서는 3D 컴퓨터 비전 기술을 통해 인간의 동적 움직임을 복원하고, 이를 로봇의 체화된 지능 및 월드 모델 구축에 활용하는 연구 방법론을 다룹니다. 우선, 3D 가우시안 스플래팅을 확장하여 단일 영상만으로도 의복의 질감과 움직임을 정교하게 재현할 수 있는 동적 아바타 생성 기술을 소개합니다. 특히 물리적 타당성을 갖춘 디지털 아바타가 다양한 포즈에서도 자연스럽게 애니메이션화되는 과정을 중점적으로 논의합니다. 이와 더불어 전신과 손의 세밀한 상호작용을 통합적으로 추론함으로써, 복잡한 관절체 모델링에서 발생하는 오차를 줄이고 복원 정확도를 극대화하는 기법을 살펴봅니다. 이어서 시각적 일관성을 극대화하기 위해, 단순한 프레임 생성을 넘어 월드 좌표계 상에서 정의된 정밀한 카메라 궤적을 기반으로 비디오를 생성하는 방법론을 제안합니다. 이는 생성 모델이 카메라의 기하학적 움직임을 직접적으로 제어하게 함으로써, 시점 변화에도 배경의 뒤틀림이나 인물의 외형 붕괴 없이 주변 환경과 완벽하게 정합되는 고품질 비디오 생성을 가능케 합니다. 마지막으로, 단일 비디오에 등장하는 인간의 복잡한 물체 조작 움직임을 로봇의 물리적 제어 신호로 직접 매핑하는 행동 모방 기술을 공유합니다. 단순히 외형적인 움직임을 따라 하는 것에 그치지 않고, 영상 속 상호작용에 내재된 물리적 접촉과 힘의 작용을 분석하여 로봇이 실제 환경에서 실행 가능한 최적의 행동 정책으로 변환하는 과정을 상세히 다룹니다. 특히 이러한 방식은 로봇이 가상 환경에서 학습한 지능을 실제 물리 세계로 전이할 때 발생하는 성능 저하를 최소화하는 데 중점을 둡니다. 결론적으로 이러한 시각적 복원 및 생성 기술이 로봇공학의 Sim-to-Real 격차를 해소하고, 물리적 환경에 대한 깊은 이해를 바탕으로 한 차세대 월드 AI 구현의 핵심 동력이 될 수 있음을 시사하고자 합니다.
임성훈 교수 (DGIST)	다중 시점 기하학 기초 및 전통/학습기반 스테레오 매칭 방법 소개 본 강의에서는 다중 시점 기하학(Multiple view geometry)에 대한 기초적인 개념 및 스테레오 매칭 방법론에 대해 소개한다. 카메라 내부, 외부(Camera intrinsic, extrinsic) 파라메터에 대한 기본 개념 설명을 시작으로 다중 시점 기하학을 통해 다중 카메라 정보 추정 방법 및 3차원 복원 기술에 대해 소개한다. 이어서 깊이 지도(depth map)를 추정하는 스테레오 매칭 (Stereo matching) 기본 원리에 대해 설명하고, 전통적인 기법에서부터 딥러닝을 활용한 학습기반의 매칭 기법에 이르기까지 기술 발전사에 대해 소개하고자 한다.
박대희 교수 (DGIST)	비CS전공자로서 CV/ML 연구 및 논문 작성하기 본 강연에서는 비CS 배경의 전공자에서 컴퓨터비전·머신러닝 분야의 연구자로 자리잡기 까지의 여정을 공유한다. 첫 연구 진입, 연구 주제 전환, 우수 국제학회 (CVPR, ICCV, ECCV 등) 논문 출판, 박사 졸업 후 교수 임용 직후 연구실 운영에 이르는 과정에서 겪은 실용적 경험을 다룬다. 각 단계에서 마주친 의사결정과 실수, 그리고 거기서 얻은 노하우를 공유함으로써 연구를 시작하는 대학원생·연구생들에게 실질적으로 적용 가능한 가이드가 되는 것을 목표로 한다.

행사 거래명세서, 참가확인서 발급 안내

o 거래명세서 / 참가확인서 발급 – 온라인 발급
- 대한전자공학회 사전등록(메뉴)에서 로그인 후 다운로드-출력)
* 사전등록비 결제가 완료하신 분들께서는 출력이 가능합니다.
- 개최 행사일 이후 참가확인서 온라인 출력가능

o 신용카드 전표(인쇄) : 행사 사전등록(메뉴) 로그인 후 신용카드전표 출력 가능
* 결제 조회 후 신용카드 전표출력

o 문의처: 대한전자공학회 배기동 부장 / 02-553-0255 (내선5) / E-메일 : biz@theieie.org

숙명여자대학교 [서울특별시 용산구 청파로47길 100 (청파동2가) 숙명여자대학교]
행사장 - 제1캠퍼스 명신관 221호
* 주차가 어려울 수 있어, 가급적 대중교통 이용하여 주시기 바랍니다.
숙명여대 오시는 길 - https://www.sookmyung.ac.kr/kr/intro/directions.do

대한전자공학회

학술행사 Confercence & Workshop

2026년 영상이해연구회 여름학교 숙명여자대학교 명신관 221호 / 2026-07-15

2026년 영상이해연구회 여름학교
숙명여자대학교 명신관 221호 / 2026-07-15