The Institute of Electronics and Information Engineers
|
(사)대한전자공학회 연구회 행사
|
|
*사전등록기간 : ~ 2025. 7. 13.(월) 18시까지
초대의 글
여름학교 개요
여름학교 프로그램 (세부일정)
[ 2026년 7월 15일(수). 숙명여자대학교 명신관(221호) ]
* 주최측의 사정으로 프로그램이 일부 변경될 수 있습니다.
여름학교 등록안내
여름학교 등록비 안내
o 등록기간 : ~ 2026년 7월 13일(월) 18시 까지 o 아래 사전등록 클릭 - 사전등록 정보 입력 및 등록비 결제 진행을 하여주시기 바랍니다. o 카드결제가 불가하신 분께서는 계좌시, 아래 계좌정보로 이체하여 주시기 바랍니다. - 입금계좌(영상이해연구회) : o 대한전자공학회 사업자등록증(2026년) 사본 (클릭 다운로드 -PDF) 영수증 및 계산서 발급안내
o 계산서는 온라인에서 신청해 주시기 바랍니다. 카드결제시 계산서 발급은 불가능합니다.
문의처
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 연사 | 강연 요약 |
| 곽노준 교수 (서울대) |
A tutorial on Flow Matching:Concepts and Intuition
While diffusion models have achieved immense success in generative AI, their underlying mechanics can be conceptually complex. This focused, one-hour tutorial provides an intuitive, engineering-oriented introduction to Flow Matching, a simplified and highly efficient framework for training continuous-time generative models via vector field regression. Rather than diving into rigorous mathematical proofs, we will concentrate on core structural concepts. The tutorial will introduce how Flow Matching designs tractable probability paths, with a primary focus on Optimal Transport (OT) Flow Matching. We will explore how OT constructs simple, deterministic straight-line trajectories to enable efficient generation.
|
| 김승룡 교수 (KAIST) |
Seoul World Model: Grounding World Simulation Models
in a Real-World Metropolis What if a world simulation model could render not an imagined environment but a city that actually exists? Prior generative world models synthesize visually plausible yet artificial environments by imagining all content. In this seminar, I will present the Seoul World Model (SWM), a city-scale world model grounded in the real city of Seoul. SWM anchors autoregressive video generation through retrieval-augmented conditioning on nearby street-view images. I will also discuss the directions of generative world models.
|
| 고병철 교수 (계명대) |
시뮬레이션에서 현실로: Real-World Robotic Manipulation을 위한
Sim-to-Real과 World Model 최근 robotic manipulation 연구는 diffusion policy, flow matching, Vision-Language-Action(VLA), 그리고 world model을 중심으로 빠르게 발전하고 있다. 그러나 시뮬레이션에서 우수한 성능을 보인 정책도 실제 물리 세계에서는 관측 분포 차이, embodiment 차이, 센서 지연과 비동기성, 접촉 불확실성, 제한된 실데이터 등의 문제로 쉽게 실패한다. 본 강연에서는 이러한 간극을 줄이기 위해 실제로 어떤 설계 결정이 필요한지를 살펴본다. 특히 공유 가능한 action representation, real-world observation adaptation, calibration과 synchronization, low-data real-world adaptation, 그리고 sensor–fusion–action 관점에서의 시스템 설계를 중심으로 sim-to-real의 핵심 이슈를 정리한다. 아울러 최근 주목받는 LeWorldModel 등 world model 연구를 함께 소개하며, 앞으로의 real-world robotic manipulation이 단순한 정책 학습을 넘어 sensing, execution, prediction이 통합된 방향으로 발전하고 있음을 논의한다.
|
| 음수빈 교수 (국민대) |
강건한 Physical AI를 위한 포용적 생성 모델
Physical AI 및 embodied AI 시스템이 현실에서 강건하게 동작하려면, 희귀한 시나리오에 대한 대응력이 필수적입니다. 예를 들어, 일반적인 물체 배치 위주로 학습된 로봇은 비정형적 상황에서 쉽게 실패합니다. 본 강연에서는 데이터 분포의 저밀도 영역을 포함한 다양한 모드로 생성을 유도하는 포용적 확산 모델 연구를 소개하고, 이를 physical AI의 데이터 다양성 문제에 적용할 가능성을 논의합니다.
|
| 문경식 교수 (고려대) |
3D 인간의 물리적 캡쳐와 모델링을 통한 로봇 및 월드 AI
본 강연에서는 3D 컴퓨터 비전 기술을 통해 인간의 동적 움직임을 복원하고, 이를 로봇의 체화된 지능 및 월드 모델 구축에 활용하는 연구 방법론을 다룹니다. 우선, 3D 가우시안 스플래팅을 확장하여 단일 영상만으로도 의복의 질감과 움직임을 정교하게 재현할 수 있는 동적 아바타 생성 기술을 소개합니다. 특히 물리적 타당성을 갖춘 디지털 아바타가 다양한 포즈에서도 자연스럽게 애니메이션화되는 과정을 중점적으로 논의합니다. 이와 더불어 전신과 손의 세밀한 상호작용을 통합적으로 추론함으로써, 복잡한 관절체 모델링에서 발생하는 오차를 줄이고 복원 정확도를 극대화하는 기법을 살펴봅니다. 이어서 시각적 일관성을 극대화하기 위해, 단순한 프레임 생성을 넘어 월드 좌표계 상에서 정의된 정밀한 카메라 궤적을 기반으로 비디오를 생성하는 방법론을 제안합니다. 이는 생성 모델이 카메라의 기하학적 움직임을 직접적으로 제어하게 함으로써, 시점 변화에도 배경의 뒤틀림이나 인물의 외형 붕괴 없이 주변 환경과 완벽하게 정합되는 고품질 비디오 생성을 가능케 합니다. 마지막으로, 단일 비디오에 등장하는 인간의 복잡한 물체 조작 움직임을 로봇의 물리적 제어 신호로 직접 매핑하는 행동 모방 기술을 공유합니다. 단순히 외형적인 움직임을 따라 하는 것에 그치지 않고, 영상 속 상호작용에 내재된 물리적 접촉과 힘의 작용을 분석하여 로봇이 실제 환경에서 실행 가능한 최적의 행동 정책으로 변환하는 과정을 상세히 다룹니다. 특히 이러한 방식은 로봇이 가상 환경에서 학습한 지능을 실제 물리 세계로 전이할 때 발생하는 성능 저하를 최소화하는 데 중점을 둡니다. 결론적으로 이러한 시각적 복원 및 생성 기술이 로봇공학의 Sim-to-Real 격차를 해소하고, 물리적 환경에 대한 깊은 이해를 바탕으로 한 차세대 월드 AI 구현의 핵심 동력이 될 수 있음을 시사하고자 합니다.
|
| 임성훈 교수 (DGIST) |
다중 시점 기하학 기초 및 전통/학습기반 스테레오 매칭 방법 소개
본 강의에서는 다중 시점 기하학(Multiple view geometry)에 대한 기초적인 개념 및 스테레오 매칭 방법론에 대해 소개한다. 카메라 내부, 외부(Camera intrinsic, extrinsic) 파라메터에 대한 기본 개념 설명을 시작으로 다중 시점 기하학을 통해 다중 카메라 정보 추정 방법 및 3차원 복원 기술에 대해 소개한다. 이어서 깊이 지도(depth map)를 추정하는 스테레오 매칭 (Stereo matching) 기본 원리에 대해 설명하고, 전통적인 기법에서부터 딥러닝을 활용한 학습기반의 매칭 기법에 이르기까지 기술 발전사에 대해 소개하고자 한다.
|
| 박대희 교수 (DGIST) |
비CS전공자로서 CV/ML 연구 및 논문 작성하기
본 강연에서는 비CS 배경의 전공자에서 컴퓨터비전·머신러닝 분야의 연구자로 자리잡기 까지의 여정을 공유한다. 첫 연구 진입, 연구 주제 전환, 우수 국제학회 (CVPR, ICCV, ECCV 등) 논문 출판, 박사 졸업 후 교수 임용 직후 연구실 운영에 이르는 과정에서 겪은 실용적 경험을 다룬다. 각 단계에서 마주친 의사결정과 실수, 그리고 거기서 얻은 노하우를 공유함으로써 연구를 시작하는 대학원생·연구생들에게 실질적으로 적용 가능한 가이드가 되는 것을 목표로 한다.
|
(우 : 06130) 서울특별시 강남구 테헤란로7길 22 (역삼동, 과학기술회관 1관 907호)
사업자등록번호 : 220-82-01685/(사)대한전자공학회 대표 : 김종옥
TEL. 02-553-0255~7/ FAX. 02-562-4753 /EMAIL. ieie@theieie.org
COPYRIGHT ⓒ IEIE ALL RIGHTS RESERVED.