Survey
회사 신분증 (Lanyard Card, ID-Card, Company ID 등)을 탐지할 수 있는 Detection Model 관련 Survey 진행
- H 과제의 출입 인원 관리를 위한 사람 및 출입증 인식 프로그램을 구현하기 위해 자료 조사 진행
- 이전 시스템 구축 : Detectron2 + SORT 알고리즘 / MOT 관련
- Zero - Shot : Grounding-DINO 기반 논문 조사
- 도메인 (회사 신분증, 신분증, 유사한 카드 관련) 관련 조사
- 킥오프 때, 간단한 영상 + Tech Flow -> 개선 방향 -> 개선 계획 보여주는게 목표
Grounding DINO - Lanyard Card 관련 추론 예시
Detectron2 + SORT 알고리즘 (BoT Sort / Deep Sort / ByteTrack) / MOT 관련
- Customized Tracking Algorithm for Robust Cattle Detection and Tracking in Occluision Environments
- (Application of SORT on Multi-Object Tracking and Segmentation 논문 (MOT - Challenge)
- Object Detection and Tracking Algorithms for Vehicle Counting: A Comparative Analysis 논문
- 교통 영상 데이터 사용 (루이지애나 교통 개발국에서 제공한 9시간 분량)
- 다양한 날씨, 가림 현상, 저조도 환경 등을 포함한 실제 도로 상황을 반영한 데이터셋
- 객체 탐지 모델 : CenterNet, Detectron2, Yolov4, EfficientDet 사용
- 추적 알고리즘 : Deep SORT, SORT, IOU Tracker, Deep-TAMa
- IDF1(Identity F1 Score), MOTA(Multiple Object Tracking Accuracy), FPS(Frames Per Second) 기준 성능 평가
- 거의 대부분의 상황에서, Detectron2 + IOU Tracker가 가장 성능이 높음 (다양한 조건)
- 추론을 고려하면, Detectron2 + Deep SORT
- 실시간 차량 계수 : Yolov4 + Deep SORT / 밸런스형 : CenterNet + Deep SORT
- ID Card Detection Using Pretrained Faster R-CNN
- MAML MOT: Multiple Object Tracking based on Meta-Learning 논문
- 다중 객체 추적 문제 (MOT)에 MAML (Model-Agnostic Meta-Learning) 알고리즘 제안
- 메타 학습 개념 도입 (적은 샘플로도 빠르게 학습 가능)
- 적은 샘플 학습 특성을 해결하기 위해 메타 학습을 사용하여 MOT Challenge에서 높은 성능 달성
Zero-Shot: Grounding-Dino
- 클립 기반 텍스트를 사용하여 학습 없이 간단하게 예시를 보여줄 수 있어서 선정
- Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection 논문
- 언어의 입력에 의해 지정된 임의의 물체를 감지하는 시스템을 개발 - Open-Set Object Detection
- Transformer 기반 detector의 발전에 동기를 부여하며 DINO 기반의 Open-Set Detector 모델인 Grounding DINO 제안
- 2중 인코더 - 단일 디코더 아키텍쳐 (이미지 + 텍스트 feature 추출을 위한 backbone 모델)
- 이미지와 텍스트 feature 융합 -> 쿼리 초기화를 위한 언어 기반 쿼리 선택 모듈, 박스 세분화를 위한 cross-modality 디코더 존재 (이미지 : Swin-T, Swin-L,텍스트: Bert 사용)
- 비교적 적은 Model Size에서 좋은 성능을 보임
- https://arxiv.org/pdf/2303.05499
- Grounded SAM: Assembling Open-World Models for Diverse Visual Tasks 논문
- Grounding DINO를 Open-Set Detector로 사용하여 Segment Anythin Model (SAM)과 결합하는 Ground SAM
- SAM : 포인트, 상자 또는 텍스트와 같은 적절한 프롬프트로 모든 이미지의 모든 객체를 "cut out"할 수 있는 오픈 월드 세그멘테이션 모델
- Detection + Segementation 가능
- Automatic Dense Image Annotation : 이미지 내의 객체가 자동으로 매칭되며, 사용자는 임의ㅣ의 카테고리 또는 캡션을 입력할 수 있는 유연성을 가질 수 있음
- Grounded-SAM-SD : 파이프라인 내에서, 바운딩 박스의 마스크를 변경하여 이미지를 생성할 수 있음
- Grounded-SAM-OSX : 프롬포터블 인체 움직임 분석 시슽메을 구현할 수 있음
- More Extenstions for Grounded SAM : Grouned SAM 이외의, 더 빠른 추론 SAM 모델과 협업할 수 있음
- https://arxiv.org/pdf/2401.14159
- Grounding DINO 1.5: Advance the “Edge” of Open-Set Object Detection 논문
- Grounding DINO의 기존 모델에 VIT-L과 같은 대형 비전 트랜스포머 백본 모델을 통합하여 성능을 높임
- Grounding DINO 1.5 Pro (VIT-L 통합) / Grounding DINO 1.5 Egde (TensorRT 최적화를 통해 엣지 컴퓨팅 기준)
- 향후, 모델의 확장 시 참고가 될 수 있을 것 같아서 찾아놈
도메인 (회사 신분증, 신분증, 유사한 카드 관련)
- Yolov5 기반 신분증 규정 준수 모니터링
- Yolov5 기반 신분증 감지 시스템 - ID Card
- ANINTELLIGENT SYSTEM FOR IDENTIFICATION CARD DETECTION AND AUTHENTICATION
- ID Card Detection Using Pretrained Faster R-CNN
Paper Keywords
- ID-Card-Classification
- ID-Identification
- ID-Identification: MOT
도메인 키워드
- Corporate Employee ID
- Company Lanyard
- Lanyard Card