상세 컨텐츠

본문 제목

Lanyard Card Detection Survey

AI

by 연 수 2025. 1. 6. 16:08

본문

반응형

Survey

회사 신분증 (Lanyard Card, ID-Card, Company ID 등)을 탐지할 수 있는 Detection Model 관련 Survey 진행

  • H 과제의 출입 인원 관리를 위한 사람 및 출입증 인식 프로그램을 구현하기 위해 자료 조사 진행
    • 이전 시스템 구축 : Detectron2 + SORT 알고리즘 / MOT 관련
    • Zero - Shot : Grounding-DINO 기반 논문 조사
    • 도메인 (회사 신분증, 신분증, 유사한 카드 관련) 관련 조사
  • 킥오프 때, 간단한 영상 + Tech Flow -> 개선 방향 -> 개선 계획 보여주는게 목표 
    • 개인적으로 Zero - Shot 모델을 준비  
      • (링크)

Grounding DINO - Lanyard Card 관련 추론 예시

 


Detectron2 + SORT 알고리즘 (BoT Sort / Deep Sort / ByteTrack) / MOT 관련

  • 이전에 구현하였던 시스템 관련 참고 자료
  1. Customized Tracking Algorithm for Robust Cattle Detection and Tracking in Occluision Environments
  2.  (Application of SORT on Multi-Object Tracking and Segmentation 논문 (MOT - Challenge)
  3. Object Detection and Tracking Algorithms for Vehicle Counting: A Comparative Analysis 논문
    • 교통 영상 데이터 사용 (루이지애나 교통 개발국에서 제공한 9시간 분량)
      • 다양한 날씨, 가림 현상, 저조도 환경 등을 포함한 실제 도로 상황을 반영한 데이터셋
    • 객체 탐지 모델 : CenterNet, Detectron2, Yolov4, EfficientDet 사용
    • 추적 알고리즘 : Deep SORT, SORT, IOU Tracker, Deep-TAMa
    • IDF1(Identity F1 Score), MOTA(Multiple Object Tracking Accuracy), FPS(Frames Per Second) 기준 성능 평가
      • 거의 대부분의 상황에서, Detectron2 + IOU Tracker가 가장 성능이 높음 (다양한 조건)
        • 추론을 고려하면, Detectron2 + Deep SORT
      • 실시간 차량 계수 : Yolov4 + Deep SORT / 밸런스형 : CenterNet + Deep SORT
  4. ID Card Detection Using Pretrained Faster R-CNN
  5. MAML MOT: Multiple Object Tracking based on Meta-Learning 논문
    • 다중 객체 추적 문제 (MOT)에 MAML (Model-Agnostic Meta-Learning) 알고리즘 제안
    • 메타 학습 개념 도입 (적은 샘플로도 빠르게 학습 가능)
      • 학습하는 방법을 학습하는 인공지능 기법
    • 적은 샘플 학습 특성을 해결하기 위해 메타 학습을 사용하여 MOT Challenge에서 높은 성능 달성

Zero-Shot: Grounding-Dino

  • 클립 기반 텍스트를 사용하여 학습 없이 간단하게 예시를 보여줄 수 있어서 선정
  1. Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection 논문
    • 언어의 입력에 의해 지정된 임의의 물체를 감지하는 시스템을 개발 - Open-Set Object Detection
    • Transformer 기반 detector의 발전에 동기를 부여하며 DINO 기반의 Open-Set Detector 모델인 Grounding DINO 제안
      • 2중 인코더 - 단일 디코더 아키텍쳐 (이미지  + 텍스트 feature 추출을 위한 backbone 모델)
      • 이미지와 텍스트 feature 융합 -> 쿼리 초기화를 위한 언어 기반 쿼리 선택 모듈, 박스 세분화를 위한 cross-modality 디코더 존재 (이미지 : Swin-T, Swin-L,텍스트: Bert 사용)
    • 비교적 적은 Model Size에서 좋은 성능을 보임
    • https://arxiv.org/pdf/2303.05499
  2. Grounded SAM: Assembling Open-World Models for Diverse Visual Tasks 논문
    • Grounding DINO를 Open-Set Detector로 사용하여 Segment Anythin Model (SAM)과 결합하는 Ground SAM
      • SAM : 포인트, 상자 또는 텍스트와 같은 적절한 프롬프트로 모든 이미지의 모든 객체를 "cut out"할 수 있는 오픈 월드 세그멘테이션 모델
    • Detection + Segementation 가능 
      • Automatic Dense Image Annotation : 이미지 내의 객체가 자동으로 매칭되며, 사용자는 임의ㅣ의 카테고리 또는 캡션을 입력할 수 있는 유연성을 가질 수 있음
      • Grounded-SAM-SD : 파이프라인 내에서, 바운딩 박스의 마스크를 변경하여 이미지를 생성할 수 있음
      • Grounded-SAM-OSX : 프롬포터블 인체 움직임 분석 시슽메을 구현할 수 있음
      • More Extenstions for Grounded SAM : Grouned SAM 이외의, 더 빠른 추론 SAM 모델과 협업할 수 있음
    • https://arxiv.org/pdf/2401.14159
  3. Grounding DINO 1.5: Advance the “Edge” of Open-Set Object Detection 논문
    • Grounding DINO의 기존 모델에 VIT-L과 같은 대형 비전 트랜스포머 백본 모델을 통합하여 성능을 높임
    • Grounding DINO 1.5 Pro (VIT-L 통합) / Grounding DINO 1.5 Egde (TensorRT 최적화를 통해 엣지 컴퓨팅 기준) 
      • 향후, 모델의 확장 시 참고가 될 수 있을 것 같아서 찾아놈

도메인 (회사 신분증, 신분증, 유사한 카드 관련)

  1. Yolov5 기반 신분증 규정 준수 모니터링
  2. Yolov5 기반 신분증 감지 시스템 - ID Card
  3. ANINTELLIGENT SYSTEM FOR IDENTIFICATION CARD DETECTION AND AUTHENTICATION
  4. ID Card Detection Using Pretrained Faster R-CNN

Paper Keywords

  • ID-Card-Classification
  • ID-Identification
  • ID-Identification: MOT

도메인 키워드

  • Corporate Employee ID
  • Company Lanyard
  • Lanyard Card
반응형

관련글 더보기