Lanyard Card Detection Survey

AI

by 연 수 2025. 1. 6. 16:08

Survey

회사 신분증 (Lanyard Card, ID-Card, Company ID 등)을 탐지할 수 있는 Detection Model 관련 Survey 진행

H 과제의 출입 인원 관리를 위한 사람 및 출입증 인식 프로그램을 구현하기 위해 자료 조사 진행
- 이전 시스템 구축 : Detectron2 + SORT 알고리즘 / MOT 관련
- Zero - Shot : Grounding-DINO 기반 논문 조사
- 도메인 (회사 신분증, 신분증, 유사한 카드 관련) 관련 조사
킥오프 때, 간단한 영상 + Tech Flow -> 개선 방향 -> 개선 계획 보여주는게 목표
- 개인적으로 Zero - Shot 모델을 준비
  - (링크)

Detectron2 + SORT 알고리즘 (BoT Sort / Deep Sort / ByteTrack) / MOT 관련

이전에 구현하였던 시스템 관련 참고 자료

Customized Tracking Algorithm for Robust Cattle Detection and Tracking in Occluision Environments
- 축사 환경에서 소의 탐지와 추적을 위한 새로운 알고리즘 제안
- Yolov8 + BoT Sort 사용
- https://pmc.ncbi.nlm.nih.gov/articles/PMC10891808/
(Application of SORT on Multi-Object Tracking and Segmentation 논문 (MOT - Challenge)
- Detectron2 + SORT 사용
  - 신뢰도 기반 사전 필터링을 제거 -> IOU와 신뢰도 점수 결합
  - Kalman 필터 개선 -> 객체의 궤적을 예측
  - 겹치는 부분의 mask와 track 구별을 위해 y좌표 기반 정렬 및 바운딩 박스 높이를 병합
  - https://motchallenge.net/workshops/bmtt2020/papers/Application_and_Adaptations_of_SORT_on_MOTS20.pdf
Object Detection and Tracking Algorithms for Vehicle Counting: A Comparative Analysis 논문
- 교통 영상 데이터 사용 (루이지애나 교통 개발국에서 제공한 9시간 분량)
  - 다양한 날씨, 가림 현상, 저조도 환경 등을 포함한 실제 도로 상황을 반영한 데이터셋
- 객체 탐지 모델 : CenterNet, Detectron2, Yolov4, EfficientDet 사용
- 추적 알고리즘 : Deep SORT, SORT, IOU Tracker, Deep-TAMa
- IDF1(Identity F1 Score), MOTA(Multiple Object Tracking Accuracy), FPS(Frames Per Second) 기준 성능 평가
  - 거의 대부분의 상황에서, Detectron2 + IOU Tracker가 가장 성능이 높음 (다양한 조건)
    - 추론을 고려하면, Detectron2 + Deep SORT
  - 실시간 차량 계수 : Yolov4 + Deep SORT / 밸런스형 : CenterNet + Deep SORT
ID Card Detection Using Pretrained Faster R-CNN
- 간단한 논문. (약간 졸업 논문 느낌)
- https://github.com/bertsky/ocrd_detectron2
MAML MOT: Multiple Object Tracking based on Meta-Learning 논문
- 다중 객체 추적 문제 (MOT)에 MAML (Model-Agnostic Meta-Learning) 알고리즘 제안
- 메타 학습 개념 도입 (적은 샘플로도 빠르게 학습 가능)
  - 학습하는 방법을 학습하는 인공지능 기법
- 적은 샘플 학습 특성을 해결하기 위해 메타 학습을 사용하여 MOT Challenge에서 높은 성능 달성

Zero-Shot: Grounding-Dino

클립 기반 텍스트를 사용하여 학습 없이 간단하게 예시를 보여줄 수 있어서 선정

Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection 논문
- 언어의 입력에 의해 지정된 임의의 물체를 감지하는 시스템을 개발 - Open-Set Object Detection
- Transformer 기반 detector의 발전에 동기를 부여하며 DINO 기반의 Open-Set Detector 모델인 Grounding DINO 제안
  - 2중 인코더 - 단일 디코더 아키텍쳐 (이미지 + 텍스트 feature 추출을 위한 backbone 모델)
  - 이미지와 텍스트 feature 융합 -> 쿼리 초기화를 위한 언어 기반 쿼리 선택 모듈, 박스 세분화를 위한 cross-modality 디코더 존재 (이미지 : Swin-T, Swin-L,텍스트: Bert 사용)
- 비교적 적은 Model Size에서 좋은 성능을 보임
- https://arxiv.org/pdf/2303.05499
Grounded SAM: Assembling Open-World Models for Diverse Visual Tasks 논문
- Grounding DINO를 Open-Set Detector로 사용하여 Segment Anythin Model (SAM)과 결합하는 Ground SAM
  - SAM : 포인트, 상자 또는 텍스트와 같은 적절한 프롬프트로 모든 이미지의 모든 객체를 "cut out"할 수 있는 오픈 월드 세그멘테이션 모델
- Detection + Segementation 가능
  - Automatic Dense Image Annotation : 이미지 내의 객체가 자동으로 매칭되며, 사용자는 임의ㅣ의 카테고리 또는 캡션을 입력할 수 있는 유연성을 가질 수 있음
  - Grounded-SAM-SD : 파이프라인 내에서, 바운딩 박스의 마스크를 변경하여 이미지를 생성할 수 있음
  - Grounded-SAM-OSX : 프롬포터블 인체 움직임 분석 시슽메을 구현할 수 있음
  - More Extenstions for Grounded SAM : Grouned SAM 이외의, 더 빠른 추론 SAM 모델과 협업할 수 있음
- https://arxiv.org/pdf/2401.14159
Grounding DINO 1.5: Advance the “Edge” of Open-Set Object Detection 논문
- Grounding DINO의 기존 모델에 VIT-L과 같은 대형 비전 트랜스포머 백본 모델을 통합하여 성능을 높임
- Grounding DINO 1.5 Pro (VIT-L 통합) / Grounding DINO 1.5 Egde (TensorRT 최적화를 통해 엣지 컴퓨팅 기준)
  - 향후, 모델의 확장 시 참고가 될 수 있을 것 같아서 찾아놈

도메인 (회사 신분증, 신분증, 유사한 카드 관련)

Yolov5 기반 신분증 규정 준수 모니터링
- 개인이 적절한 곳에 달린 신분증을 착용했는지 확인.
- https://github.com/captainvoldemort/Real-Time-Compliance-Monitoring
Yolov5 기반 신분증 감지 시스템 - ID Card
- https://github.com/Suryansh2407/ID-Card-Detection
ANINTELLIGENT SYSTEM FOR IDENTIFICATION CARD DETECTION AND AUTHENTICATION
- ID 카드 감지 및 인증 관련 논문.
- https://www.irjmets.com/uploadedfiles/paper//issue_6_june_2022/25981/final/fin_irjmets1655195471.pdf
ID Card Detection Using Pretrained Faster R-CNN
- Detectron2기반의 세그멘테이션 모델을 위한 OCR-D
  - '혹시 신분증의 정보를 읽어오거나, 차량 OCR과 연동할 수 있을까?'에 대한 고려
- https://github.com/Anindra123/ID-card-detection-project

Paper Keywords

ID-Card-Classification
ID-Identification
ID-Identification: MOT

도메인 키워드

Corporate Employee ID
Company Lanyard
Lanyard Card

'AI' 카테고리의 다른 글

3D Point Cloud Anomaly Detection (0)	2024.12.13
Object Detection + Tracking + ReID(Re-identification) 기능을 포함한 검출 시스템 (3)	2024.12.13
Vision Model 준비 (1)	2024.12.05

연수의 블로그

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문

Survey

Detectron2 + SORT 알고리즘 (BoT Sort / Deep Sort / ByteTrack) / MOT 관련

Zero-Shot: Grounding-Dino

도메인 (회사 신분증, 신분증, 유사한 카드 관련)

Paper Keywords

도메인 키워드

'AI' 카테고리의 다른 글

관련글 더보기

추가 정보

인기글

최신글

티스토리툴바