한국딥러닝(KDL)의 VLM 기술력이 세계 최고 수준임을 입증했습니다.

저희 한국딥러닝(KDL)의 모델이 허깅페이스(Hugging Face)에 등재된 멀티모달 벤치마크 'OCRBench v2'에서 전체 1위(Global No.1)를 기록했습니다!
이번 성과는 Gemini 3, GPT-4o 등 글로벌 빅테크 기업들의 모델을 넘어선 결과로, KDL의 시각 언어 모델(VLM) 기술이 세계 무대에서 정점에 서 있음을 증명합니다.
OCRBench v2란?
OCRBench v2는 단순히 텍스트를 읽는 성능만을 평가하지 않습니다. 총 31개의 광범위한 시나리오를 통해 모델의 한계를 테스트합니다.
영문 텍스트 인식 (Recognition): 다양한 폰트와 환경에서의 정확한 추출
정교한 레이아웃 분석: 문서 구조의 논리적 이해
복잡한 수식 및 도표 해석: 데이터 간의 관계 파악 및 시각적 추론
문맥 이해: 이미지 내 정보의 고차원적 독해
향후 비전 및 다짐
"단순히 글자를 읽는 것을 넘어, 문맥을 이해하고 정교하게 정보를 추출하는 기술력을 바탕으로 고객사들께 더욱 혁신적인 솔루션을 제공하겠습니다." 함께 밤낮으로 고생하며 최고의 결과물을 만들어낸 우리 팀원들 모두 자랑스럽습니다! KDL은 여기서 멈추지 않고, AI 기술의 한계를 깨기 위한 도전을 계속해 나가겠습니다.
리더보드 확인하기: OCRBench v2 공식 링크
댓글을 남기려면 로그인이 필요합니다.
로그인 후 이 페이지로 돌아와 바로 댓글을 남길 수 있습니다.
