토토 베이는 자체 개발한 AI-OCR을 사용하여 명함을 데이터로 변환합니다
기능
명함 이미지를 입력하면 회사명, 성과 이름, 주소 등 각 항목에 대한 텍스트 정보를 읽어 구조화된 데이터로 출력할 수 있습니다

개발
AI 모델 및 학습 방법
OSS에 공개된 딥러닝 비전 및 언어 모델을 기반으로 부분적으로 맞춤화하고 명함 데이터를 활용한 엔드투엔드 학습을 수행합니다
따라서 훈련 데이터로는 입력에 해당하는 "명함 이미지"와 출력에 해당하는 "최종 데이터"만 있으면 되며, 토토 베이의 AI-OCR은 엔드투엔드 학습에 매우 적합합니다
명함에는 형식이 있는 것처럼 보이지만 실제로는 그렇지 않습니다 (매장 명함에 이름이 없고, 회사명 등에 해당하는 기관명이 많아 식별이 어렵습니다)
학습 최적화
물론 매개변수 튜닝 등이 이루어지겠지만 중요한 점은 Tokenizer가 지원하는 토큰 콘텐츠입니다
기타
이번 AI-OCR 개발은 개발 시작 후 약 반년이라는 짧은 기간에 개발되어 실용화되었습니다
이해해 주셔서 감사합니다

