OCR

· 프로젝트
OCR은 광학 문자 인식(Optical character recognition)으로, 이미지에서 문자를 추출해 컴퓨터에서 편집가능한 문자 형식으로 변환하는 것입니다. OCR 관련 논문과 여러 모델들을 찾아보며 알게된 사실이 있습니다. 바로 OCR은 Detection 모델과 Recognition 모델이 결합한 모델이라는 것입니다. 저희는 대표적인 오픈소스 모델인 tesseract, PaddleOCR, EasyOCR을 비교해보았습니다. 이들을 같은 사진으로 여러번 비교해본 결과, EasyOCR이 가장 정확하게 변환했고 EasyOCR을 fine-tunning하기로 결정했습니다. 모델에 대한 설명은 생략하겠습니다. easyocr을 훈련시키는 방법을 찾아봤더니 대부분 네이버 ClovaAI에서 제공하는 deep-t..
· 프로젝트
2023년 1월부터 6월까지 디지털스마트부산아카데미(DSBA)에서 3, 4월 동안 진행한 예비프로젝트에 대해 이제야 정리해봅니다. 우리 팀은 AI프로젝트 주제로 헬스케어가 주어졌습니다. 그래서 어떤 서비스를 만들지 팀원들과 찾고 열띤 토론을 했습니다. 저희는 '혼자서 할 수 있는 헬스케어'를 서비스 방향으로 정했습니다. 러닝 자세교정 서비스 노래로하는 심리치료 피부타입별 화장품 성분에 따른 추천 서비스 여러 아이디어 중 이 세가지로 좁혀졌고 각각 적용될 AI모델이 뭔지, 그리고 필요한 데이터를 구할수 있는지, 또 데이터 양은 충분히 많은지 하나씩 조사했습니다. 러닝 자세교정 서비스는 사용자가 뛰는 영상이 AI의 input데이터인데, 문제는 전면, 측면 영상이 필요하지만 혼자서 찍기어렵다는 것이었습니다. ..
siwoli
'OCR' 태그의 글 목록