본 자료는 2023년 1월 8일 기준이다.
표 인식 기능을 활용하기 위해서, 네이버 Cloud Platform내에 CLOVA OCR을 활용해보도록 한다.
전체 Step은 다음과 같다.
1. Naver CLOVA 가입
-----------------------------------------------여기부터는 콘솔이라는 곳에서 행해진다.
2. CLOVA OCR 사용 신청 → 도메인 생성
3. API Gateway 사용 신청
4. Clova OCR → 도메인 → Text OCR 클릭 → 자동연동→ Postman등 request보낼 수 있는 곳에서 test 진행.
** 막상 일부 진행하고 나니, 굳이 표로 인식할 필요는 없는 것 같다. text로 인식하는게 더 저렴하기도하고, 그정도만 해도 충분할 듯 하다.(차차 생각해보자.)
1. Naver CLOVA 가입은 쉬우니 넘어간다.
2. 이용신청 후 도메인 생성
- CLOVA OCR은 도메인별 서비스 플랜에 따라 요금 부과함.
- General OCR 및 Free 서비스 플랜 제외한 모든 서비스 플랜은 CLOVA OCR API 호출하지 않아도 기본 유지 비용 발생한다.
사용하는 서비스가 General OCR이기 때문에 기본 유지비용은 발생하지 않는다.
* 도메인까지 생성했으면, Demo test가 가능하다.Test 할 때에도 API 1회 호출 비용이 발생한다.(Domain 가장 오른쪽에 아래와 같이 있으니 확인 ㄱㄱ)
test이미지 및 결과. 필기체가 아니라 그런가 진짜 인식 잘한다.
3. API Gateway 연동 : API Gateway 이용신청
OCR이용신청과 마찬가지로 진행한다.
4. CLOVA OCR에서 자동 연동으로 API 생성(Domain, Text OCR 에서 자동연동 클릭) → Postman에서 테스트(multipart-form data로)
1) 자동 연동 클릭 후 invokeURL을 url창에 입력
2) 생성된 key를 Headers에 설정해준다. : key는 보안 정보이므로 github 에 올릴때 주의가 필요하다.
실수로 올렸을 경우 당황하지 말고, Secret key를 다시 생성해준다.
요청을 SEND하면 아래와 같은 결과를 얻게 된다.
자세한 사용방법은
여기 참고 : https://api.ncloud-docs.com/docs/ai-application-service-ocr-ocr
{
"version": "V1",
"requestId": "string",
"timestamp": 1673275628675,
"images": [
{
"uid": "d2a626f6b17f47858e40be2954c7ba7e",
"name": "medium",
"inferResult": "SUCCESS",
"message": "SUCCESS",
"validationResult": {
"result": "NO_REQUESTED"
},
"fields": [
{
"valueType": "ALL",
"boundingPoly": {
"vertices": [
{
"x": 141.0,
"y": 0.0
},
{
"x": 288.0,
"y": 0.0
},
{
"x": 288.0,
"y": 62.0
},
{
"x": 141.0,
"y": 62.0
}
]
},
"inferText": "부분",
"inferConfidence": 1.0
},
{
"valueType": "ALL",
"boundingPoly": {
"vertices": [
요금
OCR API 이용 및 제공 기능. * 이미지 파일은 20 MB이하로 제한.
문자를 인식할 이미지 데이터를 RESTful API 방식으로 CLOVA OCR에 전달하면 해당 이미지를 분석하여 추출한 텍스트 데이터를 JSON 형태로 제공한다.
- 지원하는 이미지 파일 형식 : *.jpg, *.png, *.pdf, *.tiffF (추가 예정) |
- 지정한 영역의 문자를 추출하여 템플릿에 맞게 정형화된 결과로 전송 가능 - OCR 빌더에서 다양한 인식 템플릿 설정 및 배포 가능 |
검증 연동 End-point를 제공하여 검증이 필요한 이미지의 판독 값을 외부 검증 서버와 연결 가능 |
글자 입력 칸을 여러 개 조합하여 인식 가능 <예시> 우편 번호 |
체크박스 체크 여부 인식 가능 |
기존 템플릿 설정값을 복사하여 새로운 도메인 생성 및 플랜 변경 가능 |
표 관련 요금 확인 - (프리미엄 - General)
글자 추출 | 100회 이하 | 호출수 당 | 무료 |
글자 추출 | 100회 초과 | 호출수 당 | 3 원 |
표 추출 | 100회 이하 | 호출수 당 | 무료 |
표 추출 | 100회 초과 | 호출수 당 | 22 원 |
* 표 추출 시 글자 추출이 동시에 호출되어 1건당 25원이 청구된다.(표 22원 + 글자 3원)
* 최대 100만 건까지 호출 가능.
이외에도 특정 Template에 맞게 추출하는 Template OCR과
영수증, 신용카드, 명함, 사업자등록증, 신분증 등을 인식하는 Document OCR
기능을 제공하고 있다.
* InvokeURL : 각 도메인별로 고유한 값으로, 외부 서비스에 바로 공개하지 않고 반드시 API Gateway와 연동해 사용하도록 설계되어 있음.
도메인의 OCR InvokeURL 확인 → API GateWay의 Endpoint로 연결 → 외부 연동
API Gateway요금
* API Gateway 요금은 API 호출 요금과 네트워크 전송량 및 캐시 사용량을 합산해 부과합니다.
* 엔드포인트를 네이버 클라우드 플랫폼 상품으로 지정하실 경우 별도의 네트워크 요금이 발생할 수 있습니다.(부가세 별도)
API 콜수 : 기본제공 (1,000,000 건) | 0 원 |
API 콜수 : API Call | 0.004원 / 건 |
데이터 전송 : 기본제공 (1GB 이하) | 0 원 |
데이터 전송 : 용량 (1GB 당) | 100 원 |
캐시 : 용량 (10MB 당) | 0.5원 / 시간 |
이러한 서비스 사용 시 항상 요금을 주의하자! 그리고 key값 관리를 잘해야하겠다.
참고
CLOVA OCR 상세
https://www.ncloud.com/product/aiService/ocr
네이버 CLOVA OCR Document
https://guide.ncloud-docs.com/docs/ko/clovaocr-domain
API Gateway
댓글