프로젝트/표뽑( 표를 뽑아본다.)

[표뽑] OCR - 표 인식 (feat. Naver CLOVA OCR)

디벨로펄 2023. 1. 9.
반응형

본 자료는 2023년 1월 8일 기준이다.

 

표 인식 기능을 활용하기 위해서, 네이버 Cloud Platform내에 CLOVA OCR을 활용해보도록 한다.

전체 Step은 다음과 같다.

1. Naver CLOVA 가입

-----------------------------------------------여기부터는 콘솔이라는 곳에서 행해진다.

2. CLOVA OCR 사용 신청 → 도메인 생성

3. API Gateway 사용 신청 

4. Clova OCR → 도메인 → Text OCR 클릭 → 자동연동→ Postman등 request보낼 수 있는 곳에서 test 진행.

 

 

 

** 막상 일부 진행하고 나니, 굳이 표로 인식할 필요는 없는 것 같다. text로 인식하는게 더 저렴하기도하고, 그정도만 해도 충분할 듯 하다.(차차 생각해보자.)


1. Naver CLOVA 가입은 쉬우니 넘어간다.

 

2. 이용신청 후 도메인 생성

- CLOVA OCR은 도메인별 서비스 플랜에 따라 요금 부과함.

- General OCR 및 Free 서비스 플랜 제외한 모든 서비스 플랜은 CLOVA OCR API 호출하지 않아도 기본 유지 비용 발생한다.

 

사용하는 서비스가 General OCR이기 때문에 기본 유지비용은 발생하지 않는다.

* 도메인까지 생성했으면, Demo test가 가능하다.Test 할 때에도 API 1회 호출 비용이 발생한다.(Domain 가장 오른쪽에 아래와 같이 있으니 확인 ㄱㄱ)

test이미지 및 결과. 필기체가 아니라 그런가 진짜 인식 잘한다.

 

3. API Gateway 연동 : API Gateway 이용신청 

OCR이용신청과 마찬가지로 진행한다.

 

4. CLOVA OCR에서 자동 연동으로 API 생성(Domain, Text OCR 에서 자동연동 클릭) → Postman에서 테스트(multipart-form data로)

1) 자동 연동 클릭 후 invokeURL을 url창에 입력

2) 생성된 key를 Headers에 설정해준다. : key는 보안 정보이므로 github 에 올릴때 주의가 필요하다.

실수로 올렸을 경우 당황하지 말고, Secret key를 다시 생성해준다.

url 및 message, file 설정.
key값 설정

요청을 SEND하면 아래와 같은 결과를 얻게 된다.

자세한 사용방법은

여기 참고 : https://api.ncloud-docs.com/docs/ai-application-service-ocr-ocr

더보기
{
    "version": "V1",
    "requestId": "string",
    "timestamp": 1673275628675,
    "images": [
        {
            "uid": "d2a626f6b17f47858e40be2954c7ba7e",
            "name": "medium",
            "inferResult": "SUCCESS",
            "message": "SUCCESS",
            "validationResult": {
                "result": "NO_REQUESTED"
            },
            "fields": [
                {
                    "valueType": "ALL",
                    "boundingPoly": {
                        "vertices": [
                            {
                                "x": 141.0,
                                "y": 0.0
                            },
                            {
                                "x": 288.0,
                                "y": 0.0
                            },
                            {
                                "x": 288.0,
                                "y": 62.0
                            },
                            {
                                "x": 141.0,
                                "y": 62.0
                            }
                        ]
                    },
                    "inferText": "부분",
                    "inferConfidence": 1.0
                },
                {
                    "valueType": "ALL",
                    "boundingPoly": {
                        "vertices": [

 


 

요금

 

OCR API 이용 및 제공 기능. * 이미지 파일은 20 MB이하로 제한.

문자를 인식할 이미지 데이터를 RESTful API 방식으로 CLOVA OCR에 전달하면 해당 이미지를 분석하여 추출한 텍스트 데이터를 JSON 형태로 제공한다.

- 지원하는 이미지 파일 형식 : *.jpg, *.png, *.pdf, *.tiffF (추가 예정)
- 지정한 영역의 문자를 추출하여 템플릿에 맞게 정형화된 결과로 전송 가능
- OCR 빌더에서 다양한 인식 템플릿 설정 및 배포 가능
검증 연동 End-point를 제공하여 검증이 필요한 이미지의 판독 값을 외부 검증 서버와 연결 가능
글자 입력 칸을 여러 개 조합하여 인식 가능
<예시> 우편 번호
체크박스 체크 여부 인식 가능
기존 템플릿 설정값을 복사하여 새로운 도메인 생성 및 플랜 변경 가능

 

표 관련 요금 확인 - (프리미엄 - General)
글자 추출 100회 이하 호출수 당 무료
글자 추출 100회 초과 호출수 당 3 원
표 추출 100회 이하 호출수 당 무료
표 추출 100회 초과 호출수 당 22 원

* 표 추출 시 글자 추출이 동시에 호출되어 1건당 25원이 청구된다.(표 22원 + 글자 3원)

* 최대 100만 건까지 호출 가능.

 

이외에도 특정 Template에 맞게 추출하는 Template OCR과

영수증, 신용카드, 명함, 사업자등록증, 신분증 등을 인식하는 Document OCR

기능을 제공하고 있다.

 

 

 


* InvokeURL : 각 도메인별로 고유한 값으로, 외부 서비스에 바로 공개하지 않고 반드시 API Gateway와 연동해 사용하도록 설계되어 있음.

도메인의 OCR InvokeURL  확인 → API GateWay의 Endpoint로 연결 → 외부 연동

 

API Gateway요금

 

* API Gateway 요금은 API 호출 요금과 네트워크 전송량 및 캐시 사용량을 합산해 부과합니다.
* 엔드포인트를 네이버 클라우드 플랫폼 상품으로 지정하실 경우 별도의 네트워크 요금이 발생할 수 있습니다.(부가세 별도)

API 콜수 : 기본제공 (1,000,000 건) 0 원
API 콜수API Call 0.004원 / 건
데이터 전송 : 기본제공 (1GB 이하) 0 원
데이터 전송 : 용량 (1GB 당) 100 원
캐시 : 용량 (10MB 당) 0.5원 / 시간

 

이러한 서비스 사용 시 항상 요금을 주의하자! 그리고 key값 관리를 잘해야하겠다.

 

 

참고

CLOVA OCR  상세 

https://www.ncloud.com/product/aiService/ocr

네이버 CLOVA OCR Document

https://guide.ncloud-docs.com/docs/ko/clovaocr-domain

API Gateway

https://www.ncloud.com/charge/region/ko

반응형

댓글