본 게시글에서는 문서 OCR, 레이아웃 분석, 표 인식 등 다양한 기능을 제공하는 Surya 모델의 설치 및 활용 방법을 안내해 드리고자 합니다. 본 가이드에서는 효율적인 개발 환경 관리를 위해 Poetry라는 도구를 활용하는 방법을 중점적으로 다룹니다.
1. Surya 모델 개요 및 라이선스 정책
Surya는 90개 이상의 언어를 지원하며, 텍스트 인식은 물론 문서의 레이아웃, 표, 이미지, 헤더 등 복잡한 구조를 분석하는 데 특화된 강력한 인공지능 툴킷입니다.
- 코드: GPL 라이선스를 따르며, 코드를 수정 및 배포할 경우 동일한 라이선스가 적용됩니다.
- 모델 가중치: 개인 학습 및 비영리 목적으로는 자유롭게 사용할 수 있습니다. 상업적 용도로 사용하기 위해서는 특정 매출 및 투자금 기준을 충족해야 하며, 그 이상의 경우에는 별도의 상업용 라이선스 계약이 필요합니다.
개인적인 연구 및 학습 목적이라면 라이선스 제한 없이 자유롭게 활용하실 수 있습니다.
2. Poetry를 이용한 설치 준비 (Window)
Surya 프로젝트는 Poetry를 사용하여 의존성 패키지를 관리합니다. Poetry는 가상 환경 생성부터 패키지 관리까지 효율적으로 처리해주어 개발 과정을 간소화합니다.
먼저, PowerShell을 관리자 권한으로 실행한 후 다음 명령어를 통해 Poetry를 설치합니다.
(Invoke-WebRequest -Uri https://install.python-poetry.org -UseBasicParsing).Content | python -
Poetry 설치 후 명령어가 인식되지 않을 경우, 다음 명령어로 Poetry의 실행 경로를 시스템 PATH 환경 변수에 추가해야 합니다.
[Environment]::SetEnvironmentVariable("Path", [Environment]::GetEnvironmentVariable("Path", "User") + ";$env:USERPROFILE\AppData\Roaming\Python\Scripts", "User")
간혹가다가 환경 변수 적용이 안되시는 분은 PowerShell을 관리자 모드로 들어가셔서 해보시면 잘 될 수 있을 겁니다.
위 명령어 실행 후 새로운 PowerShell 창을 열어 poetry --version 명령어를 입력하여 Poetry가 정상적으로 인식되는지 확인합니다.
3. Surya 프로젝트 의존성 설치
Surya 프로젝트 폴더로 이동한 후, 다음 명령어를 실행하여 Poetry가 pyproject.toml에 명시된 모든 의존성 패키지를 자동으로 설치하도록 합니다.
# surya 프로젝트 폴더로 이동
cd /path/to/your/surya
# 의존성 패키지 설치
poetry install --with dev
이 명령어는 필수 패키지 외에 개발 환경에 필요한 패키지들도 함께 설치합니다.
4. Surya 모델 실행 및 활용
설치가 완료되면, poetry run 명령어를 통해 Surya의 다양한 기능을 실행할 수 있습니다.
1) PDF 파일에서 텍스트 추출
PDF 파일의 텍스트를 인식하고 위치 정보를 추출하려면 surya_ocr 명령어를 사용합니다.
poetry run surya_ocr your_document.pdf
your_document.pdf를 실제 파일 경로로 대체하여 실행하면, 결과물이 results.json 파일에 저장됩니다.
2) 대화형 애플리케이션 실행
Surya는 PDF 또는 이미지 파일을 업로드하여 기능을 직접 체험해볼 수 있는 대화형 웹 애플리케이션을 제공합니다.
poetry run surya_gui
이 명령어를 실행하면 밑에 주소 창이 나올텐데 로컬 호스트 주소를 입력해서 들어가시면 됩니다.
3) GPU 활용
Surya는 GPU를 사용하여 처리 속도를 크게 향상시킬 수 있습니다. PyTorch가 설치된 환경에서 GPU를 자동으로 감지하지만, 수동으로 GPU 사용을 명시하려면 다음 환경 변수를 설정할 수 있습니다.
# Windows PowerShell
$env:TORCH_DEVICE="cuda"'Tools & Setup > Setting' 카테고리의 다른 글
| Google Antigravity 설치 방법 정리 (0) | 2025.11.27 |
|---|---|
| 자바 OpenJDK 17을 설치 윈도우(Windows) (0) | 2025.09.05 |
| 윈도우 -> 윈도우 WSL 접속 (1) | 2025.08.07 |
| 윈도우 WSL(Windows Subsystem for Linux) 설치 및 사용법 정리 (2) | 2025.08.07 |
| Docker 설치 방법 (Windows 11 기준) (0) | 2025.05.13 |