GCP 서버에 (Flask + Gunicorn) + KoBERT + Whisper 기반 음성피싱 탐지 시스템 구축기
·
Backend & Infra/Docker | Podman
1. 개요본 프로젝트는 음성 기반 피싱 탐지 시스템을 Flask API 형태로 구축하고,이를 GCP 서버에 Docker로 배포하는 데에 목적이 있었습니다.KoBERT를 활용한 텍스트 분류, Whisper 기반 음성 인식(STT),그리고 Gunicorn을 통한 서버 실행 환경을 통합하였습니다.이 과정에서 발생한 주요 이슈와 그 해결 방법을 정리하였습니다. 2. 시스템 구성운영 환경: Google Cloud Platform (Ubuntu 22.04 LTS)배포 방식: Docker + Gunicorn + Flask모델:monologg/kobert (텍스트 분류용)openai/whisper base 모델 (음성 인식용)포트: 5000번 외부 개방추론 방식: Whisper + KoBERT 앙상블 기반 예측 3. ..
KoBERT 네이버 리뷰 분류 모델 (PyTorch 기반) 실습!
·
Artificial Intelligence/SKT KoBERT
naver_review_classifications_pytorch_kobert 코드입니다. 자세한 사항은 아래의 KoBERT Git에 들어가시면 나와있습니다!https://github.com/SKTBrain/KoBERT?tab=readme-ov-file#using-with-pytorch GitHub - SKTBrain/KoBERT: Korean BERT pre-trained cased (KoBERT)Korean BERT pre-trained cased (KoBERT). Contribute to SKTBrain/KoBERT development by creating an account on GitHub.github.com아래는 제가 사용하기 위해 수정이 포함된 코드입니다. 코드import torchfrom..
KoBERT 네이버 리뷰 분류 모델 (MXNet, PyTorch 기반) 분석
·
Artificial Intelligence/SKT KoBERT
마지막으로 NSMC폴더 안에 있는 예제 파일에 대해 알아보도록 하겠습니다!KoBERT 네이버 리뷰 분류 모델 (MXNet 기반) 분석이 naver_review_classifications_gluon_kobert 파일은 KoBERT를 활용하여 네이버 리뷰를 분류하는 모델을 MXNet(Gluon) 기반으로 학습하는 코드입니다. 주요 기능을 정리하면 다음과 같습니다. 1. 패키지 설치 및 모델 불러오기설치 및 임포트 코드!pip install ipywidgets # for vscode!pip install git+https://git@github.com/SKTBrain/KoBERT.git@master설명ipywidgets 설치 → Jupyter Notebook 인터랙티브 기능 활용KoBERT 관련 라이브러리..
KoBERT HF의 kobert_tokenizer 폴더 역할 분석
·
Artificial Intelligence/SKT KoBERT
kobert_tokenizer 폴더는 KoBERT 모델의 토크나이저를 정의하고 관리하는 역할을 합니다. 토크나이저는 입력 텍스트를 KoBERT 모델이 이해할 수 있는 토큰 ID로 변환하는 핵심 요소입니다. 1. __init__.py (패키지 초기화)역할kobert_tokenizer.py 내의 KoBERTTokenizer 클래스를 외부에서 쉽게 사용할 수 있도록 합니다.핵심 코드from .kobert_tokenizer import KoBERTTokenizer설명kobert_tokenizer.py에서 KoBERTTokenizer 클래스를 가져옵니다.이를 통해 외부에서 KoBERTTokenizer를 from kobert_tokenizer import KoBERTTokenizer 형태로 호출할 수 있습니다람쥐...
KoBERT 폴더 파일 분석 및 정리
·
Artificial Intelligence/SKT KoBERT
https://newkimjiwon.tistory.com/341/#comment26029409 KoBERT utils 폴더 분석 및 정리KoBERT 모델을 활용할 때, utils 폴더는 AWS S3에서 필요한 리소스(특히 토크나이저)를 다운로드하고 관리하는 역할을 합니다. 이 글에서는 utils 폴더의 핵심 파일들을 분석하고, 주요 기능을 설명합newkimjiwon.tistory.com이 폴더의 상위 폴더인 KoBERT 폴더에 있는 파일들에 대해서 알아보도록 하겠습니다.KoBERT 폴더 파일 분석 및 정리KoBERT 폴더에는 다양한 버전의 KoBERT 모델을 제공하는 파일들이 포함되어 있습니다. 이 글에서는 각 파일의 역할과 핵심 코드들을 분석하여 정리합니다. 1. __init__.py (패키지 초기화)..
KoBERT utils 폴더 분석 및 정리
·
Artificial Intelligence/SKT KoBERT
KoBERT 모델을 활용할 때, utils 폴더는 AWS S3에서 필요한 리소스(특히 토크나이저)를 다운로드하고 관리하는 역할을 합니다. 이 글에서는 utils 폴더의 핵심 파일들을 분석하고, 주요 기능을 설명합니다. 1. __init__.py (패키지 초기화)역할utils 폴더를 Python 패키지로 인식할 수 있도록 설정합니다.download() 및 get_tokenizer() 함수를 외부에서 쉽게 호출할 수 있도록 가져옵니다.핵심 코드from kobert.utils.utils import download, get_tokenizerdownload(): S3에서 KoBERT 관련 파일을 다운로드하는 기능get_tokenizer(): KoBERT 토크나이저를 다운로드하여 로컬에 저장하는 기능 2. aws..
한국어에 최적화된 SK텔레콤의 KoBERT 모델
·
Artificial Intelligence/SKT KoBERT
https://github.com/SKTBrain/KoBERT?tab=readme-ov-file#korean-bert-pre-trained-cased-kobert GitHub - SKTBrain/KoBERT: Korean BERT pre-trained cased (KoBERT)Korean BERT pre-trained cased (KoBERT). Contribute to SKTBrain/KoBERT development by creating an account on GitHub.github.com오픈 소스로 GitHub에서 clone를 받으셔서 사용하실 수 있습니다.KoBERT 모델 소개 및 역할KoBERT는 SK텔레콤의 AI 연구팀인 SKTBrain에서 개발한 한국어 특화 BERT(Bidirection..
김치바보
'kobert' 태그의 글 목록