KoBERT 네이버 리뷰 분류 모델 (PyTorch 기반) 실습!
·
딥러닝|머신러닝/SKT KoBERT
naver_review_classifications_pytorch_kobert 코드입니다. 자세한 사항은 아래의 KoBERT Git에 들어가시면 나와있습니다!https://github.com/SKTBrain/KoBERT?tab=readme-ov-file#using-with-pytorch GitHub - SKTBrain/KoBERT: Korean BERT pre-trained cased (KoBERT)Korean BERT pre-trained cased (KoBERT). Contribute to SKTBrain/KoBERT development by creating an account on GitHub.github.com아래는 제가 사용하기 위해 수정이 포함된 코드입니다. 코드import torchfrom..
KoBERT 네이버 리뷰 분류 모델 (MXNet, PyTorch 기반) 분석
·
딥러닝|머신러닝/SKT KoBERT
마지막으로 NSMC폴더 안에 있는 예제 파일에 대해 알아보도록 하겠습니다!KoBERT 네이버 리뷰 분류 모델 (MXNet 기반) 분석이 naver_review_classifications_gluon_kobert 파일은 KoBERT를 활용하여 네이버 리뷰를 분류하는 모델을 MXNet(Gluon) 기반으로 학습하는 코드입니다. 주요 기능을 정리하면 다음과 같습니다. 1. 패키지 설치 및 모델 불러오기설치 및 임포트 코드!pip install ipywidgets # for vscode!pip install git+https://git@github.com/SKTBrain/KoBERT.git@master설명ipywidgets 설치 → Jupyter Notebook 인터랙티브 기능 활용KoBERT 관련 라이브러리..
KoBERT HF의 kobert_tokenizer 폴더 역할 분석
·
딥러닝|머신러닝/SKT KoBERT
kobert_tokenizer 폴더는 KoBERT 모델의 토크나이저를 정의하고 관리하는 역할을 합니다. 토크나이저는 입력 텍스트를 KoBERT 모델이 이해할 수 있는 토큰 ID로 변환하는 핵심 요소입니다. 1. __init__.py (패키지 초기화)역할kobert_tokenizer.py 내의 KoBERTTokenizer 클래스를 외부에서 쉽게 사용할 수 있도록 합니다.핵심 코드from .kobert_tokenizer import KoBERTTokenizer설명kobert_tokenizer.py에서 KoBERTTokenizer 클래스를 가져옵니다.이를 통해 외부에서 KoBERTTokenizer를 from kobert_tokenizer import KoBERTTokenizer 형태로 호출할 수 있습니다람쥐...
KoBERT 폴더 파일 분석 및 정리
·
딥러닝|머신러닝/SKT KoBERT
https://newkimjiwon.tistory.com/341/#comment26029409 KoBERT utils 폴더 분석 및 정리KoBERT 모델을 활용할 때, utils 폴더는 AWS S3에서 필요한 리소스(특히 토크나이저)를 다운로드하고 관리하는 역할을 합니다. 이 글에서는 utils 폴더의 핵심 파일들을 분석하고, 주요 기능을 설명합newkimjiwon.tistory.com이 폴더의 상위 폴더인 KoBERT 폴더에 있는 파일들에 대해서 알아보도록 하겠습니다.KoBERT 폴더 파일 분석 및 정리KoBERT 폴더에는 다양한 버전의 KoBERT 모델을 제공하는 파일들이 포함되어 있습니다. 이 글에서는 각 파일의 역할과 핵심 코드들을 분석하여 정리합니다. 1. __init__.py (패키지 초기화)..
KoBERT utils 폴더 분석 및 정리
·
딥러닝|머신러닝/SKT KoBERT
KoBERT 모델을 활용할 때, utils 폴더는 AWS S3에서 필요한 리소스(특히 토크나이저)를 다운로드하고 관리하는 역할을 합니다. 이 글에서는 utils 폴더의 핵심 파일들을 분석하고, 주요 기능을 설명합니다. 1. __init__.py (패키지 초기화)역할utils 폴더를 Python 패키지로 인식할 수 있도록 설정합니다.download() 및 get_tokenizer() 함수를 외부에서 쉽게 호출할 수 있도록 가져옵니다.핵심 코드from kobert.utils.utils import download, get_tokenizerdownload(): S3에서 KoBERT 관련 파일을 다운로드하는 기능get_tokenizer(): KoBERT 토크나이저를 다운로드하여 로컬에 저장하는 기능 2. aws..
한국어에 최적화된 SK텔레콤의 KoBERT 모델
·
딥러닝|머신러닝/SKT KoBERT
https://github.com/SKTBrain/KoBERT?tab=readme-ov-file#korean-bert-pre-trained-cased-kobert GitHub - SKTBrain/KoBERT: Korean BERT pre-trained cased (KoBERT)Korean BERT pre-trained cased (KoBERT). Contribute to SKTBrain/KoBERT development by creating an account on GitHub.github.com오픈 소스로 GitHub에서 clone를 받으셔서 사용하실 수 있습니다.KoBERT 모델 소개 및 역할KoBERT는 SK텔레콤의 AI 연구팀인 SKTBrain에서 개발한 한국어 특화 BERT(Bidirection..
김치바보