본문 바로가기
AI/파이토치(Pytorch)

[Pytorch][BERT] 버트 소스코드 이해

by Hyen4110 2022. 7. 5.

[Pytorch][BERT] 버트 소스코드 이해 목차

BERT 👀 📑 BERT Config    
  📑 BERT Tokenizer      
  📑 BERT Model 📑 BERT Input    
    📑 BERT Output    
    📑 BERT Embedding    
    📑 BERT Pooler    
    📑 BERT Enocder 📑 BERT Layer 📑 BERT SelfAttention
        📑 BERT SelfOtput

 

✅ 기본적인 Bert 모델의 사용은 아래 코드와 같다

: Tokenizer로 BertModel의 입력값을 만든 후, 넣어서 출력값 생성

from transformers import BertTokenizer, BertModel
import torch

tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
model = BertModel.from_pretrained("bert-base-uncased")

inputs = tokenizer("Hello, my dog is cute", return_tensors="pt")
outputs = model(**inputs)

last_hidden_states = outputs.last_hidden_state

 

✅ BERT의 메인 3가지 클래스  이해

 

1. BertConfig 

2022.07.05 - [파이토치(Pytorch)] - [Pytorch][BERT] 소스 코드 이해_BertConfig(configuration_bert.py)

 

[Pytorch][BERT] 소스 코드 이해_BertConfig(configuration_bert.py)

<소스 코드> class BertConfig(PretrainedConfig): def __init__( self, vocab_size=30522, hidden_size=768, num_hidden_layers=12, num_attention_heads=12, intermediate_size=3072, hidden_act="gelu", hidden..

hyen4110.tistory.com

2. BertTokenizer

2022.07.05 - [파이토치(Pytorch)] - [Pytorch][BERT] 소스 코드 이해_BertTokenizer (tokenization_bert.py)

 

[Pytorch][BERT] 소스 코드 이해_BertTokenizer (tokenization_bert.py)

1. BertTokenizer? Tokenizer 정의: 주어진 코퍼스(corpus)에서 토큰(token)이라 불리는 단위로 나누는 작업 BertTokenizer는 무엇이 특별한가? WordPiece Tokenizer(BPE의 변형 알고리즘) 적용 BPE(Byte Pair Enc..

hyen4110.tistory.com

 

3. BertModel

2022.07.05 - [파이토치(Pytorch)] - [Pytorch][BERT] 소스 코드 이해_ BertModel (modeling_bert.py)


<source code>

transformers/modeling_bert.py at v4.20.1 · huggingface/transformers

 

GitHub - huggingface/transformers: 🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX. - GitHub - huggingface/transformers: 🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, a...

github.com

댓글