허깅페이스의 트랜스포머 🤗 Huggingface's Transformers

자연어 처리/Today I learned :

허깅페이스의 트랜스포머 🤗 Huggingface's Transformers

주영 🐱 2023. 1. 16. 17:18

728x90

이번에는 Huggingface에서 제공하는 Transformers에 대하여 알아보고자 합니다.

https://huggingface.co/docs/transformers/index

자연어 처리 관련 여러 라이브러리가 있지만 Transformer를 활용한 자연어 처리 task에서 가장 많이 활용되고 있는 라이브러리는 transformers입니다.
pytorch version의 BERT를 가장 먼저 구현하며 주목받았던 huggingface는 현재 transformer기반의 다양한 모델들은 구현 및 공개하며 많은 주목을 받고 있습니다.(아래 주소에서 다양한 모델들을 확인 가능합니다)
https://huggingface.co/models
제시된 모델 이외에도 custom model을 업로드하여 사용할 수 있습니다.

Configuration- 모델 명세, 모델의 정보 https://huggingface.co/transformers/main_classes/configuration.html

AutoConfig에서는 다양한 모델의 configuration (환경 설정)을 string tag를 이용해 쉽게 load할 수 있습니다.
각 Config에는 해당 모델 architecture와 task에 필요한 다양한 정보(architecture 종류, 레이어 수, hidden unit size, hyperparameter)를 담고 있습니다.
https://huggingface.co/models 에서 해당 모델들의 name tag를 확인할 수 있습니다.
아래 예시의 경우 - https://huggingface.co/bert-base-uncased

from transformers import AutoConfig

config = AutoConfig.from_pretrained('bert-base-uncased')
config

#Result
BertConfig {
  "_name_or_path": "bert-base-uncased",
  "architectures": [
    "BertForMaskedLM"
  ],
  "attention_probs_dropout_prob": 0.1,
  "classifier_dropout": null,
  "gradient_checkpointing": false,
  "hidden_act": "gelu",
  "hidden_dropout_prob": 0.1,
  "hidden_size": 768,
  "initializer_range": 0.02,
  "intermediate_size": 3072,
  "layer_norm_eps": 1e-12,
  "max_position_embeddings": 512,
  "model_type": "bert",
  "num_attention_heads": 12,
  "num_hidden_layers": 12,
  "pad_token_id": 0,
  "position_embedding_type": "absolute",
  "transformers_version": "4.25.1",
  "type_vocab_size": 2,
  "use_cache": true,
  "vocab_size": 30522
}

https://huggingface.co/gpt2

gpt_config = AutoConfig.from_pretrained('gpt2')
gpt_config

#Result
GPT2Config {
  "_name_or_path": "gpt2",
  "activation_function": "gelu_new",
  "architectures": [
    "GPT2LMHeadModel"
  ],
  "attn_pdrop": 0.1,
  "bos_token_id": 50256,
  "embd_pdrop": 0.1,
  "eos_token_id": 50256,
  "initializer_range": 0.02,
  "layer_norm_epsilon": 1e-05,
  "model_type": "gpt2",
  "n_ctx": 1024,
  "n_embd": 768,
  "n_head": 12,
  "n_inner": null,
  "n_layer": 12,
  "n_positions": 1024,
  "reorder_and_upcast_attn": false,
  "resid_pdrop": 0.1,
  "scale_attn_by_inverse_layer_idx": false,
  "scale_attn_weights": true,
  "summary_activation": null,
  "summary_first_dropout": 0.1,
  "summary_proj_to_labels": true,
  "summary_type": "cls_index",
  "summary_use_proj": true,
  "task_specific_params": {
    "text-generation": {
      "do_sample": true,
      "max_length": 50
    }
  },
  "transformers_version": "4.25.1",
  "use_cache": true,
  "vocab_size": 50257
}

print(config.vocab_size)

30522

config_dict = config.to_dict()
config_dict

#Result
{'return_dict': True,
 'output_hidden_states': False,
 'output_attentions': False,
 'torchscript': False,
 'torch_dtype': None,
 'use_bfloat16': False,
 'tf_legacy_loss': False,
 'pruned_heads': {},
 'tie_word_embeddings': True,
 'is_encoder_decoder': False,
 'is_decoder': False,
 'cross_attention_hidden_size': None,
 'add_cross_attention': False,
 'tie_encoder_decoder': False,
 'max_length': 20,
 'min_length': 0,
 'do_sample': False,
 'early_stopping': False,
 'num_beams': 1,
 'num_beam_groups': 1,
 'diversity_penalty': 0.0,
 'temperature': 1.0,
 'top_k': 50,
 'top_p': 1.0,
 'typical_p': 1.0,
 'repetition_penalty': 1.0,
 'length_penalty': 1.0,
 'no_repeat_ngram_size': 0,
 'encoder_no_repeat_ngram_size': 0,
 'bad_words_ids': None,
 'num_return_sequences': 1,
 'chunk_size_feed_forward': 0,
 'output_scores': False,
 'return_dict_in_generate': False,
 'forced_bos_token_id': None,
 'forced_eos_token_id': None,
 'remove_invalid_values': False,
 'exponential_decay_length_penalty': None,
 'suppress_tokens': None,
 'begin_suppress_tokens': None,
 'architectures': ['BertForMaskedLM'],
 'finetuning_task': None,
 'id2label': {0: 'LABEL_0', 1: 'LABEL_1'},
 'label2id': {'LABEL_0': 0, 'LABEL_1': 1},
 'tokenizer_class': None,
 'prefix': None,
 'bos_token_id': None,
 'pad_token_id': 0,
 'eos_token_id': None,
 'sep_token_id': None,
 'decoder_start_token_id': None,
 'task_specific_params': None,
 'problem_type': None,
 '_name_or_path': 'bert-base-uncased',
 'transformers_version': '4.25.1',
 'gradient_checkpointing': False,
 'model_type': 'bert',
 'vocab_size': 30522,
 'hidden_size': 768,
 'num_hidden_layers': 12,
 'num_attention_heads': 12,
 'hidden_act': 'gelu',
 'intermediate_size': 3072,
 'hidden_dropout_prob': 0.1,
 'attention_probs_dropout_prob': 0.1,
 'max_position_embeddings': 512,
 'type_vocab_size': 2,
 'initializer_range': 0.02,
 'layer_norm_eps': 1e-12,
 'position_embedding_type': 'absolute',
 'use_cache': True,
 'classifier_dropout': None}

from transformers import BertConfig

bertconfig = BertConfig.from_pretrained('bert-base-uncased')

bert_in_gpt2_config = BertConfig.from_pretrained('gpt2')

#You are using a model of type gpt2 to instantiate a model of type bert. This is not supported for all configurations of models and can yield errors.

Model: https://github.com/huggingface/transformers/tree/master/src/transformers/models

Transformers에서는 transformer기반의 모델 architecture를 구현해두었습니다.
최근에는 https://arxiv.org/abs/2010.11929와 같이 Vision task에서 활용하는 transformer 모델들을 추가하며 그 확장성을 더해가고 있습니다.
모델 architecture 뿐만 아니라 관련 task에 적용가능한 형태의 구현체들이 있습니다.
BERT 구현체에서 제공하고 있는 class를 확인하고 해당 구조를 이용해 학습한 모델들을 load해보겠습니다

from transformers import BertForMaskedLM, BertForQuestionAnswering, BertForSequenceClassification, BertForTokenClassification, BertForMultipleChoice, BertModel
from transformers import AutoModel, AutoTokenizer, AutoConfig

bertmodel = AutoModel.from_pretrained('bert-base-uncased')

tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased')
input = tokenizer('hi, my name is joy')

input

'input_ids': [101, 7632, 1010, 2026, 2171, 2003, 6569, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1]}

bert_qa = BertForQuestionAnswering.from_pretrained('bert-base-uncased')

저작자표시 비영리 변경금지

'자연어 처리 > Today I learned :' 카테고리의 다른 글

언어모델 GPT (1)	2023.01.17
버트를 활용한 영화리뷰 분류 (0)	2023.01.16
트랜스포머와 어탠션 정리 --2 (0)	2023.01.16
트랜스포머와 어탠션 정리 --1 (1)	2023.01.15
transfomers 를 사용한 간단한 분류 예제(BertForSequenceClassification) (0)	2023.01.12

현재글허깅페이스의 트랜스포머 🤗 Huggingface's Transformers

TIL

오블완, 오픽, 오픽AL, 특수문자이모티콘, 배당투자계산기, 오픽 모의테스트, 오픽기출, 티스토리챌린지, 1인개발, 1인개발자, 오픽모의고사, 딥러닝, 오픽IH, 오픽공부법, 안드로이드개발, 오픽 AL, 배당투자, 오픽1주, 안드로이드앱개발, 데이터시각화,

Today :
Yesterday :

TIL